The Mind Within The Brain Español
The Mind Within The Brain Español
La mente dentro
del cerebro
Cómo tomamos decisiones y cómo esas
Las decisiones salen mal
. DAVID IDREDISHA
1
Machine Translated by Google
3
Oxford University Press es un departamento de la Universidad de Oxford.
Promueve el objetivo de la Universidad de alcanzar la excelencia en investigación, erudición y
educación mediante publicaciones en todo el mundo.
Con oficinas en
Argentina Austria Brasil Chile República Checa Francia Grecia
Guatemala Hungría Italia Japón Polonia Portugal Singapur
Corea del Sur Suiza Tailandia Turquía Ucrania Vietnam
135798642
Impreso en los Estados Unidos de América
en papel libre de ácido.
Machine Translated by Google
CONTENIDO
Prefacio ix
Agradecimientos xiii
3. La definición de valor 15
5. Riesgo y recompensa 35
7. Reflejos 61
9. Deliberación 75
viii
Machine Translated by Google
viii Contenido
LA CONDICIÓN ZUMBIANCA
Epílogo 237
Apéndices 239
Procesamiento de la información en las neuronas 241
B Obtención de información del cerebro 247
C Memoria direccionable por contenido 259
Bibliografía 269
Notas bibliográficas 271
Citas 309
Índice 365
Machine Translated by Google
PREFACIO
Nuestras decisiones nos hacen ser quienes somos. Aunque nos gustaría pensar que nuestras decisiones se
toman de manera racional y deliberada, muchas de ellas no lo son. Todos sabemos que algunas de nuestras
decisiones se toman de manera emocional y otras de manera reactiva. Algunas tienen consecuencias
previstas y otras tienen consecuencias que nunca imaginamos posibles.
Somos seres físicos. El cerebro humano es una red compleja de neuronas y otras células que recibe
información del mundo a través de sus sistemas sensoriales y actúa sobre el mundo a través de sus sistemas
motores. Pero, ¿cómo esa red de células, en constante cambio dinámico, se convierte en la persona que
eres? ¿Cómo encaja la mente en ese pequeño lugar en la jaula de huesos que es nuestro cráneo? ¿Cómo
procesa la información? ¿Cómo percibe el mundo, determina la mejor opción, selecciona una acción y la
lleva a cabo? ¿Cómo se enamora? ¿Se ríe de la emoción abrumadora de sostener a un bebé? ¿Cómo crea
gran arte o gran música? ¿Cómo siente la emoción triunfante de la Oda a la alegría de Beethoven o el
patetismo devastador de Knock Knock Knocking on Heaven's Door de Bob Dylan ? ¿Cómo canta blues la
dama? ¿Cómo se vuelve adicta y cómo rompe esa adicción? ¿Cómo tiene personalidad? ¿Qué hace que tú
seas tú y que yo sea yo?
En el fondo, todas estas preguntas tienen que ver con la manera en que el ser que reconoces como tú
mismo encaja en este cerebro físico que está enclavado en tu cráneo. En el fondo, estas preguntas tienen
que ver con la manera en que ese cerebro toma decisiones. Este libro es un intento de responder a esa pregunta.
ix
Machine Translated by Google
incógnita
Prefacio
Toma de decisiones. Había estado dando charlas en el programa BrainU de Jan Dubinsky para profesores
de secundaria interesados en la neurociencia y recientemente había dado una charla a profesionales
médicos de primera línea (médicos, enfermeras y trabajadores sociales en adicciones) sobre el trabajo
de mi laboratorio para identificar vulnerabilidades en los sistemas de toma de decisiones. John había oído
hablar de esta charla y quería que yo presentara este trabajo a sus clientes.
Yo protesté, diciendo que no era un profesional médico y que no podía decirles cómo arreglar lo que
estaba roto. Él dijo que tenían mucha gente que se lo decía, lo que querían era que alguien les dijera por
qué : ¿ por qué tomamos las decisiones que tomamos? Él dijo que querían saber por qué esas decisiones
se toman mal, especialmente cuando sabían cuáles eran las opciones correctas.
Prefacio x
La primera sección consta de cinco capítulos, dos capítulos para preparar el terreno (1: ¿Qué es
una decisión? y 2: La historia del termostato ) y tres capítulos para presentar la neuroeconomía básica
,
de la toma de decisiones (3: La definición de valor, 4: Valor, euforia y 5: Riesgo y recompensa ). En la
resultados de que el segunda sección, comenzaremos con la señal DoItAgain , con los
sistema de toma de decisiones se compone de múltiples módulos o subsistemas (Capítulo 6), y luego
dedicaremos un capítulo a cada uno de los sistemas que lo componen (Capítulos 7 a 15).
A
Prefiero las notas a pie de página a las notas finales porque permiten echar un vistazo al texto sin perder el
rumbo del libro. Generalmente incluiré tres tipos de información en las notas a pie de página: (1) comentarios entre
paréntesis que son demasiado largos para incluirse entre paréntesis (como la etimología y la ubicación de las
estructuras cerebrales); (2) chistes y anécdotas atrevidas que no puedo resistirme a incluir pero que interrumpirían
el flujo del libro si los incluyera en el texto principal; y (3) detalles técnicos cuando hay efectos sutiles de segundo
orden que deben notarse pero que son demasiado complicados para quienes no tienen los antecedentes
necesarios. El libro debería ser legible sin las notas a pie de página, pero espero que las notas a pie de página
agreguen una dimensión adicional para quienes desean más profundidad.
Machine Translated by Google
EXPRESIONES DE GRATITUD
Cualquier proyecto de esta magnitud depende de muchas personas. Los resultados presentados en este
libro incluyen el trabajo de una gran cantidad de científicos que han trabajado en diversos campos durante
los últimos cien años. A lo largo de todo el libro, he hecho todo lo posible por reconocer y citar los artículos
en los que aparecieron por primera vez estas ideas. Estoy seguro de que he pasado por alto algunas y pido
disculpas a mis colegas por cualquier omisión.
Este trabajo nunca hubiera sido posible sin los increíbles y maravillosos estudiantes y
posdoctorados que han pasado por mi laboratorio, en particular Adam Johnson, Steve Jensen,
Matt Hijs van der Meer y Zeb KurthNelson, con quienes he trabajado directamente en estas ideas,
así como Neil SchmitzerTorbert, Jadin Jackson, John Ferguson, Anoopum Gupta, Beth Masimore,
Andy Papale, Nate Powell, Paul Regier, Adam Steiner, Jeff Stott, Brandy Schmidt y Andrew
Wikenheiser. También estoy en deuda con Kelsey Seeland y Chris Boldt, sin quienes mi laboratorio
no funcionaría como lo hace y no habría tenido la libertad de escribir este libro.
Muchas de las ideas que aquí se presentan han sido elaboradas en conversaciones con colegas,
por lo que debo agradecerles por las estimulantes discusiones que hemos tenido en conferencias y
talleres a lo largo de los años, entre ellos Peter Dayan, Read Montague, Larry Amsel, Nathaniel Daw,
Yael Niv, Warren Bickel, Jon Grant, Bernard Balleine, Dave Stephens, John O'Doherty, Antonio Rangel,
Cliff Kentros, Andre Fenton y muchos otros, demasiado numerosos para mencionarlos. Quiero
aprovechar este momento para agradecer a mis amigos y colegas que leyeron borradores de parte o
de todo este libro, en particular a Jan Dubinsky, Matthijs van der Meer y John Gessner, así como a mi
editora Joan Bossert.
Gran parte del trabajo presentado en este libro ha sido financiado por los Institutos Nacionales de
Salud, en particular por subvenciones para el estudio de la toma de decisiones del NIMH y el NIDA. Mi
primera incursión en la toma de decisiones fue financiada por una beca de la Fundación Sloan y por
una beca McKnight LandGrant de la Universidad de Minnesota. Los estudiantes fueron financiados por
becas de formación de la Fundación Nacional de Ciencias y los Institutos Nacionales de Salud. Este
trabajo habría sido imposible sin su generoso apoyo.
Finalmente, este libro está dedicado a mi esposa Laura, mi primera lectora, que leyó cada capítulo,
antes del primer borrador. , Después de eso, y luego otra vez, cuando el libro estuvo terminado,
¿quién ha soportado el tiempo y el estrés que este libro me impuso, quién inspira mi poesía y quién no
me permite salirme con la mía con nada menos que lo mejor que puedo hacer? Este libro, todo el
trabajo que he hecho, es para ella.
xiii
Machine Translated by Google
PRIMERA PARTE
Como nos gusta pensar en nosotros mismos como criaturas racionales, nos gusta definir la decisión como la
deliberación consciente sobre múltiples opciones. Pero esto presupone un mecanismo que puede ser correcto o
no. Si somos criaturas tan racionales, ¿por qué tomamos decisiones tan irracionales? Ya se trate de comer esa
última papa frita que es solo una más de las que queríamos o decir algo que no deberíamos haber dicho en la
reunión de la facultad o las cosas que hicimos esa vez que estábamos borrachos en la universidad, todos hemos
dicho y hecho cosas de las que nos arrepentimos. Muchas novelas se basan en un personaje que tiene que
superar un miedo irracional. Muchos alcohólicos han jurado no beber, solo para ser encontrados unos días
después, en el bar, con una bebida en la mano.
Más adelante en este libro veremos que las decisiones que tomamos surgen de la interacción de múltiples
sistemas de toma de decisiones. Amamos porque tenemos reacciones emocionales que nacen de necesidades
sociales intrínsecas e impulsos evolutivos (el sistema pavloviano , capítulo 8).
Decidimos qué trabajo aceptar considerando los pros y los contras de las posibilidades imaginadas ( pensamiento
futuro episódico y el sistema deliberativo , capítulo 9). Podemos andar en bicicleta porque hemos entrenado
nuestro sistema de aprendizaje procedimental (capítulo 10), pero también puede resultar difícil romper malos
hábitos que hemos aprendido demasiado bien (capítulo 15). Veremos que estos son solo algunos de los sistemas
separables que podemos identificar. Todos estos diferentes sistemas de toma de decisiones conforman la
persona que eres.
La idea de que nuestras acciones surgen de componentes múltiples e identificables de forma separable tiene
una larga historia en psicología, que se remonta a Freud o antes, y ha ganado fuerza recientemente con las
teorías de la computación distribuida, la psicología evolutiva y la economía del comportamiento.
1
Obviamente, al final, hay un solo ser que realiza una acción, pero
3
Machine Translated by Google
A veces resulta útil entender el ser en términos de sus subsistemas. La analogía que me gusta, y que
utilizaré varias veces en este libro, es la de un automóvil. El automóvil tiene un tren de transmisión, un
sistema de dirección y frenos. Los automóviles suelen tener varios sistemas para lograr el mismo objetivo
(el freno de pedal y el freno de emergencia/estacionamiento, o los motores eléctrico y de gasolina en un
híbrido como el Toyota Prius).
Al psicólogo Jonathan Haidt le gusta hablar de un jinete y un elefante como metáfora de las mentes
consciente e inconsciente que toman decisiones, 2 pero encuentro esta analogía inadecuada porque
separa el “yo” de los “otros” sistemas de toma de decisiones. Como reconoce Haidt al final de su libro,
usted es a la vez el jinete y el elefante.
El elefante. Cuando una estrella del fútbol habla de estar “en la zona”, no está hablando de estar fuera de
su cuerpo y dejar que otro ser tome el control; siente que está tomando las decisiones correctas. (De
hecho, está notando que su sistema de procedimientos/hábitos está funcionando perfectamente y está
tomando las decisiones correctas de manera rápida y fácil). Cuando estás caminando por un bosque
oscuro y comienzas a tener miedo y te sobresaltas al menor sonido, eso no es un animal que reacciona;
eres tú. (Es un ejemplo clásico del sistema de selección de acciones pavloviano). A veces estos sistemas
funcionan juntos. A veces funcionan con propósitos cruzados. En cualquier caso, todos siguen siendo tú .
“¿Me contradigo?”, pregunta Walt Whitman en su largo poema Song of Myself .
“Entonces me contradigo. Soy grande.
Contengo multitudes.”
¿Cómo podemos determinar cómo funcionan estos sistemas múltiples? ¿Cómo podemos determinar
cuándo funcionan juntos y cuándo tienen propósitos contrapuestos? ¿Cómo podemos identificar los
mecanismos de las multitudes de Whitman?
Para estudiar algo científicamente, necesitamos definir nuestra pregunta de manera que podamos
medirla y cuantificarla. Por lo tanto, necesitamos una medida de la toma de decisiones que podamos
observar, de modo que podamos comparar las predicciones que surgen de nuestras hipótesis con los
datos reales. Esta es la clave del proceso científico: debe haber una comparación con la realidad. Si la
hipótesis no se ajusta a esa realidad, debemos rechazarla, por mucho que nos guste.
Una opción es simplemente preguntar a la gente qué es lo que quiere. Pero, por supuesto, la idea de
que siempre hacemos lo que decimos que queremos implica suposiciones muy fuertes sobre cómo
tomamos decisiones, y cualquiera que se haya arrepentido de una decisión sabe que no siempre decidimos
hacer lo que queremos. Algunos lectores pueden estar en desacuerdo con esta afirmación, diciendo que
usted quería esa decisión cuando tomó la acción. El hecho de que se arrepienta de esa noche de
borrachera cuando tiene resaca por la mañana no significa que no quisiera todas esas bebidas la noche
anterior. Otros lectores pueden argumentar que una parte de usted quería esa decisión, incluso si otra
parte no. Llegaremos a una conclusión muy similar a esta, que hay múltiples módulos de toma de
decisiones, y que los miembros de las multitudes de Whitman no siempre están de acuerdo entre sí. Gran
parte de este libro tratará sobre cómo determinar quiénes son esas multitudes y qué sucede cuando no
están de acuerdo entre sí.
Como primer paso en esta identificación de las multitudes, estudios científicos cuidadosos han revelado
que muchas de las “decisiones” conscientes que creemos tomar son en realidad racionalizaciones
posteriores. 3 Por ejemplo, el momento en el que creemos que hemos decidido iniciar una
acción suele ser después de que la acción ya ha comenzado.
En lo que ahora se consideran estudios clásicos de la conciencia, Benjamin Libet pidió a las personas
que realizaran una acción (como golpear con un dedo cuando quisieran) mientras
Machine Translated by Google
Observaron un punto que se movía alrededor de un círculo. Se pidió a las personas que informaran de la posición
del punto cuando decidieran actuar. Mientras tanto, Libet y sus colegas registraron señales eléctricas del cerebro y
los músculos. Libet descubrió que estas señales precedían a la decisión consciente de actuar en varios cientos de
milisegundos. Tanto el cerebro como los músculos funcionan manipulando la electricidad, que podemos medir con
las tecnologías adecuadas. Con las matemáticas adecuadas, podemos descodificar esas señales y determinar lo
que está sucediendo dentro del cerebro. Libet descifró cuándo se podía determinar la acción a partir de señales en
las áreas motoras del cerebro y lo comparó con el momento en que la conciencia pensó que la acción había
ocurrido. Libet descubrió que la decisión consciente de realizar una acción se retrasaba, casi como si la conciencia
estuviera percibiendo la acción, en lugar de instigarla. Varios investigadores han sugerido que gran parte de la
conciencia es un proceso de control, que le permite realizar un seguimiento de las cosas e intervenir si hay problemas.
Gran parte de la maquinaria del cerebro se encarga de este tipo de rellenado, de hacer conjeturas acertadas
sobre el mundo. Nuestros ojos sólo pueden centrarse en una pequeña zona de nuestro campo visual a la vez.
Nuestros mejores sensores visuales son un área de nuestra retina que tiene una concentración de células adaptadas
al color y la especificidad en una ubicación llamada fóvea . Esta concentración de detectores en la fóvea
significa que podemos ver mucho mejor algo si enfocamos nuestros ojos en ello.
Nuestra visión se centra en una nueva zona del mundo visual cada tercio de segundo aproximadamente. Los viajes
entre los enfoques visuales se denominan movimientos sacádicos . Incluso cuando creemos que estamos centrando
nuestra atención en una pequeña ubicación, nuestros ojos están realizando cambios muy pequeños llamados
A
Si el mundo visual está alineado con nuestras microsacadas de modo que cambia cuando lo hacemos,
micromovimientos sacádicos . Las células se adaptan a la imagen constante y la imagen visual se “atenúa” y desaparece.
Esto significa que la mayor parte de nuestra comprensión del mundo visual se basa en la combinación e interpretación
de recuerdos visuales de corto plazo. Estamos infiriendo la forma del mundo, no observándolo.
En un caso sencillo y familiar para muchas personas, existe un pequeño lugar en nuestra retina por donde
deben pasar los axones de las células de salida para formar el nervio óptico que envía las señales visuales al resto
de nuestro cerebro. Esto nos deja con un “punto ciego” que debe ser llenado por la retina y el sistema de
B
procesamiento visual. Nuestro cerebro normalmente rellena el “punto
7
ciego” de los recuerdos y expectativas de los patrones que nos rodean.
De manera similar, no siempre nos damos cuenta de lo que realmente impulsa nuestro proceso de toma de
decisiones. Lo racionalizamos, completando nuestras razones desde perspectivas lógicas. Algunos de mis ejemplos
favoritos de esto provienen del trabajo de V. S. Ramachandran, 8 quien ha estudiado a pacientes con daño en partes
del cerebro que representan el cuerpo. Un paciente que está
A
El mundo visual se puede alinear con nuestras microsacadas siguiendo el movimiento de los ojos y
Cambiar la pantalla de un video muy rápidamente. Esto es posible con la tecnología informática moderna.
B Los cables (axones) de nuestro nervio óptico tienen que pasar a través de la retina porque esta está construida al revés, con las
células procesadoras arriba y las células detectoras de luz abajo. Las células procesadoras son generalmente transparentes, por lo que la
luz pasa a través de ellas y las células detectoras de luz pueden seguir viendo, pero en algún momento los axones tienen que abandonar
las células procesadoras para viajar al cerebro. No hay células detectoras de luz en el punto por donde pasan los axones, lo que deja un
punto ciego. Esto es una reliquia del pasado evolutivo de la especie humana. Los ojos no tienen por qué estar construidos de esta manera:
el ojo del pulpo, con una historia evolutiva diferente, está orientado correctamente, con las células detectoras de luz arriba y las células
procesadoras abajo. Por lo tanto, los pulpos no tienen un punto ciego que deba rellenarse.
6
Machine Translated by Google
Una paciente que no puede levantar el brazo físicamente niega que tenga un problema y simplemente afirma que
no quiere hacerlo. Cuando se le hizo levantar el brazo estimulando directamente sus músculos, afirmó que había
cambiado de opinión y que había levantado el brazo porque quería, aunque no tenía control directo del brazo. En
una maravillosa historia (contada por Oliver Sacks en A Leg to Stand On ), un paciente afirma que su mano
derecha no es suya. Cuando se le confronta con el hecho de que hay cuatro manos sobre la mesa (dos suyas y
las dos del médico), el paciente dice que tres de las manos pertenecen al médico. “¿Cómo puedo tener tres
manos?”, pregunta el médico. “¿Por qué no? Tienes tres brazos”, responde el paciente.
En su libro ¿Está de broma, señor Feynman ?, el famoso físico Richard Feynman describió cómo fue que lo
hipnotizaron. Escribió que estaba seguro de que podía realizar la acción (en este caso, abrir los ojos) aunque lo
habían hipnotizado para que no lo hiciera, pero decidió no hacerlo para ver qué pasaba. Así que no lo hizo, que
era lo que le habían pedido que hiciera bajo hipnosis. Observe que ha racionalizado su decisión. Como reconoció
el propio Feynman, incluso si dijo "podría haber abierto los ojos", no lo hizo.
¿Entonces, qué fue lo que le hizo tomar esa decisión? ¿Fue algún efecto de la hipnosis en su cerebro o fue que
no quería hacerlo? ¿Cómo lo pudimos saber? ¿Podemos saberlo?
Muchos de los experimentos de los que vamos a hablar en este libro se han realizado con animales que
toman decisiones. Si vamos a decir que los animales toman decisiones, necesitamos tener una forma de
operacionalizar esa decisión: es difícil preguntarles a los animales qué piensan. Hay métodos que nos permiten
decodificar la información representada en partes específicas del cerebro, lo que podría interpretarse como un
medio para preguntarle a un animal qué piensa (véase el Apéndice B). Sin embargo, a diferencia de preguntar
a los humanos lingüísticamente, donde uno le pregunta al ser en general qué piensa, decodificar es preguntarle
a una estructura cerebral específica qué está representando. Por supuesto, se podría argumentar que asumir que
lo que la gente dice es lo que piensa supone que los humanos somos seres unificados. Como veremos a medida
que profundicemos en cómo se toman las decisiones, los humanos (al igual que otros mamíferos) somos mezclas
de muchos sistemas de toma de decisiones, no todos los cuales siempre están de acuerdo.
Así como los experimentos de Libet sugieren que partes del cerebro pueden actuar sin conciencia, hay
representaciones en el cerebro que no pueden afectar el comportamiento.
En un notable experimento, Pearl Chiu, Terry Lohrenz y Read Montague encontraron señales en los cerebros de
fumadores y no fumadores que representaban no sólo el éxito de las decisiones tomadas, sino también lo que
podrían haber hecho si hubieran elegido mejor. 9 Este reconocimiento de lo que podrían haber hecho se llama
una hipótesis contrafactual .
(una imaginación de lo que podría haber sido) y permite un mejor aprendizaje. (Ahora se sabe que tanto las ratas
como los monos también pueden representar información de recompensa contrafáctica. Estas señales parecen
utilizar las mismas estructuras cerebrales que Chiu, Lohrenz y Montague estaban estudiando, y ser las mismas
estructuras involucradas cuando los humanos 10 ) Los contrafácticos mejoran el aprendizaje al permitir que uno
(en el ejemplo aprenda de posibilidades imaginadas. Por ejemplo, al ver a otra persona cometer un error. O
utilizado por Chiu, Lohrenz y Montague) "si hubiera sacado mi dinero del mercado de valores la semana pasada,
no habría perdido todo ese dinero cuando se desplomó".
Si bien las señales en los cerebros de ambos grupos reflejaban esta información contrafáctica, sólo la conducta
de los no fumadores tenía en cuenta esa información. Si queremos entender cómo se toman las decisiones y
determinar no sólo las acciones realizadas por el sujeto sino también el procesamiento de información que
ocurre en su cerebro.
Ciertamente, la mayoría de los animales no humanos no tienen lenguaje, aunque puede haber algunos.
do
excepciones. Sin embargo, sería difícil preguntarles a las ratas, las palomas o los monos (todos los cuales
veremos tomar decisiones más adelante en el libro) qué quieren lingüísticamente. Dado que también es difícil
preguntarles a los humanos qué quieren realmente, evitaremos este problema del lenguaje por completo y
operacionalizaremos la toma de decisiones como una acción: la acción es una , porque tomar una
respuesta observable.
13
Esto es muy similar a lo que en economía del comportamiento se conoce como preferencias reveladas .
La teoría económica (y el nuevo campo concomitante de la neuroeconomía) generalmente supone que esas
preferencias reveladas mantienen un orden racional tal que si usted prefiere una cosa (por ejemplo, helado
de chocolate) a otra (por ejemplo, helado de vainilla), entonces siempre preferirá el helado de chocolate al de
vainilla si alguna vez se encuentra en la misma situación.
No haremos tal suposición.
De la misma manera, no queremos asumir que una persona que nos dice lo que quiere realmente refleja
las elecciones que una persona hará cuando se enfrente a la decisión real. 14
Teniendo en cuenta los datos que indican que nuestras observaciones conscientes del mundo son inferibles y
15
los datos que indican que nuestras explicaciones habladas son racionalizaciones, algunos investigadores han
sugerido que es mejor considerar nuestras explicaciones lingüísticas de nuestros deseos como el discurso de
un “secretario de prensa” que como las acciones de un ejecutivo.
16 Por lo tanto, en lugar de preguntar qué
quiere alguien, deberíamos medir las decisiones dándole a la gente opciones explícitas y pidiéndole que elija.
En los capítulos siguientes nos encontraremos con algunas de las rarezas descubiertas por estos experimentos.
A menudo, los investigadores ofrecen a las personas opciones hipotéticas. Resulta especialmente difícil
obtener financiación para ofrecer a las personas una elección real entre 10.000 y 100.000 dólares, o para
darles la posibilidad de elegir si quieren o no matar a una persona para salvar a cinco. En lugar de ello, se
pide a los sujetos que imaginen una situación y pretendan que es real. En la práctica, en los pocos casos en
que se los ha comparado directamente, las opciones de toma de decisiones hipotéticas y reales tienden a
17
coincidir estrechamente. Pero hay algunos ejemplos en los que las decisiones hipotéticas y
las reales divergen. Estos tienden a ser con recompensas o castigos que son sensoriales, inmediatos
y lo que más adelante reconoceremos como pavlovianos (Capítulo 8).
Un ejemplo clásico de esto lo llamo la parábola de las gominolas . Sarah Boysen y Gary Berntson
intentaron entrenar a los chimpancés para que eligieran la porción humilde. 19 Ofrecieron al sujeto
dos bandejas de gominolas. Si tomaba la bandeja más grande, recibía la más pequeña y la más grande se la
daba a otro chimpancé; sin embargo, si el chimpancé que decidía tomaba la bandeja más pequeña, recibía
la bandeja más grande y la más pequeña se la daba a otro chimpancé. Cuando se les presentaban símbolos
(números arábigos que previamente habían sido entrenados para asociar con números de gominolas), los
sujetos podían
C El grado en que los animales pueden adquirir lenguajes de nivel humano no está exento de controversias.
Como tampoco vamos a confiar en el lenguaje humano, 11 esta cuestión es irrelevante para nuestra cuestión de la
toma de decisiones. Para aquellos interesados en la cuestión del aprendizaje del lenguaje por parte de los animales,
recomiendo uno de los excelentes libros escritos por los diversos investigadores que han intentado enseñar lenguaje
a animales no humanos, como Daniel Fouts enseñando a Washoe el chimpancé, Penny Patterson enseñando a Koko
12
el gorila, Sue SavageRumbaugh enseñando a Kanzi el bonobo, o Irene Pepperberg enseñando a Alex el loro.
Machine Translated by Google
Los animales que tenían la capacidad de elegir el grupo más pequeño, pero cuando las opciones eran caramelos
de goma físicos, no pudieron evitar coger el grupo más grande. Otros experimentos han descubierto que los
animales con mayor capacidad lingüística son más capaces de llevar a cabo estas conductas de autocontrol. 20
Esto puede ser similar a nuestra capacidad de convencernos a nosotros mismos de no hacer cosas que sentimos
que realmente queremos: "Sé que tengo ganas de fumar ese cigarrillo, pero no lo quiero. Realmente no lo quiero".
21 Poner un
Un experimento similar se conoce coloquialmente como el experimento del malvavisco : se coloca
un solo malvavisco frente a un niño sentado a la mesa de la cocina. Se le dice al niño que si el malvavisco sigue
ahí dentro cinco minutos después, se le agregará un segundo malvavisco. Luego, se abandona la habitación. Es
muy, muy difícil que los niños no alcancen el malvavisco. Es mucho más fácil para los niños esperar dos centavos
o dos fichas que dos malvaviscos. Analizaremos el experimento del malvavisco en detalle en el capítulo sobre
autocontrol (capítulo 15).
Los estudios sobre la toma de decisiones en psicología (como el experimento del malvavisco), así como los
estudios sobre economía conductual y el nuevo campo de la neuroeconomía, tienden a medir las opciones dentro
de la limitación de opciones discretas. En el mundo real, rara vez nos enfrentamos a un conjunto discreto de
opciones. Ya se trate de decidir cuándo batear para golpear una pelota de béisbol o decidir a dónde correr en un
patio de recreo, siempre estamos interactuando continuamente con el mundo. Las acciones que realizamos no
22
siempre son deliberativas y no Como veremos más adelante, algunos de los mecanismos que seleccionan la
La toma de decisiones que realizamos surge de los procesos físicos que ocurren en nuestro cerebro.
,
Como nuestro cerebro es algo físico, tiene vulnerabilidades que podríamos llamar “modos de fallo” en
el mundo de la ingeniería. Vemos estas vulnerabilidades en nuestra susceptibilidad a las malas
elecciones ( ¿De verdad necesitas un nuevo coche deportivo? ), en nuestra susceptibilidad a las
adicciones ( ¿Por qué no puedes dejar de fumar esos cigarrillos? ), en nuestra incapacidad para
controlar nuestras emociones o nuestros hábitos ( ¿Por qué te enojas tanto por cosas que no puedes
cambiar? ). Nos gustaría creer que somos criaturas racionales, capaces de aplicar la lógica, que
siempre elegimos lo que es mejor para nosotros. Pero cualquiera que haya observado sus propias
decisiones (o las de sus amigos) reconocerá que esto simplemente no es correcto. Somos máquinas
de toma de decisiones muy complejas, y a veces esos procesos de toma de decisiones nos dejan
perplejos. Entender cómo toma decisiones el cerebro nos ayudará a entendernos a nosotros mismos.
Para entender esas vulnerabilidades, necesitamos comprender el mecanismo de toma de decisiones en nuestro ce
Hoy en día, todos estamos familiarizados con máquinas complejas, incluso máquinas complejas
que toman decisiones. La máquina más simple que toma una decisión es el termostato: cuando hace
demasiado calor en la casa, el termostato enciende el aire acondicionado para enfriarla, y cuando hace
demasiado frío, el termostato enciende la calefacción para calentarla. Este proceso se llama
retroalimentación negativa : las acciones del termostato están inversamente relacionadas con la temperatura.
9
Machine Translated by Google
Uno de los puntos clave de este libro es que conocer cómo funciona el cerebro nos permite
una mejor percepción de lo que ocurre cuando algo va mal. Vivo en Minnesota. En pleno invierno,
puede hacer mucho frío fuera. Imagínate que te despiertas una mañana y descubres que tu
dormitorio está frío. Algo va mal. Pero decir simplemente que el termostato está roto no te
ayudará a solucionar el problema. Necesitamos identificar el problema, diagnosticarlo .
eso, por así decirlo.
Tal vez algo no funciona bien con la percepción del termostato. Tal vez el sensor esté roto y
esté percibiendo la temperatura incorrecta. En este caso, el termostato podría pensar que la casa
está bien aunque haga demasiado frío. (Observe la importancia de la creencia aquí: la diferencia
entre la representación interna del termostato y la temperatura real puede tener un gran impacto
en lo bien que el termostato toma su decisión). Tal vez el punto de ajuste esté configurado en la
temperatura incorrecta. Esto significa que el termostato está funcionando correctamente: ha
movido correctamente la temperatura de su casa al punto de ajuste, pero eso no es lo que usted
quería. O tal vez hay algo incorrecto con las acciones disponibles para el termostato.
Si la calefacción está rota, el termostato puede estar enviando la señal de “calienta la casa”, pero
la casa no se calentaría correctamente. Cada uno de estos problemas requiere una solución
diferente. Así como hay muchas razones potenciales por las que tu dormitorio está demasiado
frío y saber cómo funciona un termostato es fundamental para entender cómo solucionarlo,
cuando los fumadores dicen que realmente quieren dejar de fumar, pero no pueden, necesitamos
saber dónde ha fallado el proceso de toma de decisiones de cada individuo o no podremos
ayudar. Antes de poder identificar dónde ha fallado el proceso de toma de decisiones, vamos a
tener que entender cómo las diferentes partes del cerebro trabajan juntas para tomar decisiones.
Muchos lectores objetarán en este punto que las personas son mucho más complicadas que
los termostatos. (Y lo somos.) Muchos lectores entonces concluirán que las personas no son
Machine Translated by Google
El concepto de máquinas conscientes que toman decisiones impregna la ciencia ficción moderna:
ción, incluidos los droides C3P0 y R2D2 en Star Wars, los datos de Android de Star Trek:
La próxima generación, Los desesperados Replicantes de Blade Runner de Ridley , y el
Scott, los emocionalmente perturbados Cylons de Battlestar Galactica . Star Trek: La Nueva
Generación dedicó un episodio entero ( La medida de un hombre ) a la cuestión de cómo el
hecho de que Data fuera una máquina afectaba su capacidad de decidir por sí mismo si
permitir o no que lo desmantelaran. En el episodio, el juez concluye el juicio con un discurso
que aborda directamente esta cuestión: "¿Data es una máquina? Sí. ¿Es propiedad de la Flota Estelar? N
Todos hemos estado dando vueltas alrededor de la cuestión básica: ¿Data tiene alma? No sé si la
tiene. No sé si la tengo yo. Pero tengo que darle la libertad de explorar esa cuestión por sí mismo.
Es la decisión de este tribunal que el teniente comandante Data tiene la libertad de elegir.
2
Analizaremos en detalle las complejas cuestiones del yo y de la
conciencia al final del libro ( El enigma de la robótica , capítulo 24), después de haber
analizado los mecanismos de la toma de decisiones. Mientras tanto, mi objetivo es
convencerlos de que podemos comprender los mecanismos de nuestro proceso de toma
de decisiones sin perder la libertad de elegir.
No quiero que tomen el proceso real del termostato como la clave de la historia aquí, más de lo que
tomaríamos los aviones a reacción como buenos modelos de cómo vuelan los cisnes. Y, sin embargo,
tanto los aviones como los cisnes vuelan a través de fuerzas físicas generadas por el flujo de aire sobre
sus alas especialmente diseñadas. Aunque las alas de las aves están hechas de hueso, músculo y plumas,
mientras que las alas de los aviones son de metal, tanto para las aves como para los aviones, la
sustentación se genera por el flujo de aire sobre las alas, y el flujo de aire se genera por la velocidad a
través del aire. Si podemos entender lo que permite que un avión de 30 toneladas vuele, tendremos una
mejor comprensión de cómo puede volar un cisne de 30 libras. Aunque el impulso hacia adelante a través
del aire se genera de manera diferente, tanto las aves como los aviones vuelan a través de interacciones
físicas con el aire. Utilizaremos métodos análogos para comprender los procesos de toma de decisiones
para identificar y solucionar problemas en los termostatos y en nosotros mismos, porque ambos utilizan
procesos de toma de decisiones computacionales identificables.
Una buena manera de identificar dónde se ha estropeado un sistema (como un termostato)
es un proceso llamado “diagnóstico diferencial”, como en ¿Cuáles son las preguntas que
diferenciarán los posibles diagnósticos? Mi ejemplo favorito de esto es el programa CarTalk de la
Radio Pública Nacional, en el que un par de mecánicos de automóviles formados en el MIT (Tom
y Ray Magliozzi) diagnostican problemas de coches. Cuando alguien llama con un problema, lo
primero que comentan son los aspectos básicos del problema. (Cualquiera que haya escuchado
CarTalk sabrá que lo primero que comentan Tom y Ray es el nombre de la persona, de dónde es
la persona que llama y algunos chistes completamente ajenos. Pero una vez que se ponen a
hablar de coches, siguen un proceso muy claro de diagnóstico diferencial). Una llamada típica
podría comenzar con la persona que llama proporcionando una descripción del problema: “Oigo
un sonido desagradable cuando estoy conduciendo”. Y luego Tom y Ray se pondrán manos a la obra: harán p
Machine Translated by Google
El sonido: “¿Qué es ese sonido? ¿De dónde viene? ¿Se hace más rápido a medida que vas más rápido?
¿Sigue ocurriendo cuando el motor está encendido pero el coche no se mueve?” Cada pregunta limita el
conjunto de posibles problemas. Al hacer la serie de preguntas correctas, uno puede ir avanzando
progresivamente hasta identificar qué es lo que está mal en el coche. Si pudiéramos organizar estas
preguntas en una serie de reglas, entonces podríamos escribir un programa de computadora para resolver
nuestros problemas con el coche. (Por supuesto, entonces no escucharíamos todos los chistes de CarTalk .
Si esto es bueno o malo es cuestión de gustos.)
En la década de 1980, el campo de la inteligencia artificial desarrolló “sistemas expertos” que codificaron
cómo organizar este tipo de reglas de preguntas y respuestas para realizar cálculos diferenciales. En ese
diagnóstico. 3 momento, los sistemas expertos fueron aclamados como la respuesta a la inteligencia:
Podrían tomar decisiones tan bien como (o mejor que) los expertos. Pero resulta que la mayoría de los
humanos no toman decisiones utilizando diagnósticos diferenciales. En muchos campos (incluida, por
ejemplo, la medicina), gran parte del entrenamiento consiste en intentar enseñar a las personas a tomar
decisiones según estas reglas altamente racionales. 4 Sin embargo, el hecho de que a las personas
les resulte difícil tomar decisiones basándose en diagnósticos diferenciales basados en reglas no significa
que los seres humanos no tengan un mecanismo para tomar decisiones. De hecho, los críticos se quejaron
de que los sistemas expertos desarrollados por la inteligencia artificial no estaban abordando la verdadera
cuestión de qué significa ser “inteligente” mucho antes de que se supiera que los seres humanos no
funcionaban de esa5 manera.
La gente creía que entendíamos cómo funcionan los sistemas expertos y que, por lo
tanto, no podían ser inteligentes. Un compañero de clase en la universidad me dijo una vez que “nunca
desarrollaríamos una inteligencia artificial. En cambio, reconoceríamos que los humanos no somos
inteligentes”. Uno de los objetivos de este libro es argumentar que podemos reconocer los mecanismos de
la toma de decisiones humana sin perder la capacidad de asombro ante la maravilla que es la inteligencia
humana.
Algunos lectores se quejarán de que las personas no son máquinas; tienen objetivos, tienen planes,
tienen personalidades. Como somos criaturas sociales y gran parte de nuestra inteligencia está dedicada a
comprendernos unos a otros, tenemos tendencia a atribuirle capacidad de acción a cualquier objeto que se
6
comporte de manera compleja. Muchos de mis amigos le ponen nombre a
sus coches y hablan de su personalidad. Mi hijo le puso a nuestro nuevo sistema de navegación GPS “Dot”.
Cuando le preguntamos por qué le puso ese nombre al GPS (la voz es definitivamente de una mujer), dijo:
“Para que podamos quejarnos con ella cuando se pierda: ‘¡Maldita seas, Dot!’”.
Un navegador GPS tiene objetivos (que hemos programado, pero que son objetivos al fin y al cabo). La
computadora interna de Dot utiliza su conocimiento de los mapas y su cálculo de la ubicación actual para
hacer planes para alcanzar esos objetivos. Incluso puedes decirle a Dot si prefieres que los planes incluyan
más autopistas o más caminos panorámicos rurales. Si Dot estuviera programada para preferir autopistas o
caminos panorámicos rurales, diríamos que tiene una personalidad clara. De hecho, me gustaría tener algo
de la personalidad de Dot: cuando nos perdemos una salida, Dot no se queja ni maldice, solo dice
"recalculando" y planifica una nueva ruta hacia su objetivo.
La afirmación de que las computadoras pueden tener objetivos y que las diferencias en la forma en que
alcanzan esos objetivos reflejan su personalidad sugiere que los objetivos y los planes son fáciles de
construir y que la personalidad es simplemente una diferencia en las variables de comportamiento y
preferencias subyacentes. Explicamos las máquinas complejas pensando que son como las personas. ¿Es
justo darle la vuelta a eso y explicar a las personas como máquinas complejas?
Machine Translated by Google
En este libro, voy a argumentar que la respuesta a esta pregunta es “sí”: tu cerebro es
,
una máquina de toma de decisiones, aunque muy compleja. Tú eres esa máquina de toma
de decisiones. Esto no significa que no seas consciente. Esto no significa que no seas tú .
Pero puede explicar algunas de las cosas irracionales que haces.
Comprender cómo funciona el sistema de toma de decisiones humano tiene enormes
implicaciones para entender quiénes somos, qué hacemos y por qué hacemos lo que hacemos.
Los científicos estudian el cerebro, estudian la toma de decisiones y estudian las máquinas. Al
reunir estas tres cosas, comenzaremos a tener una idea de nosotros mismos. En este libro,
analizaré lo que sabemos sobre cómo funciona el cerebro, lo que sabemos sobre cómo
tomamos decisiones y lo que sabemos sobre cómo esa máquina de toma de decisiones puede
fallar en ciertas condiciones para explicar la irracionalidad, la impulsividad e incluso la adicción.
Machine Translated by Google
La definición de valor
meses de salario
El valor mide cuánto está uno dispuesto a pagar, intercambiar o trabajar por una
sino que debe calcularse de nuevo cada vez. Esto produce inconsistencias, en las que
preferencias de uno.
¿Qué es el “valor”? ¿Qué significa valorar algo? En las teorías psicológicas, el valor se considera
como aquello que reduce las necesidades o que alivia las perspectivas negativas 1 —cuando se
tiene hambre, la comida tiene valor; cuando se tiene sed, el agua tiene valor. El dolor señala una
situación negativa que debe aliviarse para sobrevivir. En economía, el concepto de preferencias
reveladas dice que valoramos las cosas que elegimos y tomamos decisiones para maximizar el
valor. 2 Aunque se trata de una definición circular, la utilizaremos más adelante para ayudarnos a entender cómo funciona
el proceso de toma de decisiones. En el mundo de la robótica y la simulación por ordenador, donde se han desarrollado
muchos de los mecanismos que veremos más adelante, el valor es simplemente un número r para la recompensa o r para
En muchos experimentos que estudian la toma de decisiones, el valor se mide en términos de dinero.
Pero, por supuesto, el dinero sólo tiene valor verdadero en términos de lo que puede comprar. Los economistas a menudo se
4
Nos dicen que el dinero es una ficción acordada: estoy dispuesto a venderte esta manzana por un trozo de papel verde que
ambos acordamos que vale 1 dólar porque confío en que luego podré usar el papel para comprar algo que quiero. La
afirmación de que el dinero sólo tiene valor en términos de lo que puede comprar tampoco es del todo cierta: el dinero
también puede tener valor como símbolo de lo que implica para nuestro lugar en la red social. 5 Ésta es una de las razones
por las que los deportistas profesionales extremadamente bien pagados luchan por un dólar extra en sus salarios
multimillonarios: quieren ser conocidos como el "receptor abierto mejor pagado", porque esa identificación conlleva un valor
social. El dinero y el valor son conceptos complejos que interactúan de maneras difíciles.
15
Machine Translated by Google
Parte del problema es que no se puede simplemente preguntar a la gente cuánto valora esto. No
tenemos unidades para medirlo. En cambio, el valor se mide generalmente en lo que la gente está
dispuesta a dar por algo y en las decisiones que toma. 6 Este es el concepto llamado preferencias
reveladas : al examinar sus decisiones, podemos decidir qué valora.
En teoría, esto es muy sencillo: uno se pregunta ¿ cuánto pagará por esta taza de café? El precio que
pagará es el valor de la taza de café. Si medimos cosas al mismo tiempo, en el mismo experimento, no
deberíamos tener que preocuparnos por la inflación o los cambios en el valor del dinero en sí.
El problema es que las personas son inconsistentes en sus decisiones. En un famoso experimento,
Daniel Kahneman y sus colegas Jack Knetsch y Richard Thaler dividieron a sus sujetos en dos grupos:
a un grupo se le preguntó cuánto dinero pagarían por una taza de café de la Universidad de Cornell de
6 dólares (en 1990) y al otro grupo se le dio primero la taza de café y luego se le preguntó cuánto
dinero aceptarían por ella. El primer grupo estaba dispuesto a pagar mucho menos en promedio (3
dólares) de lo que el segundo grupo estaba dispuesto a aceptar por ella (7 dólares). Esto se llama el
efecto de dotación y es una preferencia por las cosas que ya posees.
7
Simplemente formular las decisiones en términos de victorias o derrotas cambia lo que la gente elige .
Lo interesante de esto es que, incluso cuando se nos muestra la irracionalidad, la sensación es que
todavía es correcta. Este efecto fue descubierto por primera vez por Daniel Kahneman y Amos Tversky,
quienes hicieron este descubrimiento sentados en una cafetería en Israel, preguntándose qué harían
en determinadas situaciones. Cuando se dieron cuenta de que estaban tomando decisiones irracionales,
llevaron sus preguntas a los estudiantes de sus clases universitarias y midieron, cuantitativamente,
qué proporción de los que tomaban cada decisión en cada condición.
9
En el caso clásico de su artículo de 1981 publicado en la revista Science :
Imaginemos que Estados Unidos se prepara para el brote de una enfermedad asiática poco
común, que se espera que mate a 600 personas. Se han propuesto dos programas
alternativos para combatir la enfermedad. Supongamos que la estimación científica exacta
de las consecuencias de los programas es la siguiente:
Problema 1: Si se adopta el programa A, se salvarán 200 personas. Si se adopta el
programa B, hay una probabilidad de 1/3 de que se salven 600 personas y una probabilidad
de 2/3 de que no se salve a nadie. ¿Cuál de los dos programas preferiría?
Una lectura cuidadosa de las dos condiciones muestra que el Programa C es idéntico al Programa B,
El programa, mientras que el Programa D es idéntico al Programa B. Sin embargo, el 72% del primer grupo eligió
A y el 28% eligieron el programa B , el , Mientras que sólo el 22% del segundo grupo eligió pro
programa C y el 78% eligieron el programa D. Kahneman y Tversky interpretan esto como que
somos más sensibles a las pérdidas que a las ganancias: preferimos arriesgarnos a no ganar algo
que a perder algo. Esto es claramente parte de la historia, pero yo argumentaré que hay una
cuestión más profunda aquí. Argumentaré que el "valor" es algo que calculamos cada vez, y que el
proceso de cálculo no siempre llega a la misma respuesta "racional".
Machine Translated by Google
La definición de valor 17
Lo más interesante de estos resultados (que son muchos) es que incluso cuando son ilógicos (como el ejemplo
de la enfermedad mencionado anteriormente), a menudo siguen sonando correctos.
Hay otros ejemplos en los que podemos ver que las decisiones son irracionales y no suenan correctas cuando
nos las señalan, pero que los humanos definitivamente demuestran cuando se ponen a prueba.
Los mejores ejemplos de la mayoría de estos provienen del mundo de la publicidad y el marketing.
Una persona va a una tienda de electrónica a comprar un televisor y encuentra tres televisores en oferta,
uno de 100 dólares, otro de 200 dólares y otro de 300 dólares. Imaginemos que los tres televisores tienen
características diferentes, de modo que estos tres televisores tienen precios razonables. Es mucho más
probable que la gente compre el televisor de 200 dólares que cualquiera de los otros dos. Si, por el contrario,
la persona va a la tienda y encuentra tres televisores en oferta, el mismo televisor de 200 dólares, el mismo
televisor de 300 dólares y ahora un televisor más lujoso de 400 dólares, es más probable que compre el
televisor de 300 dólares. En el primer caso, la persona está diciendo que el televisor de 200 dólares es una
mejor oferta que el de 300 dólares, pero en el segundo caso, la persona está diciendo que el televisor de 300 dólares es la
Aunque les han ofrecido los mismos televisores por los mismos precios, la decisión ha cambiado dependiendo
de si hay un televisor de 100 dólares o uno de 400 en la mezcla. Esto se llama aversión a lo extremo y es un
componente de un proceso más general llamado encuadre .
En resumen, el conjunto de opciones disponibles cambia la valoración que se hace de ellas. Esto es
completamente irracional y (a diferencia de los otros ejemplos anteriores) parece poco razonable (al menos
para mí). Sin embargo, es uno de los resultados más fiables en marketing y probablemente se ha utilizado
10
desde los primeros mercados en la antigüedad hasta la era digital moderna.
Los productos que aparecían en los anuncios solían compararse entre sí. Tylenol decía que era mejor que
la aspirina y CocaCola decía que era mejor que la Pepsi. Recuerdo un anuncio de RC Cola con dos equipos
opuestos peleándose por qué bebida preferían, CocaCola o Pepsi, mientras una tercera persona sentada al
margen bebía una RC Cola, fuera de la refriega, sonriendo. Los anuncios de hoy rara vez mencionan a la
competencia.
11
porque una de las heurísticas que utilizamos es simplemente si reconocemos el nombre o no.
De modo que, aunque RC Cola intentaba comunicar que CocaCola y Pepsi eran lo mismo,
mientras que RC Cola era diferente, lo que la gente entendió del anuncio fue un recordatorio de
que todo el mundo bebía CocaCola y Pepsi. El simple hecho de mencionar el nombre recuerda a
la gente que existe y refuerza la decisión de elegirla. La familiaridad con una marca aumenta la
probabilidad de que uno la elija.
Mientras escribo esto, es temporada electoral. En todo mi vecindario, la gente ha colocado carteles a favor
de sus candidatos. Los carteles no dicen nada sobre los candidatos. A menudo, ni siquiera indican el partido
al que pertenecen los candidatos. Por lo general, solo se incluye el nombre del candidato y, a veces, un
llamado a "votar por" el candidato. ¿Qué información obtengo al ver un cartel que no dice nada más que "Vote
por X"? Supongo que uno puede necesitar que le recuerden que debe votar, pero entonces, ¿por qué el cartel
incluye "por X"? (Una de mis vecinas tiene un gran cartel hecho a mano que coloca cada temporada electoral
que solo dice "¡VOTE!"). Es cierto que uno puede tener una idea de la agrupación de candidatos a partir de las
personas que colocan varios carteles: dado que me gusta la persona X para representante estatal, ver que
todas las personas con la persona X también tienen a la persona Y para fiscal del condado, mientras que todas
las personas que tienen al oponente de la persona X tienen a la persona Z para fiscal del condado, podría
sugerirme que me gustaría a la persona Y en lugar de la persona Z para el cargo.
Machine Translated by Google
fiscal del condado. Pero mucha gente solo tiene una señal de salida. Todo lo que eso me dice es que a
mucha gente le gusta la persona X. ¿Por qué saber que a mucha gente le gusta algo sugeriría que a
mí también me gusta?
En realidad, hay tres cosas que están haciendo estas empresas de un solo signo. En primer lugar, están
aumentando mi familiaridad con ese nombre. Al igual que con los productos, el simple hecho de conocer el nombre
aumenta la probabilidad de votar por alguien. En segundo lugar, si a mucha gente le gusta una película, es más
probable que sea una buena película que una que todos odiaron. Utilizando la misma heurística, si a todo el
mundo le gusta un candidato, ¿no es más probable que ese candidato sea una buena opción? Y en tercer lugar,
nos gusta estar en el equipo ganador. Si todos los demás van a votar por alguien, es probable que gane. Por
supuesto, se supone que debemos votar en función de quién creemos que es una mejor opción para gobernar, no
de quién es el más popular. Pero está bastante claro que mucha gente no vota de esa manera.
Estos efectos se producen porque en realidad no calculamos el valor real de las cosas, sino que nos permiten
Utilizamos reglas generales, llamadas heurísticas., hacer conjeturas bastante acertadas sobre cómo las valoramos.
12 Si te gustan todas las opciones, elegir la del medio es una buena opción que te dará una
buena relación calidadprecio. Si estás tomando una decisión, la familiaridad es una buena opción. (Es probable
que algo que te resulte familiar sea algo que ya hayas visto antes. Si lo recuerdas, pero no recuerdas que fuera
malo, ¿qué tan malo podría haber sido?)
Algunos economistas han argumentado que, desde el punto de vista evolutivo, las heurísticas son mejores
que tratar de calcular el valor real de las cosas, porque calcular el valor lleva tiempo y las heurísticas son lo
13
suficientemente buenas como para que Pero muchas de estas decisiones no óptimas que tomamos...
podamos salir adelante. Las decisiones están llevando tiempo. Saber que los programas A y C son los mismos
y que los programas B y D son los mismos en el ejemplo de la gripe de Kahneman y Tversky no nos hace
cambiar de opinión. Esto me hace sospechar que está sucediendo algo más. No es que las heurísticas sean
más rápidas y nos estemos conformando con lo "suficientemente bueno". Sospecho que estos efectos tienen
que ver con la forma en que calculamos el valor. No podemos determinar cómo calculan los humanos el valor a menos que
Podemos medirlo. Así que, de nuevo, volvemos a la cuestión de cómo medimos el valor.
Valor de medición
En el caso de los animales, no podemos preguntarles cuánto valoran algo; sólo podemos ofrecerles algo y
determinar cuánto están dispuestos a pagar por ello. Por lo general, esto se mide en términos de la cantidad de
esfuerzo que un animal está dispuesto a realizar para obtener la recompensa. 14 ¿Cuántas veces está dispuesto
a presionar la palanca el animal para obtener cada recompensa?
Como alternativa, podemos darle al animal una elección directa entre dos opciones: 15 ¿Preferiría
el animal dos bolitas de comida con sabor a manzana o una bolita de comida con sabor a naranja?
¿Preferiría tomar jugo o agua? También podemos determinar qué cantidad de una opción debe ofrecerse para
que el animal cambie: si al animal le gusta más el sabor a manzana que el de naranja, ¿seguiría prefiriendo la
mitad de la cantidad de manzana que la misma cantidad de naranja?
Por último, también podemos medir las consecuencias negativas que un animal está dispuesto a soportar. Por
16
para obtener una recompensa. lo general, esto se mide colocando un efecto negativo (una pequeña descarga o un
plato caliente) entre el animal y la recompensa, que tiene que cruzar para llegar a la recompensa. (Es importante
señalar que cruzar la descarga o el plato caliente depende completamente del animal. Puede elegir no cruzar el
castigo si siente que la recompensa no es lo suficientemente valiosa). Un experimento común es equilibrar una
recompensa menos atractiva con una recompensa menos atractiva.
Machine Translated by Google
La definición de valor 19
17
una recompensa más atractiva que se otorga sólo después de un retraso. Como los animales suelen tener hambre
De esta manera, la demora se convierte en un castigo muy simple y medible: ¿cuánto tiempo esperará el animal por la
recompensa?
Por supuesto, los humanos también somos animales y todos estos experimentos funcionan bien en
18 Cómo
Humanos: ¿Cuánto esfuerzo haría un fumador para conseguir una calada de cigarrillo? ¿Cuánto dinero darías
hipotéticas (“¿Qué harías si...?”) en lugar de circunstancias reales, que, como veremos más adelante, pueden no acceder
a los mismos sistemas de toma de decisiones. Ha sido difícil probar animales con opciones hipotéticas (porque las
opciones hipotéticas son difíciles de construir sin lenguaje), pero hay algunas pruebas de que los chimpancés con
entrenamiento lingüístico esperarán más tiempo por recompensas descritas por símbolos que por recompensas reales
presentadas inmediatamente. 23 (¿Recuerdas a los chimpancés y las gominolas?). Esto, una vez más, sugiere que el
lenguaje cambia la maquinaria de toma de decisiones.
Las pruebas más generales de recompensas hipotéticas en animales se han visto limitadas por nuestra capacidad de entrenar
a los animales para que trabajen a cambio de fichas. Los experimentos recientes de Daeyeol Lee y sus colegas, en los que se
consiguió que los monos trabajaran a cambio de fichas, pueden abrir nuevas posibilidades, pero los experimentos críticos aún
no se han realizado. 24
Una de las formas más comunes de medir la disposición a pagar por algo es un procedimiento llamado ratio
progresivo : el sujeto (sea humano o no) tiene que presionar una palanca para obtener una recompensa, y cada vez que
recibe la recompensa, el número de veces que tiene que presionar la palanca para obtenerla aumenta, a menudo de
forma exponencial. La primera recompensa cuesta una pulsación, la segunda dos, la tercera cuatro, la cuarta ocho, y así
sucesivamente. Muy pronto, el sujeto tiene que presionar la palanca mil veces para obtener una recompensa más.
Finalmente, el animal decide que la recompensa no vale tanto esfuerzo y deja de presionar la palanca. Esto se llama
punto de quiebre .
Las cosas que parecen más valiosas para un animal tienen puntos de ruptura más altos
que las cosas que parecen menos valiosas. Los animales hambrientos trabajarán más duro para conseguir
comida que los animales saciados. 25 Los animales adictos a la cocaína trabajarán más duro para conseguir comida.
cocaína que para la comida. 26 Un colega mío (Warren Bickel, ahora en Virginia Tech) me contó de un sujeto experimental
(humano) en uno de sus experimentos que tiró de una pequeña palanca hacia atrás y hacia adelante decenas de miles
de veces en el transcurso de dos horas para obtener una bocanada de nicotina.
Se sabe desde hace mucho tiempo que las drogas no tienen un valor infinito. Cuando se les da la opción de elegir
entre drogas y otras opciones, tanto los adictos humanos como los animales que se autoadministran drogas A disminuirán
la cantidad de droga que consumen, ya que se vuelve más cara en relación con las otras opciones.
27
Los medicamentos muestran lo que los economistas llaman elasticidad :
cuanto más caros son, menos personas los consumen. Por eso, una forma de reducir el tabaquismo en una población es
A La literatura sobre experimentación animal generalmente no está dispuesta a llamar a los animales “adictos” y, en cambio,
se refiere a sus acciones conductuales como “autoadministración de drogas”. Como veremos más adelante en el libro, los animales
se autoadministran las mismas drogas que los humanos, y los animales que se autoadministran drogas muestran la mayoría de los
mismos comportamientos que los humanos que se autoadministran drogas.
Machine Translated by Google
La elasticidad mide cuánto disminuye la decisión de hacer algo en respuesta a aumentos en el costo. Los
lujos son altamente elásticos; los no lujos son altamente inelásticos. A medida que aumentan los costos de ir
al cine o a un partido de béisbol, la probabilidad de que la gente vaya disminuye rápidamente. Por otro lado,
incluso si el costo de los alimentos aumenta, la gente no está dispuesta a dejar de comprar alimentos. Algunos
economistas han argumentado que una buena definición de adicción es que las cosas a las que somos adictos
son inelásticas. Esto les permite decir que Estados Unidos es "adicto al petróleo" porque dependemos tanto de
la conducción que nuestro uso del automóvil es generalmente inelástico al precio del petróleo. Sin embargo,
nuevamente nos enfrentamos a una irracionalidad interesante. La elasticidad del uso del automóvil no es
lineal28 : aumentar el precio de la gasolina de 1 dólar por galón a 2 dólares tuvo poco o ningún efecto en el
número de millas recorridas, pero cuando un galón de gasolina cruzó la marca de los 3 dólares, hubo una
caída repentina y dramática en el número de millas recorridas en 2005.
De repente, la gente empezó a decir: “Eso ya no vale la pena”. Por supuesto, la gente se acostumbró a ver
gasolina a 3 dólares el galón y el número de kilómetros recorridos comenzó a aumentar nuevamente.
Esta irracionalidad es donde el intento de medir el valor se vuelve interesante. En un conjunto reciente de
experimentos, Serge Ahmed y sus colegas descubrieron que, aunque el punto de quiebre para la cocaína era
mucho más alto que para el agua endulzada, cuando se les daba la opción entre cocaína y agua endulzada,
casi todos los animales elegían la endulzada 29 (para que los lectores no piensen que esto es algo especial
agua. sobre la cocaína, los mismos efectos ocurren cuando se examina a animales que se autoadministran
heroína 30 ). Medir el valor por cuánto estaba dispuesto a pagar el animal indicaba que la cocaína era más
valiosa que el agua endulzada (la cocaína tenía un punto de quiebre más alto que el agua endulzada), pero
medir el valor dándoles a los animales una opción indicaba que el agua endulzada era más valiosa.
(Ellos eligieron sistemáticamente el agua endulzada en lugar de la cocaína.) Las dos medidas dieron resultados
completamente diferentes en cuanto a cuál era más valiosa.
Uno de mis ejemplos favoritos de esta irracionalidad es un tratamiento para la adicción en el que a los
adictos vienen a la clínica y 31 Si los
adictos se les ofrecen vales para mantenerse alejados de las drogas.
proporcionan una muestra de orina o sangre limpia, que demuestre que han permanecido sobrios
durante los últimos días, reciben un vale para algo pequeño: el alquiler de una película o un certificado
de regalo. Incluso los vales muy pequeños pueden tener efectos dramáticos. Lo interesante de esto es
que aumentar el costo de una droga en $3 tendría muy poco efecto en la cantidad de droga que toma
un adicto (porque las drogas son inelásticas para los adictos), pero proporcionar una opción de vale de
$3 puede ser suficiente para mantener a un adicto limpio, recto y sobrio. Algunas personas han
argumentado que esta es una de las razones por las que Alcohólicos Anónimos y sus primos de los 12 pasos funcio
Proporciona una opción (asistir a reuniones y recibir elogios por mantenerse sobrio) que funciona como un
32
vale; es una recompensa social que puede proporcionar una alternativa al consumo de drogas.
Entonces, ¿por qué es tan difícil medir el valor? ¿Por qué somos tan irracionales en relación con el valor?
Voy a argumentar que el valor es difícil de medir porque el valor no es algo intrínseco a un objeto.
B Ahmed y sus colegas utilizaron sacarina en el agua en lugar de azúcar porque la sacarina no tiene
valor nutritivo directo pero de sabor dulce tanto para ratas como para humanos.
C Las reuniones de Anónimos (AA, Narcóticos Anónimos, Jugadores Anónimos, etc.) y sus primos de los doce pasos también
incluyen elementos adicionales que parecen acceder a componentes importantes de la toma de decisiones. Un ejemplo es la
presencia de un “patrocinador” (alguien a quien se puede llamar las 24 horas del día, los 7 días de la semana), que ofrece una opción
de bajo costo para alejar a una persona de la opción de tomar drogas de alto valor. Las líneas telefónicas de ayuda al suicidio también
funcionan de esta manera, ofreciendo una opción de muy bajo costo (una llamada telefónica) que puede acortar un camino peligroso.
Machine Translated by Google
La definición de valor 21
En primer lugar, en este libro voy a argumentar que existen múltiples sistemas de toma de decisiones,
cada uno de los cuales tiene su propio método de selección de acciones, 33 lo que significa que hay múltiples
valores que se pueden asignar a cualquier elección dada. En segundo lugar, en los experimentos deliberativos
34
que hemos estado analizando, tenemos que calcular el valor de las opciones disponibles cada vez.
(Incluso reconocer que hay opciones disponibles puede ser un proceso complejo que involucra memoria y
cálculo.) El valor de una cosa depende de tus necesidades, deseos y expectativas, así como de la situación
en la que te encuentras. Al formular la pregunta de diferentes maneras, podemos guiar la atención de las
personas hacia diferentes aspectos de una pregunta y cambiar su valoración de la misma. En parte, esta
dependencia de la atención se debe al hecho de que no sabemos qué es importante. Una minivan puede
llevar a toda la familia, pero el Prius híbrido tiene mejor rendimiento de combustible y ese BMW convertible se
ve más atractivo. Es difícil compararlos.
Esto significa que determinar el valor real de algo depende de muchos factores, de los cuales solo algunos
se relacionan con el objeto en sí. Más adelante veremos que el valor puede depender de lo cansado que
estés, de tu estado emocional y de tu disposición a deliberar sobre las opciones disponibles.
35
Incluso se puede manipular modificando señales no relacionadas, como en el caso
tenga más , de números no relacionados (¡como su dirección!) que pueden hacer que el efecto ancla
probabilidades de converger hacia un valor más alto o más bajo, más cercano a ese número. 36
Los economistas sostienen que deberíamos medir el valor por la recompensa que esperamos
obtener, teniendo en cuenta la probabilidad de que realmente obtengamos la recompensa, y las
oportunidades de inversión y los riesgos esperados. 37 Si tratáramos de explorar todas las
posibilidades e integrar todo esto, podríamos sentarnos eternamente dándole vueltas a las
posibilidades. Esto nos lleva al concepto de racionalidad limitada , introducido por Herb Simon en la
década de 1950, que sugiere que el cálculo lleva tiempo, que a veces es mejor llegar a la respuesta
rápidamente siendo menos completo sobre el cálculo completo, y que a veces un trabajo bastante
bueno es suficiente. la mayor 38 En lugar de ello, utilizamos heurísticas, pequeños algoritmos que funcionan mejor.
parte del tiempo.
El problema con esta teoría es que incluso cuando se nos da suficiente tiempo, seguimos usando estas
heurísticas. Los economistas y psicólogos que defienden la racionalidad limitada (como Gerd Gigerenzer 39 )
sostienen que la evolución nunca nos da tiempo. Pero si el problema fuera el tiempo, uno esperaría que cuanto
más tiempo se le diera a uno, más racional sería. Esto no es lo que se ve. La gente no cambia de opinión
acerca de tomar la televisión de valor medio si se le da más tiempo; de hecho, se vuelve más racional .
40
Es probable que elija la televisión intermedia, no menos, con más tiempo.
Elegimos el televisor del medio en el ejemplo de los tres televisores porque uno de los algoritmos que
utilizamos cuando queremos comparar las opciones disponibles de inmediato es encontrar el del medio. Otro
ejemplo es que tendemos a redondear los números reconociendo los dígitos. $3,99 parece mucho menos que
41
$4,00. Piense en su “disposición a pagar” $3,75 por galón de gasolina en relación con $3,50 por galón. Si
ambas opciones están disponibles, obviamente, irá a la gasolinera que la vende a $3,50. Pero si sube de
$3,50 a $3,75 de un día para otro, ¿realmente deja de comprar gasolina? Ahora, imagine que el precio sube
de $3,75 a $4,00. De repente, parece que la gasolina se ha vuelto demasiado cara. Vimos algo similar en la
máquina de refrescos que está cerca de mi oficina. Cuando el costo subió de 75 centavos a $1, la gente siguió
comprando refrescos. Pero un día subió de 1 dólar a 1,25 dólares y la gente dijo: "No vale la pena" y dejaron
de comprar. (Ahora cuesta 1,50 dólares y nadie compra refrescos allí nunca más). A veces el precio cruza una
línea que simplemente no podemos soportar más.
Machine Translated by Google
Parte de esto se debe a los mecanismos por los cuales categorizamos las cosas. Las cantidades
enteras de dólares atraen nuestra atención y es más probable que las escojamos. En un experimento
reciente, Kacey Ballard, Sam McClure y sus colegas preguntaron a las personas qué preferirían, $7 hoy
o $20 en una semana. 42 (Esta es una pregunta llamada descuento por demora , que examinaremos en
detalle más adelante en nuestro capítulo sobre impulsividad [Capítulo 5]). Pero luego pidieron a los
sujetos que decidieran entre $7.03 hoy y $20 en una semana. Las personas tenían más probabilidades
de elegir $20 sobre $7.03 que $20 sobre $7 incluso. En un maravilloso control, luego pidieron a los sujetos
que decidieran entre $7 hoy y $20.03 en una semana. Esta vez, las personas tenían más probabilidades
de elegir $7. No hay manera de que estas decisiones sean racionales, pero tienen sentido cuando nos
damos cuenta (1) de que tomar la decisión requiere determinar el valor de las dos opciones nuevamente
cada vez y compararlas, y (2) que usamos heurísticas que prefieren cantidades iguales en dólares para
D
compararlas.
El valor es un concepto importante para comprender la toma de decisiones, pero nuestro
cerebro tiene que calcular cuánto valoramos una elección. Ese cálculo se basa en la heurística.
y algoritmos simples que funcionan bastante bien la mayor parte del tiempo pero que pueden
ser irracionales bajo ciertas condiciones. ¿Cómo determinamos físicamente el valor? ¿Cuáles
son los mecanismos neurofisiológicos? Esto nos lleva a las diferencias entre el placer, el dolor y
la señal de "hacerlo de nuevo".
Ariely (2008). Predictably Irrational: The Hidden Forces that Shape Our Decisions . Nueva York:
HarperCollins. • Daniel Kahneman
(2011). Th inking, Fast and Slow . Nueva York: Farrar, Strauss y
Giroux.
• Scott Plous (1993). La psicología del juicio y la toma de decisiones . Nueva York:
Universidad McGrawHill.
D
No se sabe por qué la gente prefiere cantidades pares en dólares. Tal vez sea más fácil calcular cantidades pares en dólares. Tal vez
la gente desconfíe de las cantidades impares porque les preocupa que haya una diferencia de precio entre las gasolineras estadounidenses
truco que se está haciendo (como el 9 extra) y las que no. Tal vez la gente pueda medir las cantidades pares en dólares con mayor
c/ 10
facilidad, lo que puede llamar su atención. Cualquiera sea la heurística, la gente prefiere las cantidades pares en dólares.
43
Machine Translated by Google
El placer y el valor son cosas diferentes. Se puede tener placer sin valor
y valor sin placer. Se manifiestan mediante diferentes sustancias
químicas en el cerebro. En particular, el cerebro contiene una señal para
“mejor de lo esperado”, que se puede utilizar para aprender a predecir el
valor. La falta de recompensa esperada y la falta de castigo esperado
son procesos separados (decepción, alivio) que requieren mecanismos
neuronales adicionales.
Euforia y disforia
Se suele suponer que el placer es nuestra interpretación de las cosas que tenemos que volver a hacer.
“La gente busca el placer y evita el dolor”. Si bien esto suele ser cierto, una mejor descripción es que
la gente busca cosas que reconoce que tendrán un alto valor. Como veremos a continuación, el placer
es disociable del valor.
Aunque el dicho es “placer y dolor”, el dolor no es lo opuesto al placer. El dolor es en realidad un
sistema sensorial, como cualquiera de los otros sistemas sensoriales (visual, auditivo, etc.). 1
El dolor mide el daño a los tejidos y las cosas que pueden dañarlos. Incluye receptores específicos
que se proyectan hasta las estructuras sensoriales del mesencéfalo, que a su vez se proyectan hasta
las áreas de interpretación cortical. La sensación de dolor depende de la activación cortical en
respuesta a los sensores de dolor, pero esto también es cierto para los demás sistemas sensoriales.
La retina de los ojos detecta fotones, pero no los vemos; vemos los objetos que se interpretan a partir
de los fotones. El placer, en cambio, no es una sensación, sino una evaluación de una sensación.
griega εύ del griego φορíα ( phoria , que significa “soporte” o “sensación”) y Euforia , la raíz
( eu , que significa “bueno”), es probablemente una palabra mejor que “placer” para la señal cerebral
que estamos discutiendo. Y, por supuesto, euforia tiene un antónimo claro en disforia , que significa
“malestar”, que deriva de la raíz griega δυσ ( dis , malo). Los términos
23
Machine Translated by Google
La euforia y la disforia representan cálculos en el cerebro de qué tan bueno o malo es algo.
renunciarían a la comida, al sexo y al sueño para seguir presionando palancas para producir esta
estimulación cerebral.
A partir de esto, el haz prosencéfalo medial pasó a conocerse popularmente como “el centro del
placer”. 3 Pero incluso en estos primeros experimentos, la diferencia entre euforia y refuerzo se estaba
haciendo evidente. Robert Heath y sus colegas implantaron varios electrodos estimulantes en el cerebro
de un paciente (para el tratamiento de la epilepsia) y luego le ofrecieron al paciente diferentes botones
para estimular cada uno de los electrodos. Al estimularlo presionando un botón, el paciente informó
euforia orgásmica. Al estimularlo con el segundo botón, el paciente informó una leve incomodidad. Sin
embargo, el paciente continuó presionando el segundo botón una y otra vez, mucho más que el primero.
La euforia y el refuerzo son diferentes.
4
Resulta que la clave para el refuerzo de la estimulación del haz prosencéfalo medial es un
5
neurotransmisor cerebral llamado dopamina . La dopamina se construye químicamente en
A
a partir de precursores una pequeña zona del cerebro ubicada en lo profundo de la base del mesencéfalo.
B
llamados área tegmental ventral y sustancia negra .
A El término farmacológico “precursores” se utiliza para identificar las moléculas que se convierten en la molécula en estudio. 6
Las células son, en cierto sentido, fábricas químicas que convierten moléculas en otras moléculas,
utilizando moléculas especializadas llamadas enzimas . Por ejemplo, la sustancia química levodopa (Ldopa) es un precursor de
la dopamina, lo que significa que si tuvieras levodopa adicional en tu sistema, tus células tendrían más componentes básicos con
los que fabricar más dopamina, y descubrirías que tus células tendrían más dopamina para usar. Por eso la levodopa constituye
un buen tratamiento para la enfermedad de Parkinson, ya que la enfermedad de Parkinson es, de hecho, una disminución de la
producción de dopamina en ciertas áreas del cerebro. 7
B El área tegmental ventral se llama así porque se encuentra ventral (cerca de la base del cerebro) en el tegmentum (que
en latín significa “cubierta”), un área que cubre el tronco encefálico. Substantia nigra en latín significa “materia negra”, llamada así
porque contiene melatonina, que hace que el área se vea negra en un corte histológico.
8
La melatonina es una sustancia química que el cuerpo utiliza para señalizar el componente nocturno de los ciclos día/noche.
Por eso, a veces se utiliza para restablecer los problemas del ritmo circadiano. Interactúa con la dopamina, en particular con la
liberación de dopamina en el cerebro, lo que significa que las manipulaciones de la melatonina (por ejemplo, para el jetlag) pueden
9
afectar el aprendizaje y la cognición. Por eso la farmacología es tan compleja: manipular una cosa a menudo produce muchos
otros efectos.
Machine Translated by Google
Una teoría temprana de la dopamina fue que era la representación del placer en el cerebro. 10
Estimular el haz medial del prosencéfalo hace que las células dopaminérgicas liberen su 11
para (Recuerde que estos electrodos estimulantes fueron [incorrectamente] dimensionados
estimular el "centro del placer"). En estudios con animales, bloquear la dopamina Aunque no se
refuerzo bloqueado. 12 pudo demostrar defi nitivamente que los animales sintieran "placer",
la suposición fue que el refuerzo en los animales se tradujo en placer en los humanos. La mayoría
de las drogas de abuso producen una liberación de dopamina en el cerebro. 13 Y, por supuesto, la
mayoría de las drogas de abuso producen euforia, al menos en el uso do Dado que algunos de los
temprano. Aunque los mayores efectos farmacológicos de las drogas de abuso son sobre la
dopamina, se asumió que la dopamina era la señal de "placer". Esta teoría resultó ser errónea.
En un notable conjunto de experimentos, Kent Berridge de la Universidad de Michigan estableció
15
Para probar esta teoría de que la dopamina indicaba placer, midió Primero desarrolló una forma de
la euforia y la disforia en animales y observó sus expresiones faciales.
La idea de que los animales y los humanos comparten expresiones faciales fue propuesta por primera
vez por Charles Darwin en su libro La expresión de las emociones en el hombre y los animales . Berridge
y sus colegas utilizaron cámaras enfocadas de cerca a las caras de los animales, en particular las ratas,
para identificar que los sabores dulces (como el azúcar o la sacarina) iban acompañados de un lamido
de los labios, mientras que los sabores amargos (como la quinina) iban acompañados de una proyección
de la lengua, que coincidía con la clásica cara de "puaj" que todos los padres han visto en sus hijos
obligados a comer verduras.
Lo interesante es que Berridge y sus colegas (en particular Terry Robinson, también de la Universidad
de Michigan) pudieron manipular estas expresiones, pero no con manipulaciones de la dopamina. Las
manipulaciones de la dopamina modificaban si un animal trabajaba para conseguir una recompensa, si
aprendía a buscarla o si se acercaba a ella, pero si la recompensa se colocaba en la boca del animal o
incluso justo delante de él, se la comía y mostraba las mismas expresiones faciales. Lo que sí cambió
las expresiones faciales fueron las manipulaciones del sistema opioide del animal . El sistema opioide
es otro conjunto de neurotransmisores del cerebro que, como veremos, son muy importantes para la
toma de decisiones. Son imitados por los opiáceos: opio, morfina, heroína. Berridge y Robinson sugirieron
que existe una distinción entre “querer algo” y “gustarlo”. La dopamina afecta al deseo, mientras que los
opioides afectan al gusto.
Opiáceos
El sistema opioide endógeno incluye tres tipos de señales y receptores opioides en el núcleo accumbens,
16
el hipotálamo, la amígdala y otras áreas relacionadas.
Los neurocientíficos los han denominado con tres letras griegas (mu [μ], kappa [κ] y delta [δ]). Cada uno
de estos receptores tiene un par de sustancias químicas endógenas (llamadas ligando) que se unen a él
( endorfinas asociadas con los receptores opioides μ, dinorfina asociada con los receptores opioides κ y
encefalinas asociadas con los receptores opioides δ).
Los trabajos actuales sugieren que la activación de los receptores opioides μ indica euforia, y la activación
de los receptores opioides κ indica disforia. La funcionalidad de los receptores opioides δ
do
No todas las drogas de las que se abusa producen euforia. La nicotina, por ejemplo, suele producir un efecto muy disfórico al
14
principio del consumo, aunque es una de las drogas que más refuerza el efecto.
Machine Translated by Google
El papel de los receptores opioides μ en la analgesia (supresión del dolor), el alivio de la ansiedad y la inducción del deseo
de consumir drogas es menos claro, pero parece estar involucrado en la analgesia (supresión del dolor), el alivio de la
ansiedad y la inducción del deseo de consumir drogas. Las sustancias químicas que estimulan los receptores opioides μ
(llamados agonistas ) son generalmente gratificantes, reforzadores y euforizantes. El agonista clásico de los receptores
opioides μ es la adormidera, particularmente después de que se refina en morfina o heroína. Los agonistas de los
receptores opioides μ se autoadministran de manera confiable cuando se les da la oportunidad, ya sea por humanos u
otros animales. Por el contrario, las sustancias químicas que bloquean los receptores opioides μ (llamados antagonistas )
son aversivas y disfóricas e interfieren con la autoadministración. Por el contrario, los agonistas de los receptores opioides
κ también son aversivos y disfóricos.
Cuando Kent Berridge y sus colegas manipularon el sistema opioide en sus animales, descubrieron que podían
cambiar las respuestas faciales de los animales a cosas positivas (dulces) y negativas (amargas). La estimulación de los
receptores opioides κ cuando los animales eran alimentados con la solución dulce conducía a la cara de asco, mientras
que la estimulación de los receptores opioides μ cuando los animales eran alimentados con la solución amarga conducía
a lamerse los labios. Esta hipótesis también está respaldada por manipulaciones introspectivas en humanos. Se ha
demostrado que la naltrexona, un antagonista opioide general, bloquea la sensación de placer al comer azúcar: los
Si el placer o la euforia en el cerebro es realmente la activación de los receptores opioides μ, entonces este es un
gran ejemplo de la importancia de reconocer nuestra naturaleza física. La euforia no es una construcción mental divorciada
del sistema neuronal físico; se ejemplifica como un efecto físico en nuestros cerebros. Eso significa que una sustancia
química que accede a ese efecto físico (en este caso, los receptores opioides μ) puede crear euforia directamente. Esto
también plantea un concepto al que volveremos una y otra vez en este libro: la idea de un modo de vulnerabilidad o de
fracaso . No desarrollamos receptores opioides μ para tomar heroína; desarrollamos receptores opioides μ para que
pudiéramos reconocer cosas en nuestras vidas que tienen valor y, por lo tanto, nos dan placer. Pero la heroína estimula
los receptores opioides μ directamente y produce sentimientos de euforia. La heroína se aprovecha de un potencial modo
de fallo de nuestro cerebro: nos engaña para que sintamos euforia cuando no deberíamos sentirla. Al menos, así lo hace
hasta que el cuerpo se acostumbra y reduce el receptor opioide μ, lo que hace que el consumidor necesite consumir cada
vez más heroína para lograr la misma euforia, hasta que, finalmente, ni siquiera dosis masivas de heroína producen
Reforzamiento
Así pues, si la euforia y la disforia son los receptores opioides, ¿qué es el refuerzo y cuál es su
gemelo negativo, la aversión ? Según las definiciones científicas originales propuestas por primera
vez por los teóricos del aprendizaje animal (por ejemplo, por John Watson, Ivan Pavlov y Edward
Thorndike en las primeras décadas del siglo XX, y Clark Hull y BF Skinner en los años 1940 y
1950), el refuerzo es el proceso por el cual una recompensa (como comida para un animal
hambriento) aumenta la respuesta, mientras que la aversión es el proceso 18 (Observe cómo se
disminuye la respuesta. operacionalmente, en define esta definición por el cual una penalización
términos de fenómenos conductuales directamente observables. En la siguiente sección,
analizaremos el mecanismo de toma de decisiones e iremos más allá de estas simples limitaciones
conductuales. Por ahora, contentémonos con observar el comportamiento).
Machine Translated by Google
Cuando se plantea en términos de refuerzo, la pregunta es: ¿cuándo una recompensa refuerza
una conducta? En la década de 1960, Leon Kamin demostró que un estímulo reforzaba una conducta
solo si otro estímulo no la había reforzado ya. 19 A esto lo llamó
bloqueo porque el primer estímulo “bloqueó” al segundo. En su forma más simple, si entrenamos a
un animal para que empujara una palanca para obtener una recompensa en respuesta a un tono y
luego tratamos de entrenar al animal para que respondiera tanto al tono como a una luz presentados
juntos, la luz nunca se asociaría con la recompensa. Podemos comprobarlo preguntando si el animal
presiona la palanca en respuesta a la luz solamente. No lo hará. Por el contrario, si hubiéramos
comenzado el entrenamiento con el tono y la luz al mismo tiempo (es decir, si no hubiéramos
entrenado previamente al animal con el tono), entonces habría aprendido a responder tanto al tono
como a la luz cuando se presentaban juntos. El aprendizaje ocurre solo cuando algo ha cambiado.
En 1972, Robert Rescorla y Allan Wagner propusieron una teoría matemática basada en la idea
de que el refuerzo tenía que ver con la sorpresa y la previsibilidad. 20 Propusieron que
un animal aprendía a predecir que iba a recibir una recompensa, y que lo hacía basándose en la
diferencia entre la expectativa y la observación. La luz era bloqueada por el tono porque el tono ya
predecía por completo la recompensa. Esta teoría está respaldada por versiones más complicadas
de la tarea de bloqueo de Kamin, donde la recompensa se cambia durante el entrenamiento con tono
21
+ luz. Si la recompensa o el castigo entregados son
mayores después del tono + luz que después del tono solamente, entonces el animal aprenderá a
asociar la recompensa modificada con la luz. Si la recompensa entregada es menor después del tono
+ luz que después del tono solamente, entonces el animal aprenderá que la luz es un predictor “negativo”.
La prueba de esto se complica: se necesita una tercera señal (por ejemplo, un sonido diferente): se
entrena al animal para que responda a la tercera señal, luego se presenta la tercera señal con la luz
y el animal responde menos porque la luz predice que el animal recibirá menos recompensa de la
esperada con las otras señales por sí solas. El aprendizaje también puede reaparecer si cambian
otras cosas, como la recompensa real otorgada (manzanas en lugar de pasas), incluso cuando se
controla el valor de la recompensa (asegurándose de que el animal trabajaría a niveles similares para
ambas recompensas).
En la década de 1980, dos científicos informáticos, Richard Sutton y Andy Barto, propusieron una
nueva teoría matemática llamada aprendizaje de refuerzo por diferencia temporal , que se basaba en
parte en el trabajo de Rescorla y Wagner, pero también en trabajos anteriores en teoría de control e
D de la década de 1950, en particular la de Richard Bellman. 22 Bellman
“investigación de operaciones”.
demostró originalmente que se puede aprender una estrategia óptima midiendo la diferencia entre el
valor observado y el valor esperado y aprendiendo a tomar medidas para reducir esa diferencia.
Sutton y Barto reconocieron la similitud entre el trabajo de investigación de operaciones de Bellman y
el modelo de psicología de RescorlaWagner. Derivaron un algoritmo que era matemáticamente lo
suficientemente potente como para poder usarse para entrenar robots y otros sistemas de control.
La teoría de control utiliza ecuaciones para determinar cómo cambiar las variables en respuesta a estímulos para obtener los efectos deseados.
El termostato (retroalimentación negativa) que vimos al principio del libro suele ser el primer ejemplo que se utiliza en los libros de texto de teoría de
control. El control de crucero de su automóvil y la estabilidad que mantienen los aviones de combate actuales se derivan de mecanismos de la teoría
de control moderna.
Investigación de operaciones es el término que se utiliza a menudo para los departamentos universitarios que estudian estas cuestiones.
Machine Translated by Google
Había dos diferencias importantes entre las ecuaciones de Sutton y Barto y la teoría de
Rescorla y Wagner. En primer lugar, Rescorla y Wagner asumían que las predicciones
sobre la recompensa se derivaban de señales individuales. Por el contrario, las decisiones
en la teoría de Sutton y Barto se basaban en categorizaciones de la situación del mundo (a
la que llamaban el “estado” del mundo). 23;E
, Sutt en y
En segundo lugar, mientras que la teoría de Rescorla y Wagner aprendió a predecir la recompensa,
el sistema de aprendizaje de Barto aprendió a predecir el valor . 24 Cada situación potencial estaba
asociada a un valor. Las acciones del agente (el programa informático o el animal) y los
acontecimientos del mundo podían cambiar la situación. Una vez conocido el valor esperado
de cada situación, el agente podía decidir lo mejor que podía hacer (tomar la acción que
condujera a la situación con el valor esperado más alto). La clave fue que Suttton y Barto
demostraron que se podía aprender la función de valor (cuál era el valor de cada situación)
F
al mismo tiempo que se tomaban acciones.
Sutt y Barto llamaron a esto la arquitectura del actorcrítico. , porque requería dos
componentes: un actor que tomara acciones basadas en la estimación actual de la función
de valor y un crítico que comparara la estimación actual de la función de valor con los
resultados observados. El crítico calculaba la diferencia entre el valor que realmente se
obtuvo y el valor que se esperaba obtener, lo que Sutton y Barto llamaron error de
predicción de valor y etiquetaron como delta (δ), a partir de la analogía con el uso común
en física y matemáticas del término Δ (delta) que significa “diferencia ” .
El concepto de error de predicción de valor (δ) se entiende más fácilmente con un ejemplo.
Imagina que hay una máquina de refrescos en el pasillo de tu oficina y que se supone que
el refresco cuesta 1 dólar. Introduces tu dólar en la máquina y obtienes dos refrescos.
mi
Prefiero utilizar el término situación en lugar del término típico de la informática estado (o el término preferido
por la psicología: conjunto de estímulos ). El estado se utiliza en muchas otras literaturas para referirse a cosas
como "estado interno" (como estar bajo la influencia de una droga o no estar bajo la influencia de la droga), por lo
que términos sobrecargados como estado pueden ser confusos. Aunque muchos experimentos de psicología animal
utilizan un solo estímulo, mire a su alrededor: ¿cuál es el estímulo que impulsa su comportamiento? Actualmente
estoy escuchando música y viendo salir el sol sobre la nieve afuera de mi casa, tengo los pies en pantuflas peludas,
pero tengo frío en los tobillos: ¿cuál de estos estímulos es importante? Como veremos en el Capítulo 12, cómo
identificamos los estímulos importantes es un componente crítico del sistema de toma de decisiones, por lo que
simplemente decir estímulo es incompleto. Sin embargo, convenientemente, si , estímulo, y la situación toda
empieza con S, quisiéramos escribir ecuaciones (como suelen hacer los científicos), no tenemos que cambiar nuestras
variables.
F Existe una compensación entre exploración y explotación . Si sólo se elige la mejor opción, se pueden
perder oportunidades. Si se sale a explorar, se pueden cometer errores. Para nuestro análisis, supondremos que
se ha explorado lo suficiente como para no quedar atrapado en una situación en la que se conoce una buena
respuesta, pero aún no se ha encontrado la mejor. Analizaremos en profundidad la disyuntiva entre exploración y
explotación en un capítulo propio (Capítulo 14).
Uno de los problemas de la ciencia de la toma de decisiones es que se nutre de muchos campos, cada uno de los
GRAMO
cuales tiene su propia terminología. El δ que se utiliza en informática para representar el error de predicción de valores no
está relacionado con el δ que se utiliza para diferenciar los tipos de receptores opioides.
Machine Translated by Google
En lugar de uno, cualquiera que sea la razón, este resultado fue mejor de lo , la diferencia
esperado (la diferencia entre lo que observó y lo que esperaba es positiva) y es probable
que aumente su disposición a poner dinero en esta máquina. Si, por el contrario, pone su
dólar y no obtiene nada, entonces δ es negativo y es probable que disminuya su
disposición a poner dinero en esta máquina. Si, como se esperaba, pone su dólar y
obtiene su refresco, sus observaciones coinciden con sus expectativas, δ es cero y no
necesita aprender nada sobre esta máquina de refrescos. Observe que todavía obtiene
los nutrientes (tal como son) del refresco. Todavía obtiene el placer de beber el refresco.
Todavía sabe qué acciones realizar para obtener un refresco de la máquina de refrescos.
Pero no necesita aprender nada más sobre la máquina.
En lo que todavía considero uno de los descubrimientos más notables en neurociencia, a principios de
la década de 1990, Wolfram Schultz y sus colegas descubrieron que las ráfagas transitorias de activación
en las neuronas de dopamina aumentan con aumentos inesperados en valor, disminuyen con disminuciones
inesperadas en valor y generalmente siguen las señales de predicción de error propuestas por Rescorla y
25
momento (finales de la década de 1980 y principios de la década Wagner y por Sutton y Barto. En ese
de 1990), la dopamina se conocía principalmente como una señal de recompensa o placer (¡recuerde, esto
es incorrecto!) en la literatura sobre comportamiento animal y como una señal habilitadora motora en la
literatura sobre la enfermedad de Parkinson.
yo
Schultz estaba estudiando la dopamina en animales que estaban aprendiendo a hacer asociaciones de
estímulos con recompensas, con la expectativa de que luego estudiaría su papel en la enfermedad de
Parkinson. El primer paso fue examinar la activación de las células dopaminérgicas en respuesta a la dopamina.
La enfermedad de Parkinson fue identificada por primera vez en el siglo XIX por James Parkinson, quien escribió una monografía
llamada Un ensayo sobre la parálisis temblorosa . No es poco común en las sociedades modernas, pero las descripciones que
26
coinciden con la enfermedad de Parkinson se remontan a Por ejemplo, existe una descripción en la medicina ayurvédica india:
tiempos antiguos. En algunos textos se decía que probablemente se trataba de la enfermedad de Parkinson, y se trataba con una
planta medicinal que ahora se sabe que contiene levodopa (un tratamiento moderno común para la enfermedad de Parkinson).
Durante la mayor parte del siglo XX, se ha pensado que la enfermedad de Parkinson era una disfunción del sistema motor: la mayoría
de los pacientes con Parkinson muestran una incapacidad para iniciar el movimiento (acinesia) o una ralentización del inicio del
movimiento (bradicinesia). 27 Por ejemplo, los pacientes con la enfermedad desarrollan problemas de postura y temblores en las
extremidades tanto antes como durante el movimiento. Sin embargo, la enfermedad de Parkinson no es un trastorno de los músculos
o del sistema motor en sí: hay situaciones en las que un paciente con Parkinson puede reaccionar sorprendentemente bien. 28 Esto
se muestra muy bien en la película Awakenings , donde Rose puede caminar hasta la ventana una vez que las baldosas del piso
están pintadas de blanco y negro. Más adelante en este libro veremos que esto se debe a la naturaleza intacta de otros sistemas de
toma de decisiones en pacientes con Parkinson. Todavía se desconoce si se deben a reacciones emocionales (salir corriendo de una
habitación durante un incendio, capítulo 8), a secuencias de acción reflexiva simples y almacenadas durante mucho tiempo (sorpresa
por una pelota lanzada y "¡Atrapa!", capítulo 10) o a la presencia de señales visuales explícitas (líneas en el piso que permiten el
Los problemas de pérdida de dopamina en la enfermedad de Parkinson están relacionados con la dopamina como señal δ compleja.
La señal δ observada por Schultz y sus colegas está relacionada con cambios rápidos en la descarga de dopamina (ráfagas, llamadas
señalización fásica ). Las células dopaminérgicas también se activan a una tasa de referencia regular (llamada descarga tónica ). 31
La relación entre las ráfagas fásicas, la descarga tónica, la enfermedad de Parkinson y la toma de decisiones es 32 y todavía se
varias hipótesis, pero se sabe que la toma de decisiones está alterada en la enfermedad de Parkinson. desconocen
Se ha sugerido que los niveles tónicos de dopamina desempeñan un papel en el reconocimiento del movimiento de
35
las situaciones (motivación, Capítulo 13) y en la dinamización del mismo (este capítulo, a continuación, y el Capítulo 12).
Machine Translated by Google
En estos primeros experimentos, Schultz y sus colegas descubrieron que las neuronas dopaminérgicas
respondían siempre que el animal sediento recibía una recompensa de jugo. Pero en este primer experimento,
la recompensa se entregaba en momentos aleatorios; cuando Schultz y sus colegas proporcionaron una señal
que predecía la recompensa, para su sorpresa, las neuronas dopaminérgicas ya no respondían a la
recompensa. En cambio, las células respondían a la señal que predecía la recompensa. 36
Estos resultados experimentales se unificaron con el trabajo teórico de Read Montague, Peter Dayan y
Terry Sejnowski, quienes demostraron que las neuronas de recompensa inesperada reportadas por Wolfram
Schultz y sus colegas eran exactamente la señal “delta” δ que necesitaba el algoritmo de aprendizaje de
diferencia temporal de Sutt on y Barto. Durante tres años (1995, 1996 y 1997), publicaron tres artículos que
sugerían que los datos de las células dopaminérgicas de los monos coincidían con las señales de error de
predicción de valores necesarias para la teoría del aprendizaje de refuerzo de diferencia temporal.
37
Para entender realmente cómo la dopamina sigue la señal delta, uno puede preguntarse por qué las
neuronas dopaminérgicas aumentan su respuesta a la señal. Antes de la señal, el animal no tiene ninguna
expectativa inmediata de recompensa. (Por lo que sabe, la sesión del día está a punto de terminar). Está en
una situación de bajo valor. Cuando se le muestra la señal al animal, se da cuenta de que pronto recibirá una
recompensa, por lo que ahora está en una situación de mayor valor. El cambio de “esperar” de bajo valor a
“recibir recompensa” de alto valor es un cambio inesperado en valor y produce una señal delta de “mejor de
lo esperado”. Si el animal ha aprendido que un estímulo de instrucción predice la señal, diciendo que una
señal llegará pronto, entonces la señal de dopamina aparecerá en la señal de instrucción anterior en lugar de
en la señal (porque la señal de instrucción es ahora el aumento inesperado en valor). Si la señal no llega, se
produce una disminución de dopamina porque la señal era esperada pero no se entregó y se produce una
disminución inesperada del valor.
Experimentos posteriores han demostrado que la señal sigue muy bien la señal de error de predicción
del valor δ. Si la recompensa era mayor que la señal predicha, las neuronas dopaminérgicas aumentan la
respuesta nuevamente, mientras que si la recompensa no se entregó cuando se esperaba, las neuronas
dopaminérgicas disminuyen la respuesta. Las neuronas dopaminérgicas tienen una pequeña tasa de activación
de referencia de unos pocos picos por segundo. Las respuestas positivas implican una ráfaga de picos,
mientras que las respuestas negativas implican un cese de los picos.
38 Esto permite que las neuronas dopaminérgicas envíen señales tanto de “mejor que lo esperado”
como de “peor que lo esperado”. La dopamina incluso rastrea las señales de error de predicción de valores en
los paradigmas de bloqueo de Kamin.
39 Estos resultados se han replicado desde entonces en ratas, monos y seres
humanos. 40
Al examinar eventos aversivos reales, la respuesta de la dopamina a esos eventos resultó ser muy
42;yo
complicada.
Como veremos más adelante, la aversión y la decepción son en realidad fenómenos diferentes y
no pueden funcionar mediante un mecanismo compartido. Algunos investigadores han sugerido que
existe otra señal neurotransmisora análoga a la dopamina que puede servir como señal de aversión
(en paralelo a la señal de refuerzo de la dopamina), 47 pero nadie la ha encontrado (todavía) .
Las respuestas a los castigos (como alejarse de estímulos dolorosos) implican
un circuito neuronal diferente al de las respuestas a las recompensas positivas, en parte porque las
54
respuestas al castigo son un circuito evolutivamente más antiguo. Aprender a no hacer algo...
Aprender a hacer algo (aversión) utiliza un conjunto diferente de sistemas neuronales que aprender a
hacer algo (refuerzo). 55
I
En la actualidad, es muy controvertido hasta qué punto la teoría del error de predicción de valores (δ) explica los datos sobre
la dopamina. Parte del problema es que todos los experimentos requieren un comportamiento, el comportamiento de los mamíferos
es un proceso complejo y, a menudo, necesitamos realizar simulaciones por computadora del comportamiento en sí para determinar
cómo se vería una señal de error de predicción de valores en un experimento de comportamiento determinado.
Por ejemplo, Sham Kakade y Peter Dayan demostraron que si se proporcionan al agente dos señales, una positiva y otra
neutral, y las señales sensoriales de las dos señales son similares, entonces se pueden ver “efectos de generalización” donde hay
una señal δ positiva ilusoria al estímulo neutral que es seguida rápidamente por una señal δ negativa menos de lo esperado.
43
Imagínese dos puertas, una que conduce a la comida y
otra que no. Al oír el sonido de una puerta al abrirse, podría mirar hacia las dos puertas y recibir una señal δ positiva, pero luego,
cuando se dé cuenta de que la puerta neutra (sin recompensa) es la que se abrió, se sentirá decepcionado (lo que le dará una señal
δ negativa).
Como otro ejemplo, Patryk Laurent ha demostrado que un agente con recursos sensoriales limitados es evoEsencialmente,
Es lógico pensar que una señal de orientación positiva es útil incluso para eventos potencialmente aversivos. Esta 44
señal de orientación permite al agente hacer más de lo esperado para evitar esos eventos aversivos.
Ambos ejemplos proporcionarían señales complejas de dopamina a los eventos aversivos, lo que explicaría algunas de las
señales de dopamina observadas en los eventos neutrales y aversivos. Sin embargo, hacen predicciones específicas sobre cómo
debería responder la dopamina a esos eventos. Schultz y sus colegas han descubierto que la reacción prevista, menor de lo
45
esperado, ocurre después de la generalización de las señales de dopamina. Aunque el
La hipótesis de Laurent no ha sido probada explícitamente, pero podría explicar las señales de respuesta muy rápidas observadas
46
por Peter Redgrave y sus colegas.
Algunos investigadores han sugerido que la serotonina podría desempeñar el papel de señal negativa (aversiva), 48 pero
experimentos recientes han demostrado que ese no es el caso. 49 Otro candidato potencial interesante
es la norepinefrina (llamada noradrenalina en Europa). La norepinefrina es una modificación química de la dopamina, lo que la
octopamina, actúa como señal de error positiva, mientras que la dopamina actúa como señal de error negativa. 51
Todas estas moléculas (serotonina, noradrenalina, octopamina y dopamina) son muy similares en su estructura
52
molecular, lo que las convierte en candidatas plausibles, dado el proceso de copia y modificación que a menudo se
observa en la evolución.
Además, algunos trabajos recientes muy interesantes han descubierto que las neuronas de otra estructura
neuronal, la habénula (que se proyecta hacia las neuronas dopaminérgicas en el área tegmental ventral), aumentan
su activación con la aversión y disminuyen su activación con el refuerzo. 53 Todavía no está claro si estas neuronas
de la habénula son las neuronas de aversión buscadas durante mucho tiempo o si son parte del cálculo cerebral de
δ . Recuerde, δ es un término matemático. La dopamina refleja δ , por lo tanto, el cerebro calcula δ . . . de alguna
manera.
Machine Translated by Google
Desde el comienzo de los experimentos de aprendizaje con animales, se sabe que el proceso
de reconocer que una señal ya no predice una recompensa no significa que el animal haya olvidado
la asociación. 56 Esto se remonta a Pavlov y a sus famosos perros,
que aprendieron a asociar las campanas con la comida. Una vez que los perros habían aprendido a
salivar en respuesta a la campana (anticipando la comida), cuando no se les presentaba la comida,
mostraban frustración y enojo, y buscaban la comida. Sin embargo, con el tiempo reconocieron que
la campana ya no implicaba comida y aprendieron a ignorarla. Sin embargo, si se les daba comida
nuevamente solo una vez después de que sonara la campana, inmediatamente comenzaban a
salivar en busca de comida la próxima vez. Como el aprendizaje fue mucho más rápido después
que antes, Pavlov sabía que el perro no había olvidado la asociación original.
Esto significa que debe haber un segundo proceso. En la literatura, este proceso suele ser
K
Se llama extinción porque la falta de recompensa entregada ha “extinguido” la respuesta.
De hecho, con la aversión se producen exactamente los mismos efectos. Si se entrena a un animal
para que asocie una señal con un acontecimiento negativo (por ejemplo, una descarga eléctrica) y
esta asociación se extingue (al proporcionarle la señal sin la descarga), se le puede recordar la
asociación (un par de señal + descarga) y la respuesta reaparecerá sin necesidad de más entrenamiento.
La decepción no es el olvido del refuerzo y el alivio no es el olvido de la aversión. Dado que tanto el
refuerzo como la aversión tienen procesos secundarios correspondientes (decepción y alivio), la
decepción no puede ser el mismo proceso que la aversión y el alivio no puede ser el mismo proceso
que el refuerzo. Véase la figura 4.1.
Hasta el momento, los científicos no están completamente seguros de cuáles son los mecanismos
neuronales que subyacen al proceso secundario de extinción que sigue a la decepción o al alivio.
Existen dos teorías importantes para explicar este proceso secundario. Una es que existe un
segundo proceso de inhibición específico, de modo que las neuronas de esta área secundaria
57
inhiben a las neuronas del área de asociación primaria.
Se sabe, por ejemplo, que las sinapsis de la
amígdala son fundamentales para el aprendizaje inicial de una asociación aversiva (las lesiones de
la amígdala impiden tales asociaciones, la creación de tales asociaciones cambia los patrones de
disparo en la amígdala y la creación de tales asociaciones ocurre con y depende de la plasticidad
sináptica en la amígdala). Sin embargo, las neuronas en la corteza prefrontal central (la corteza
infralímbica en la rata, la corteza cingulada anterior central en el ser humano)
K
El uso de la palabra extinción para este proceso es desafortunado porque no tiene relación con el
decir, el fin de una especie.
término evolutivo extinción , es
Machine Translated by Google
RRRRRRRRRRNNNNNNNNNN
RRNNRRRNNNNNNNNNNN
RNNRNRNRNNNNNNNNNN
Como vimos en el capítulo 3, el “valor” es algo complejo. Hemos visto en este capítulo cómo el
cálculo del valor y el aprendizaje para predecir el valor dependen de múltiples sistemas que
interactúan entre sí. Hay un sistema que mide el placer de una cosa (euforia), un sistema que
aprende la utilidad de repetir acciones (refuerzo) y un sistema que reconoce el cambio (decepción).
Paralelamente, están los sistemas de disforia, aversión y alivio. Como veremos en los próximos
capítulos, estos componentes del aprendizaje del valor forman las bases de múltiples sistemas de
toma de decisiones que interactúan para impulsar nuestras acciones. El hecho de que haya
múltiples sistemas interactuando dificulta la detección y la definición real del valor.
• Richard S. Sutt y Andy G. Barto (1998). Aprendizaje por refuerzo: una introducción .
Cambridge, MA: MIT Press .
Machine Translated by Google
Riesgo y recompensa
"
“Carpe diem ”, dicen,
pero no tienes un día,
tienes un momento,
un momento para dudar...
o actuar.
Un adolescente pisa a fondo el acelerador mientras recorre las sinuosas curvas de una carretera arbolada; el
coche patina en cada giro, apenas conteniendo la aceleración. Un estudiante universitario gasta miles de
dólares en ropa y no tiene suficiente dinero para pagar el alquiler. Un alcohólico pasa por el bar de camino a
casa. “Solo una copa”, dice. Horas después, sus hijos vienen a llevarlo a casa. Un bombero se queda
paralizado un momento ante un edificio en llamas, pero luego reúne coraje y corre hacia el interior del edificio
para poner a salvo a un niño. Cada uno de estos ejemplos es un caso comúnmente citado de conflicto entre
sistemas de toma de decisiones.
El adolescente busca un equilibrio entre la emoción de la velocidad y el riesgo de perder cualquier futuro
potencial que pueda tener. La estudiante universitaria gasta el dinero ahora por el beneficio a corto plazo de
tener ropa e ignora (u olvida) el beneficio a largo plazo de quedarse en su departamento.
El alcohólico arriesga su familia, su felicidad y, a menudo, su trabajo y su sustento por el placer simple e
inmediato de una bebida. (Por supuesto, el problema es que una bebida se convierte en dos y luego en tres y
luego en más.) El bombero debe superar las reacciones emocionales de miedo que le dicen "no entres ahí".
Todos estos son conflictos entre sistemas de toma de decisiones.
En términos coloquiales, el riesgo implica la posibilidad de una pérdida frente a posibles ganancias (nuestro
adolescente hipotético está arriesgando su vida conduciendo demasiado rápido). En economía, el término riesgo
35
Machine Translated by Google
Se define como la variabilidad en el resultado 1 —el mercadode valores tiene más riesgo que una cuenta de ahorros
asegurada por la FDIC. Esta es una forma de incertidumbre, y ahora se sabe que existen representaciones de riesgo e
incertidumbre en nuestros cerebros. 2 Como analizaremos en profundidad
en el Capítulo 14, existen diferencias entre la variabilidad esperada (una probabilidad conocida, como la posibilidad de
que llueva), la variabilidad inesperada (una sorpresa, como cuando algo que funcionaba de repente se rompe) y la
variabilidad desconocida (ambigüedad, cuando sabes que no conoces las probabilidades). Los animales gastarán energía
para traducir la variabilidad desconocida en variabilidad esperada y para reducir la variabilidad esperada.
3
Imagina que eres un animal que entras en un nuevo entorno. No sabes qué peligros acechan ahí fuera ni qué recompensas hay disponibles. Antes de poder ponerte a salvo de
esos peligros y de poder obtener esas recompensas, tienes que explorar el entorno .
mento. Imagina que has explorado parte del entorno. Ahora tienes una opción: ¿hacerlo?
¿Te quedas y utilizas las recompensas que ya has encontrado o vas en busca de otras mejores?
Los animales tienden a ser reacios al riesgo cuando se trata de ganancias y a buscarlo cuando se trata de pérdidas.
Ésta es la fuente de la diferencia en el ejemplo de la gripe asiática del Capítulo 3: expresado en términos de salvar vidas,
la gente elige la opción segura, pero expresado en términos de pérdidas, la gente elige la opción más segura. Pero esta
5
Opción arriesgada. tampoco es toda la historia, porque el riesgo y la recompensa interactúan entre sí.
Exploración e incertidumbre.
6
Curiosamente, el comportamiento más arriesgado tiende a darse entre los adolescentes.
Los adolescentes se encuentran en esa transición de la dependencia a la independencia. Los seres humanos pasan
primero por una etapa de juventud en la que reciben protección y formación. En la etapa posterior de la adolescencia,
los seres humanos salen a explorar para ver cuáles son los parámetros del mundo. A medida que van saliendo de la
adolescencia, los seres humanos tienden a asentarse y a ser menos propensos a correr riesgos.
Esta capacidad de aprender los parámetros del mundo después de un largo período de entrenamiento hace que los
humanos sean particularmente flexibles en su capacidad de interactuar con el mundo.
Una pregunta interesante es, entonces, ¿qué es lo que impulsa a la exploración? Los animales, incluidos los
humanos, tienen una curiosidad innata que nos impulsa a explorar el mundo. Pero, como dice el proverbio, “la curiosidad
mató al gato”. Explorar es peligroso. Una evaluación justa de los peligros podría llevarnos a no estar dispuestos a correr
riesgos. Sin embargo, en promedio, las personas tienden a subestimar los peligros y a ser demasiado optimistas sobre
lo desconocido, 7 lo que tiende a impulsar la exploración, al tiempo que mantiene un comportamiento inteligente en las
partes del mundo que conocemos. (Recuerde, “la hierba siempre es más verde al otro lado de la colina”, excepto cuando
llega allí y no lo es).
¿En qué sentido es entonces que el adolescente que va a toda velocidad por una carretera es un ejemplo de exploración que
supera a la explotación? Es poco probable que nuestro adolescente hipotético vaya a toda velocidad por una carretera no transitada.
Cuando los animales exploran un nuevo territorio, tienden a viajar muy lentamente, observando todo lo que los rodea. 8
Pero nuestro adolescente hipotético está poniendo a prueba sus límites, intentando descubrir
qué tan buenos son sus tiempos de reacción, qué tan rápido puede ir manteniendo al mismo tiempo el control del auto.
Si el adolescente sobreestima sus habilidades o subestima la probabilidad de encontrarse con un automóvil que viene
en sentido contrario en esa carretera oscura y sinuosa a esa hora de la noche, las consecuencias pueden ser trágicas.
A lo largo de este libro veremos que la personalidad implica diferencias en los parámetros que subyacen al sistema
de toma de decisiones. Aquí tenemos dos parámetros y una interacción: ¿Qué tan curioso eres? ¿Qué tan optimista
eres ante lo desconocido? ¿Qué tan dispuesto estás a arriesgarte a cambio de esas nuevas respuestas? (Los
adolescentes, por supuesto, son conocidos por ambas propiedades: conductas de riesgo impulsadas por la curiosidad y
el optimismo excesivo).
Pero cada individuo, tanto en la juventud como en la edad adulta, tiene una visión diferente de estos 9 y, por lo tanto,
cada uno de nosotros tiene su propio nivel de búsqueda de riesgos y optimismo excesivo, parámetros,
Machine Translated by Google
Riesgo y recompensa 37
nuestro propio umbral de qué riesgos toleraremos y qué tan mal estimamos esos riesgos.
Equilibrar el riesgo y la recompensa puede ser la diferencia entre el éxito y el fracaso, y encontrar el equilibrio
adecuado no siempre es fácil.
¿Qué preferirías tener, $10 hoy o $10 en una semana? Salvo en algunas situaciones realmente
extrañas, prácticamente todo el mundo querría los $10 hoy. Esto significa que $10 en una semana
valen menos para ti que $10 hoy. Decimos que las recompensas entregadas en el futuro tienen
descuento . 10
Lógicamente, descontar recompensas futuras tiene sentido porque pueden suceder cosas
entre ahora y entonces; esperar al futuro es arriesgado. 11 Si te atropella un autobús o
ganas la lotería o el mundo explota en una guerra termonuclear, esos 10 dólares en una semana ya no valen
tanto como antes.
12
10$ hoy también se pueden invertir, Por lo tanto, en una semana, podrías tener más de 10 dólares.
Por supuesto, esto también funciona con recompensas no monetarias (comida, compañeros, etc.). 13 Para un
animal hambriento, la comida ahora vale mucho más que la comida de una semana. Si te mueres de hambre
ahora, la comida de la semana que viene no será tan valiosa. Y, por supuesto, a largo plazo, la comida de ahora
dará lugar a un cuerpo más fuerte, más energía y más capacidad para encontrar comida más adelante.
Por lo tanto, las recompensas actuales valen más que las futuras. Si le hacemos a la gente una serie de
preguntas sobre dinero ahora o dinero después ( ¿qué preferiría tener, 9 dólares ahora o 10 la semana que
viene? ), podemos determinar el valor real de 10 dólares en una semana. Si graficamos esto como una función
de la demora, podemos derivar una curva de descuento y medir cómo disminuye el valor con la demora.
14
Por supuesto, no podemos hacerles esta pregunta a los animales, pero podemos ofrecerles la opción de
elegir entre una pequeña cantidad de comida ahora y una gran cantidad de comida más tarde. 15 Por ejemplo,
en un experimento típico, a una rata, un mono o una paloma se le ofrecen dos opciones (palancas 16 o caminos
que conducen a un lugar donde hay comida 17 ): tomar la primera opción proporciona una bolita de comida
inmediatamente, pero tomar la segunda opción proporciona más bolitas de comida (digamos tres) después de un retraso.
Observando las elecciones del animal, podemos determinar nuevamente la curva de descuento.
Si el descuento se debiera simplemente a la inflación o a la capacidad de invertir dinero,
18
Espere que siga una función exponencial del tiempo. Disminuye En una función exponencial, el valor
B
en el mismo porcentaje cada unidad de tiempo. Si fuera una función Entonces, si su función de descuento
exponencial con una vida media de un año, estaría igualmente satisfecho con $5 ahora y $10 en un año o $2,50
ahora y $10 en dos años. Curvas de descuento exponencial
A
Podemos preguntarles, pero es poco probable que nos den una respuesta significativa.
B
Ejemplos de funciones exponenciales son las cuentas bancarias y el crecimiento de la población. Cuando un banco
dice que te pagará un porcentaje de interés cada año, la cantidad total de dinero en tu cuenta aumentará en ese porcentaje
cada año. Como el dinero vuelve a tu cuenta, estás multiplicando efectivamente tu cuenta de ahorros por un número mayor
que 1 cada año. Incluso un número pequeño puede acumularse rápidamente: una tasa de interés del 5% se duplicará en 15
años. Aquí, estamos hablando de decaimiento exponencial, que es como multiplicar el valor por un número un poco menor
que 1 cada año.
Un buen ejemplo de desintegración exponencial es la desintegración de material radiactivo: después de un número
determinado de años, la mitad del material se habrá desintegrado. De ahí proviene el término vida media . Por ejemplo, el
plutonio238 tiene una vida media de 88 años. Por lo tanto, si tienes una libra de plutonio238, después de 88 años, tendrás
media libra. Después de otros 88 años (176 años en total), tendrás un cuarto de libra, etc.
Machine Translated by Google
tienen una propiedad muy útil, que es que son autosimilares: tus elecciones ahora son las mismas que
harías dentro de un año.
Pero ni los humanos que responden cuestionarios ni los animales que presionan palancas muestran
curvas de descuento exponencial. 19 De hecho, los humanos que responden cuestionarios, los animales
que presionan palancas para obtener comida y los humanos que presionan palancas para obtener comida muestran
una curva de descuento que se describe mejor como una función hiperbólica , que cae muy rápidamente pero
luego se vuelve más plana con el tiempo.
Cualquier curva de descuento no exponencial (incluidas las hiperbólicas) mostrará una inversión de
propiedad llamada inversión de preferencias, preferencias en la que las opciones cambian según su contexto
20
Pregúntate qué temporal. Puede convencerse de que usted también muestra una inversión de preferencias.
preferirías tener, ¿10 dólares hoy o 11 dólares en una semana? Luego pregúntate qué preferirías tener,
¿10 dólares en un año o 11 dólares en un año y una semana? Cada persona tiene un punto de reversión
diferente, por lo que es posible que tengas que encontrar un conjunto de números ligeramente diferente
para ti, pero casi con toda seguridad podrás encontrar un par de números tales que no esperes ahora,
sino que esperes el año que viene. Observa que esto no tiene ningún sentido racional. Hoy, dices que
no vale la pena esperar ese dólar extra, pero dentro de un año, cuando te enfrentes a lo que en realidad
es la misma elección, dices que esperarás. Presumiblemente, si te preguntas qué pasará el año que
viene, dirás que no vale la pena esperar: habrás cambiado de opinión y habrás invertido tus preferencias.
Aunque esto es irracional, a la mayoría de la gente le parece correcto.
Éste es el error que comete nuestra hipotética estudiante extravagante, que dice que preferiría gastar
el dinero ahora en la recompensa inmediata (ropa nueva) en lugar de esperar a recibir la recompensa
mayor (pagar el alquiler) más adelante. De hecho, cuando sus padres le pregunten al comienzo del año
escolar si va a pagar el alquiler o comprar ropa nueva, es probable que les diga (supondremos que
honestamente) que va a pagar el alquiler. Este cambio (entre querer pagar el alquiler antes y comprar
ropa) es un ejemplo de la inversión de preferencias de la que estamos hablando.
La inversión de preferencias también puede observarse en la dirección opuesta. Esto podría llamarse el efecto
, a la tira cómica Cathy de Cathy Guisewite, que tiene como tema habitual la incapacidad de Cathy
Cathy, en honor
do
para resistirse a los dulces con alto contenido de azúcar, como los caramelos de Halloween o la tarta de cumpleaños.
(En el panel 1, Cathy dice que esta vez no comerá el pastel, pero en el panel 3, cuando se enfrenta al
pastel real, la encontramos comiéndolo). Desde la distancia, el chocolate está descontado y tiene poco
valor y se prefiere el valor a largo plazo de mantener su dieta, pero cuando el chocolate está
inmediatamente disponible, se descuenta menos y la pobre Cathy toma la decisión equivocada.
En parte, el dilema de Cathy proviene de una interacción entre sistemas de toma de decisiones: desde la
distancia, un sistema quiere seguir con su dieta, pero desde cerca, otro sistema se esfuerza por conseguir el pastel.
Ésta es la parábola de las gominolas que vimos en el capítulo 1: es difícil rechazar la recompensa física que tienes
delante a cambio de una recompensa abstracta. Una posible explicación del éxito de la Gestión de Contingencias
22
(que más adelante ofrece recompensas concretas a los adictos por mantenerse limpios de drogas) en la
modificación de la adicción y la conducta es que ofrece una opción alternativa concreta, que permite al sujeto optar
por otras opciones en lugar de la droga.
23
Desde una perspectiva positiva, la inversión de preferencias también permite un fenómeno interesante
llamado precompromiso, en el que una persona o un animal organiza las cosas de manera que no sea...
El azúcar C procesada es mucho más dulce que la mayoría de los alimentos que hemos evolucionado para comer, por lo que es una sustancia que
sobreestimula los sistemas sensoriales, lo que hace que la ingesta sea particularmente difícil de controlar. 21
Machine Translated by Google
Riesgo y recompensa 39
Si se le da la opción en el futuro, 24 por ejemplo, un alcohólico que sabe que beberá si va al bar puede
decidir no pasar por allí en coche. Desde la distancia, hace una elección, sabiendo que tomará la elección
equivocada si se le da la oportunidad más adelante. Si nuestra hipotética estudiante extravagante es
inteligente y se conoce bien a sí misma, entonces podría guardar el dinero en una cuenta de depósito en
garantía prepagada que sólo puede utilizarse para el alquiler. Los dos yoes (el estudiante al principio del
año escolar que quiere pagar el alquiler y el estudiante a mitad de año que quiere comprarse ropa) están en
conflicto entre sí. 25
Si es inteligente, puede comprometerse de antemano cuando es una estudiante ahorrativa y prematura para
evitar desperdiciar el dinero cuando sea una estudiante extravagante y tardía. A medida que exploremos los
componentes reales del sistema de toma de decisiones, descubriremos que el compromiso previo implica
una interacción entre la deliberación (capítulo 9) y el autocontrol (capítulo 15).
26 La capacidad de comprometernos de antemano con una opción en lugar de otra sigue siendo una de las
herramientas
La interacción entre múltiples sistemas de decisión también puede producir conflictos directamente.
Solo algunos de los múltiples sistemas de toma de decisiones que impulsan las acciones se reflejan en
nuestra consideración de la conciencia. Esto significa que puede haber acciones que nos lleven a
preguntarnos: “¿Por qué hice eso?”.
Otros ejemplos de conflicto (como el del bombero) se producen cuando un sistema quiere acercarse o
huir de un estímulo y otro componente le dice que se quede quieto. 28 En el capítulo 6, veremos que hay
componentes emocionales que dependen de la amígdala (una estructura cerebral límbica profunda
involucrada en fenómenos simples de aproximación y retirada de señalesrespuesta 29 ), componentes de
acción aprendida que dependen de los ganglios basales (otras estructuras neuronales que 30 ), y
de aprendizaje previo: la corteza componentes deliberativos que dependen de los pares situaciónacción
cerebral y el hipocampo (estructuras cognitivas que permiten la imaginación de posibilidades futuras 31 ).
Cuando estos tres sistemas seleccionan acciones diferentes, tenemos un conflicto.
Los experimentos clásicos con ratas y otros animales han estudiado un proceso simple llamado
condicionamiento del32 En un
miedo . experimento típico, se colocaría una rata en una caja y, a intervalos
irregulares, se tocaría un tono y luego la rata recibiría una descarga eléctrica suave. En los experimentos En
modernos, la descarga nunca es suficiente para lastimar al animal, sólo lo suficiente para que sea
desagradable. Se pueden realizar experimentos similares en humanos, donde reciben una descarga eléctrica
suave después
33 de
Lo una
que señal.
sucede es que la rata comienza a temer el tono que predice que se aproxima una
descarga. Los humanos describen explícitamente el temor a la descarga inminente y describen lo
desagradable que es la expectativa de una descarga. De hecho, Greg Berns y sus colegas descubrieron
que el temor a esperar una descarga era tan desagradable que las personas optaban por tener una descarga.
D
Es importante señalar que tanto los experimentos con animales como con humanos están muy regulados. Para
garantizar que estos experimentos sean humanitarios y seguros, los científicos deben obtener el permiso del IRB (comité
de revisión interna, para experimentos con humanos) de la universidad o del IACUC (comité interno de cuidado y uso de
animales, para experimentos con animales). Ambos comités incluyen científicos, profesionales médicos (veterinarios para
animales, médicos para humanos) y miembros de la comunidad local (que a menudo incluyen activistas de los derechos
de los animales en los comités del IACUC). Si el comité no cree que el experimento sea humanitario, seguro y que
probablemente sea importante desde el punto de vista científico, entonces el experimento no puede seguir adelante.
Machine Translated by Google
Las ratas no pueden, por supuesto, decirnos que tienen miedo y están nerviosas por el shock, pero se
quedan paralizadas de miedo y se asustan más en respuesta a un evento inesperado. Si estás tenso,
esperando un shock, entonces un ruido fuerte te hará saltar. Las ratas hacen lo mismo.
Esto nos lleva al condicionamiento del miedo al tono, en el que una rata aprende a esperar una descarga
después de que se reproduce un tono. El condicionamiento del miedo puede entonces extinguirse
proporcionando posteriormente a la rata el tono pero sin la descarga. Como vimos en el capítulo anterior, la
extinción conductual implica una nueva actividad en la corteza infralímbica que se proyecta hacia abajo
35
hasta la amígdala e inhibe la respuesta de miedo aprendida.
Esto coincide con el estudio de Yadin Dudai sobre el coraje que se mencionó en el capítulo anterior:
Dudai y sus colegas estudiaron a humanos que superaban su miedo a las serpientes. 36
La visión de la serpiente desencadenó el sistema emocional (pavloviano) que tenía una reacción innata
ante la serpiente (“¡Huye!”), mientras que el sistema deliberativo tuvo que superar esa acción prepotente.
Como se dice en muchas películas y novelas, el coraje no es la falta de miedo, sino la capacidad de
superar ese miedo. El hecho de que ahora conozcamos los mecanismos neuronales que subyacen al
coraje no disminuye lo que es el coraje.
Resumen
En esta primera parte del libro, hemos definido la cuestión de la toma de decisiones en términos de
selección de acciones, identificamos que no podemos simplemente decir que estamos evaluando
opciones e identificamos que hay múltiples sistemas que impulsan la selección de acciones dentro de los mamíferos.
En la siguiente parte, quisiera abordar la cuestión de qué son estos sistemas múltiples de toma de
decisiones y cómo interactúan entre sí. Más adelante (en la tercera parte del libro), abordaremos sus
vulnerabilidades y lo que éstas significan para los problemas de toma de decisiones, como la adicción y
el trastorno de estrés postraumático.
• George Ainslie (2001). Breakdown of Will . Cambridge, Reino Unido: Cambridge University Press. •
Robert Kurzban (2010). Why Everyone (Else) is a Hypocrite . Princeton, NJ: Princeton
Prensa Universitaria .
• Uri Nili, Hagar Goldberg, Abraham Weizman y Yadin Dudai (2010). No temas: Actividad de los circuitos
frontales y temporales en momentos de valentía en la vida real. Neuron, 66
, 949–962 .
mi
Hace unos meses tuve una experiencia similar con mi pecera: una de las bombas submarinas me
daba una descarga cada vez que metía la mano en el agua. Tuve que hacer un gran esfuerzo de
voluntad para meter la mano en el agua y recuperar la bomba dañada.
F
En su novela épica Dune, Frank Herbert define a la humanidad como la capacidad de mantener tu mano en una caja de dolor, rechazando
los sistemas de selección de acción reflexivos y pavlovianos que quieren retirar la mano, porque el sistema deliberativo sabe que la mujer que te está
SEGUNDA PARTE
La trompeta de Miles
sincopa el ritmo del tambor, se
eleva como voces burbujeantes
en un estanque turbio, flota
como burbujas de jabón perdidas en el aire,
desvaneciéndose en las nieblas de la mañana.
Imagínate la primera vez que conduces hacia el trabajo. Probablemente mirarías un mapa y planificarías la mejor ruta.
Durante el viaje, prestarías especial atención a las señales de tráfico y a los puntos de referencia.
Pero si recorres la misma ruta todos los días durante semanas, meses o años, la ruta se vuelve automática. Ya no
requiere la misma cantidad de atención y puedes pensar en otras cosas: el examen que tienes que hacer, el partido de
fútbol de tus hijos esa noche, lo que vas a preparar para la cena. Y, sin embargo, llegas al trabajo. De hecho, puede
volverse tan automático que conduces hasta el trabajo sin querer.
A
La primera vez que utilicé esta analogía, había regresado para dar una charla al laboratorio donde había realizado
mi trabajo posdoctoral en Tucson, Arizona. Me estaba quedando en la casa de huéspedes de mis antiguos mentores.
Cuando trabajé en su laboratorio (durante unos tres años), vivía en el lado este de la ciudad, en el lado sur, cerca de la
base aérea. Ellos también vivían en el lado este de la ciudad, pero al norte, junto a las montañas. Así que la primera
parte del trayecto en coche desde el laboratorio hasta su casa fue la misma que la primera parte de lo que había sido
mi habitual viaje a casa durante años. Y, aunque era plenamente consciente de este problema que acababa de plantear
en mi charla de esa mañana, giré hacia el sur cuando llegué a la esquina y no me di cuenta de mi error hasta que giré
hacia la calle en la que solía vivir.
43
Machine Translated by Google
Como veremos más adelante en esta sección, estos dos procesos (el proceso de planificación consciente,
que exige atención y está basado en mapas, y el proceso automático, que requiere poca atención, está basado
en secuencias y es una rutina) en realidad reflejan dos sistemas diferentes que procesan la información sobre
1
la decisión de maneras fundamentalmente diferentes y dependen de diferentes estructuras cerebrales.
Los científicos que estudian la toma de decisiones han identificado al menos cuatro procesos separados de selección
de acciones:
• Un sistema cableado que reacciona rápidamente a los peligros y eventos directos detectados de
inmediato. Éstos son los reflejos , genéticamente cableados en la médula espinal, el sistema nervioso
periférico y el tronco encefálico central.
• Un sistema que predice resultados y reacciona de una manera preprogramada genéticamente a esos
resultados. Computacionalmente, lo que se aprende en este sistema es una relación causal hipotética
entre las señales y los resultados. Las acciones no se aprenden, se “liberan” como respuestas
apropiadas al resultado esperado. A lo largo de este libro, me referiré a esto como el sistema de
selección de acciones pavloviano .
• Un sistema que delibera sobre las decisiones, que requiere muchos recursos, pero también es capaz de
realizar una planificación compleja y es flexible. Lo llamaré el sistema deliberativo.
sistema, pero también se ha descrito como aprendizaje dirigido a objetivos , como toma de decisiones
basada en modelos , como el sistema de acciónresultado y como la navegación local o de lugar.
2
sistema de ción.
• Un sistema que simplemente aprende la mejor acción a tomar en una situación dada. Una vez
que se almacena esa asociación, el proceso de decisión es muy simple, pero es inflexible.
Me referiré a esto como el sistema de selección de acción procedimental , ya que está muy
involucrado en las secuencias motoras aprendidas (procedimientos), pero también se lo ha
denominadosistema de acción almacenada en caché de , estímulo , y navegación de taxones
3
respuesta y hábito .
Estos cuatro sistemas son generalmente suficientes para explicar la selección de acciones en el cerebro
B
de los mamíferos; Sin embargo, cada uno de ellos tiene sutilezas internas que abordaremos a medida que
examinemos cada sistema por separado. Además, sus interacciones producen sutilezas que no son
directamente obvias a partir de sus componentes computacionales individuales.
Para que estos sistemas funcionen en el mundo real, necesitamos varios sistemas de apoyo
adicionales. En este momento, no está claro si estos sistemas de apoyo son componentes
separados que se comparten entre los sistemas de toma de decisiones, o si hay versiones
separadas de cada uno, de modo que cada sistema de toma de decisiones tiene su propia copia
de cada sistema de apoyo. Alternativamente, estos sistemas de apoyo podrían ser sistemas
completos por derecho propio, con sus propios componentes internos. Finalmente, es posible
que los sistemas de apoyo correspondan de alguna manera a algún aspecto de uno o más de los
sistemas de toma de decisiones. Sin embargo, también pueden ocurrir fallas en los sistemas de apoyo, 5 y
B
Algunos científicos han sugerido un quinto sistema basado en el recuerdo de un único acontecimiento del 4
pasado (“Funcionó la última vez, tal vez vuelva a funcionar”). Sin embargo, no está claro si se trata de un
sistema diferente o de un caso especial del sistema deliberativo que veremos a continuación y exploraremos en
profundidad en el Capítulo 9. Las estructuras cerebrales implicadas en este quinto sistema parecen ser las
mismas que intervienen en el sistema deliberativo.
Machine Translated by Google
Será necesario incluirlos para completar nuestra descripción del mecanismo de toma de decisiones.
• En primer lugar, por supuesto, se necesita un sistema de control motor que produzca los
movimientos musculares, los efectores que mueven el cuerpo y realizan la acción real. Como
las cuestiones que se abordan en este libro se refieren principalmente a la selección de la acción,
no a la acción en sí, no dedicaremos mucho tiempo al sistema de control motor espinal, excepto
para decir que las acciones generalmente se almacenan como procesos más complejos que
mover un solo músculo.
• En segundo lugar, se necesitan sistemas perceptivos que reciban e interpreten las señales
sensoriales básicas para determinar qué información llevan esas señales. Estos sistemas
necesitan reconocer objetos y sus propiedades básicas ( ¿Qué es? ¿Dónde está? ). Discutiremos
esto en términos de la detección de características y la integración de información. • Además,
sin embargo, se necesita un sistema que reconozca cuáles son las señales importantes en las que
basar la decisión, ya sea en términos de señales externas en el mundo o señales internas
relacionadas con el cuerpo. Aunque muchas literaturas científicas de toma de decisiones se
refieren a este proceso como "identificación de estímulos", creo que ese término nos lleva a
imaginar que las reacciones se realizan a un solo estímulo, mientras que claramente estamos
reconociendo múltiples estímulos e integrándolos en un reconocimiento de la situación en la que
nos encontramos. Por lo tanto, me referiré a esto como el sistema de
reconocimiento de situaciones . • Finalmente, se necesita un sistema que codifique las metas y
deseos de uno. Este sistema dependerá de las necesidades internas (evolutivas) de cada uno,
pero también deberá mediar entre objetivos, necesidades y deseos conflictivos. Por razones
obvias, me referiré a esto como el sistema motivacional .
Aunque me referiré a estos diferentes aspectos de la toma de decisiones como "sistemas", no quiero
que los tomen como módulos diferentes y separados. Un buen ejemplo de lo que quiero decir con el
término "sistema" son los motores eléctricos y de gasolina de los nuevos automóviles híbridos (como el
Toyota Prius): el automóvil puede ser impulsado por el motor eléctrico o por el motor de gasolina, pero
ambos motores comparten el mismo tren de transmisión y el mismo pedal del acelerador. Algunas partes
son compartidas y otras son separadas. Al final, sin embargo, el objetivo de ambos sistemas de motor
es hacer que el automóvil se mueva. Y el automóvil aún requiere un sistema de dirección adicional para
guiarlo en el curso correcto. De manera similar, lo que importa para la evolución es el comportamiento
del organismo en sí, no los sistemas separados de toma de decisiones. Los sistemas de toma de
decisiones son separados en el sentido de que requieren un procesamiento de información diferente e
involucran estructuras neuronales superpuestas, pero también diferentes, aunque todos interactúan para
producir comportamiento. Nos resultará útil separar estos sistemas como un primer paso en nuestro
análisis, pero necesitaremos volver a su interacción para comprender el comportamiento (y sus modos de falla).
Aunque nos gusta pensar en nosotros mismos como un único tomador de decisiones con un único
conjunto de deseos, todos tenemos experiencias en las que estos múltiples sistemas pueden entrar en
conflicto entre sí. La razón por la que evolucionaron los sistemas múltiples es que cada uno de ellos
tiene ventajas y desventajas, y cada uno es mejor en algunas tareas y peor en otras. Si uno puede
seleccionar con éxito qué sistema será mejor en cada momento, puede obtener las ventajas de cada
uno y disminuir las desventajas de cada uno. Hablaremos más adelante sobre lo que se sabe acerca
del mecanismo por el cual mediamos entre estos sistemas, pero todavía hay mucho debate en la
comunidad científica sobre cómo exactamente ocurre esa mediación.
Machine Translated by Google
Reflejos
Nuestros reflejos son los sistemas de toma de decisiones más simples que tenemos. Los científicos que
estudian la toma de decisiones a menudo descartan el reflejo como un sistema que no permite tomar
decisiones porque es demasiado simple. Pero, según nuestra definición de toma de decisiones como la
selección de una acción, tenemos que incluir un reflejo como una decisión. Debido a que los reflejos
interactúan con los demás sistemas de toma de decisiones, descubriremos que es útil incluirlos en
nuestra taxonomía de sistemas de toma de decisiones.
Tomemos como ejemplo el reflejo. Si tu mano toca algo lo suficientemente caliente como para
quemarlo (por ejemplo, la llama de una vela), retiras la mano rápidamente. Esto es algo que un animal
quiere hacer lo más rápido posible. Si nos tomáramos el tiempo de pensar: “Eso está caliente. ¿Debería
retirar la mano?”, la llama nos habría dañado los dedos. De manera similar, no tenemos tiempo para
aprender a retirar la mano del fuego; la evolución quiere que eso suceda correctamente la primera vez.
Podemos pensar en los reflejos como operaciones simples (acciones que se seleccionan en reacción a
condiciones específicas) que se han aprendido a lo largo del tiempo evolutivo, pero que una vez
aprendidas dentro de una especie, quedan programadas en un individuo determinado. Estas cuestiones
gemelas del tiempo que lleva calcular una respuesta y el tiempo que lleva aprender la respuesta correcta
son ventajas y desventajas críticas de cada uno de los sistemas de selección de acciones.
La prueba de que un reflejo es realmente una decisión se puede ver en su interacción con el
Sistemas de selección de acciones. En Lawrence de Arabia, de David , otro. Hay una escena famosa.
Lean , donde TE Lawrence, interpretado por Peter O'Toole, espera a que la cerilla se queme hasta
los dedos. Su compañero la prueba y se queja de que le duele. "Por supuesto", responde Lawrence,
"pero el truco es no preocuparse por el dolor". Es posible anular la selección de acciones
predeterminada de Reflex con un sistema diferente, más consciente. Esta interacción entre
múltiples sistemas como parte importante de cómo tomamos decisiones es algo a lo que volveremos
varias veces en este libro.
La selección de acciones pavloviana también es computacionalmente simple en el sentido de que sólo puede
producir acciones que han sido aprendidas a lo largo de una escala de tiempo evolutiva (a menudo llamadas
respuestas incondicionadas ), 6 pero difiere del sistema de selección de acciones reflexivas en que aprende .
do
He luchado para encontrar la terminología correcta para utilizar en este primer sistema capaz de aprender.
Los mecanismos computacionales que subyacen al primer sistema son muy claros, pero necesitamos un término para ello.
(En un momento estuve tentado de llamarlo “Sistema X” para evitar todo el bagaje histórico asociado con el término “pavloviano”). Históricamente, se ha
asumido que el aprendizaje en los animales (incluidos los humanos) surge de dos sistemas diferentes, uno cuando no se requiere ninguna acción para
En los experimentos originales de Pavlov, se producía el sonido (la “campana”) y luego aparecía la comida. El perro
no tenía que hacer nada para conseguir la comida, por lo que se identificó como el primer sistema, que se denominó
“pavloviano”. Si, por el contrario, el perro tenía que empujar una palanca con la pata después de que sonara la campana
para conseguir comida, eso sería “instrumental”.
(continuado)
Machine Translated by Google
El sistema pavloviano aprende estímulos que predicen resultados, pero no aprende las acciones a
tomar ante esos resultados. 14 El aprendizaje pavloviano recibe su nombre de Ivan
Pavlov (18491936), el gran neurocientífico ruso. Supuestamente, Pavlov hizo sonar una campana
antes de alimentar a un perro y descubrió que el perro aprendió a salivar al son de la campana en
anticipaciónD a la comida.
Al describir el aprendizaje pavloviano, los científicos a menudo describen los estímulos como
“liberadores de acciones específicas”. 19 En la teoría clásica del aprendizaje animal, hay un estímulo
incondicionado (la comida que se le presenta al perro de Pavlov), una respuesta incondicionada
(salivación) y un estímulo condicionante (la campana). En el aprendizaje pavloviano, la respuesta
incondicionada cambia con el tiempo del estímulo incondicionado al estímulo condicionante. Las
interpretaciones del aprendizaje pavloviano tienden a ignorar el componente de selección de acción del
aprendizaje, lo que sugiere que la respuesta incondicionada es simplemente una herramienta para
identificar una asociación entre el estímulo condicionante y el estímulo incondicionado. 20
Estas interpretaciones se basan en parte en que el mismo entrenamiento que hace que los animales
adopten la respuesta incondicionada después de ver la señal de entrenamiento (selección de acción
pavloviana) también hace que los animales sean más propensos a adoptar otras acciones no entrenadas
que saben que alcanzarán el estímulo incondicionado (como si tuvieran una mayor motivación para
alcanzar ese estímulo incondicionado). 21 Este es un proceso llamado transferencia pavloviana a
instrumental , que examinaremos en profundidad cuando lleguemos a nuestro análisis de la motivación,
más adelante. Datos recientes sugieren que los dos efectos (liberación de la respuesta incondicionada) son:
Ahora sabemos que estos sistemas son más complicados: por ejemplo, el término tradicional “instrumental” incluye tanto los
sistemas deliberativos como los procedimentales, que seleccionan acciones utilizando procesos computacionales muy diferentes,
8 y el aprendizaje pavloviano en realidad trata sobre la selección de acciones apropiadas para la señalresultado.
9
expectativas. Además, estos dos sistemas de aprendizaje interactúan en un proceso llamado “de pavloviano a instrumental”.
transferencia”, 10 que identificaremos con el sistema de apoyo motivacional (más adelante).
Como veremos en nuestra discusión en profundidad de los sistemas pavlovianos (Capítulo 8), este sistema “pavloviano” Sin
Está relacionado con los instintos básicos de supervivencia y con las emociones. 11 embargo, ninguno de esos términos captura todos los
problemas computacionales, y ambos tienen su propio bagaje histórico asociado con ellos: el comportamiento animal tiene que
ver con el éxito genético, no con la supervivencia, 12 y la relación directa entre lo que llamamos el sistema de selección de acción
pavloviano y la emoción es controvertida. 13 Por lo tanto, utilizaré el término “selección de acción pavloviana” a lo largo de este
libro como un sustituto de un término mejor para este primer sistema de selección de acción basado en el aprendizaje.
D. Pavlov fue el primer ganador del premio Nobel de Medicina en 1904, pero sorprendentemente para mucha gente hoy en
día, no lo ganó por los estudios del aprendizaje por los que lo conocemos hoy, sino por su trabajo sobre la digestión y la salivación.
15 Después de su premio Nobel, se sintió lo suficientemente famoso como para arriesgarse a trabajar en el aprendizaje, iniciando
una tradición de ganadores del premio Nobel que pasaron de temas médicos no relacionados a la psicología y la neurociencia.
Otros ejemplos incluyen a Francis Crick 16 (19162004, premio Nobel en 1962 por el ADN) y Gerry Edelman 17 (1929, premio
Nobel en 1972 por los anticuerpos en el sistema inmunológico), quienes se dedicaron a trabajar en la conciencia después de ganar
sus premios.
Como sucede con la mayoría de las descripciones populares del proceso científico, la historia que se enseña en las clases
de introducción a la ciencia, según la cual Pavlov tenía una hipótesis explícita que luego puso a prueba, contradice el verdadero
18
proceso de descubrimiento en la ciencia. De hecho, Pavlov estaba trabajando en los mecanismos de la Como parte de su
digestión. Para la investigación con animales, tuvo que poner al perro en un arnés que estaba contrapesado por un peso pesado.
Cuando se le soltó el peso, Pavlov notó que el perro comenzaba a salivar. Pavlov se dio cuenta de que algo interesante estaba
sucediendo y decidió perseguirlo.
Machine Translated by Google
Sin embargo, no debemos olvidar que el animal, de hecho, está realizando una acción. Interpretaciones
recientes sugieren que el aprendizaje pavloviano desempeña un papel en un sistema de selección de acciones, en
el que las respuestas incondicionadas son acciones aprendidas a lo largo de una escala de tiempo evolutiva. 23
Imagínese vivir en la sabana, donde hay leones que podrían cazarlo. Puede aprender que el susurro en la maleza
predice que un león lo acecha y puede aprender a huir del susurro de la hierba, pero no tiene la oportunidad de
aprender a huir del león: debe hacerlo bien la primera vez. El sistema de selección de acciones pavloviano puede
aprender que el susurro en la hierba es un león que lo acecha, lo que lleva al miedo y a correr, pero no puede
aprender que la respuesta correcta es hacer saltos de tijera.
Una excelente manera de entender el sistema pavloviano es el fenómeno de los rastreadores de señales.
24
y rastreadores de Imagínese que se colocan ratas en un entorno con un sistema de liberación de alimentos.
objetivos . puerto y una luz, separados por una distancia pequeña pero significativa. La luz se enciende, y unos
momentos después llega comida al puerto de comida. La conexión entre la luz y la comida es independiente de lo
que haga la rata: la luz simplemente predice que la comida estará disponible. Lo correcto para la rata es ir al puerto
de comida cuando se enciende la luz. (Esto sería "seguimiento de objetivos"). Sin embargo, algunas ratas van a la
luz durante el intervalo intermedio y la roen. Todavía van a la comida cuando se les entrega la comida, pero han
perdido tiempo y energía yendo primero a la luz. (Esto sería "seguimiento de señales"). De hecho, si una rata
rastreadora de señales ha tenido suficiente experiencia con la asociación luzcomida, y dejas de darle comida si la
rata va a la luz y se la das solo si la rata va directamente al puerto de comida, la rata tiene un problema terrible para
dejar de ir a la luz.
fuerte.
El pensamiento actual sugiere que la selección de acción pavloviana está relacionada con lo que reconocemos, aunque la relación
La categorización de las respuestas 26 específica entre la selección de acción pavloviana y la selección de acción pavloviana es incierta.
emocionales, la acción y la emoción etiquetada lingüísticamente es controvertida. 27 Algunos autores han sugerido
que las respuestas emocionales son acciones pavlovianas que modifican las respuestas internas (frecuencia
cardíaca, salivación, etc.). 28 Otros han sugerido que las cosas que etiquetamos como emociones son un proceso
de categorización aplicado a estas respuestas internas. En el Apéndice C se puede encontrar
un análisis de los procesos de categorización en los cerebros de los mamíferos (incluidos los humanos).
Volveremos a las relaciones entre la selección de acción pavloviana y la emoción en el Capítulo 8.
Aunque es flexible en cuanto a los estímulos a los que puede reaccionar, el conjunto de acciones disponibles
para el sistema de selección de acciones pavloviano es muy limitado. Las respuestas pavlovianas solo pueden
transferir una simple “respuesta incondicionada” a un estímulo anterior. Esto lo hace más flexible que los reflejos
simples, pero el sistema de selección de acciones pavloviano no puede realizar una acción arbitraria en respuesta
a un estímulo arbitrario. Para eso, necesitamos una maquinaria de toma de decisiones más compleja, como los
sistemas deliberativo o procedimental.
Machine Translated by Google
Deliberación
El sistema deliberativo es más flexible. Puede tomar cualquier acción en cualquier situación, pero es
un sistema computacionalmente costoso. En los seres humanos, la deliberación implica planificación y
consiste en una investigación consciente del futuro. Esto es particularmente útil para decisiones
importantes que se toman una sola vez, donde no se pueden probar las opciones individuales varias
veces para determinar el valor de cada una.
Por ejemplo, un amigo mío pasó el último mes decidiendo entre dos universidades que le habían hecho
ofertas de trabajo. Cada una de ellas tenía ventajas y desventajas. No era una decisión que pudiera tomar
diez veces, observar cuáles eran las respuestas cada vez y luego aprender lentamente a tomar la opción
correcta. Obviamente, no era una decisión con una acción que evolucionara a lo largo de generaciones.
mi
En cambio, tuvo que imaginarse a sí mismo
en esos dos futuros: ¿Cómo sería la vida en la Universidad Uno? ¿Cómo sería la vida en
F
¿Universidad Dos? A través de su experiencia de vida y de la discusión con sus colegas, trató de calcular
las consecuencias de su decisión. A partir de esa compleja deliberación, elaboró lo que creía que era la
mejor opción.
30
Este es un proceso llamado pensamiento futuro episódico . Volveremos a la cuestión del pensamiento
episódico sobre el futuro en capítulos posteriores, pero el concepto es que, cuando se intenta planificar un
acontecimiento futuro complejo, es necesario reunir recuerdos y experiencias de muchas fuentes para
imaginar cómo podría ser el futuro potencial. Al imaginarnos a nosotros mismos en ese acontecimiento
futuro, podemos determinar si es algo que queremos que suceda o algo que queremos evitar. Como
veremos, tanto el hipocampo como la corteza prefrontal participan de manera crítica en el pensamiento
31;G
episódico sobre el futuro.
Una pregunta crítica que ha plagado la psicología durante años es: ¿los animales también deliberan?34
No podemos preguntarle a una rata en qué está pensando, pero podemos decodificar información a partir de
señales neuronales. Si sabemos qué información está representada por un conjunto de células, entonces
podemos decodificar esa información a partir de la actividad en esas células. (Véase el Apéndice B para una
discusión de la tecnología actual y los métodos que permiten la decodificación de señales neuronales).
mi
Creo que es bastante improbable que “aceptar el trabajo en la Universidad Uno” pueda estar codificado en los genes de una persona.
Es evidente que esta cuestión no se puede resolver mediante reflejos. De manera similar, aunque ésta no es ciertamente una decisión que
el sistema de selección de acciones pavloviano pueda tomar (no puedo imaginar que “firmar en la línea de puntos” sea una respuesta
genéticamente codificada para ningún resultado), se podría argumentar que el sistema pavloviano influyó en su decisión, porque se sintió
atraído a un lugar u otro. Sospecho que hay participación pavloviana cuando alguien dice: “Quiero volver a esa universidad porque está en
mi ciudad natal donde crecí y quiero volver a casa” (o “Nunca volveré a esa universidad porque está en mi ciudad natal donde crecí”, ¡lo cual
también he escuchado!). En cualquier caso, la decisión final de ir a un nuevo trabajo o no es una que casi con certeza involucra al sistema
F
Esta es una de las ventajas del lenguaje humano: podemos mejorar nuestra predicción a partir de la observación.
conversaciones y discusiones con otros.
G A menudo se habla del hipocampo como un elemento fundamental para la memoria episódica , es decir, para los recuerdos de
acontecimientos pasados de la vida. 32 El papel del hipocampo en la imaginación del futuro (pensamiento episódico sobre el futuro) sugiere
una hipótesis particularmente interesante sobre el papel del hipocampo en los recuerdos del pasado: tal vez no recordemos el pasado, tal
vez en realidad imaginemos nuestro pasado. Tal vez estemos usando el sistema que evolucionamos para imaginar el futuro cuando tratamos
de recordar estos acontecimientos pasados. Esta puede ser una explicación de por qué nuestros recuerdos de acontecimientos pasados son
33
tan frágiles y tan fácilmente manipulables.
Machine Translated by Google
señales.) El hipocampo es una parte fundamental del pensamiento episódico sobre el futuro en los seres humanos. 35
En las ratas, la información representada en las células del hipocampo es, en primer lugar, la ubicación del animal en
un entorno (se conocen como células de lugar ). 36 A partir de la actividad de estas células, podemos decodificar la
ubicación representada en un momento determinado por las células. 37 Por lo tanto, si una rata imaginara estar en
otro lugar del entorno, deberíamos poder decodificar esa imaginación observando el conjunto de células activas del
hipocampo. 38
Las ratas parecen, sin duda, deliberar sobre sus opciones. Cuando se encuentran ante una opción difícil o que ha
cambiado recientemente (por ejemplo, en una intersección en T de un laberinto), a veces se detienen y giran primero
hacia un lado y luego hacia el otro. 39 Cuando Karl Muenzinger y su alumna Evelyn Gentry observaron por primera
vez este comportamiento en 1931, lo llamaron “ensayo y error indirecto” porque pensaron que la rata estaba probando
las posibilidades indirectamente.
De la misma manera que mi amigo se imaginaba a sí mismo en sus dos futuros trabajos para tratar de decidir entre
ellos, la rata se imaginaba a sí misma eligiendo entre las dos opciones. Estas ideas fueron desarrolladas por Edward
Tolman en los años 1930 y 1940, quien demostró que estos procesos indirectos de ensayo y error ocurrían cuando
nosotros mismos deliberamos sobre las opciones y argumentó explícitamente que los animales estaban representando
yo
el futuro conscientemente.
Por desgracia, Tolman no tenía una forma matemática de explicar sus ideas y fue atacado porque “no predijo lo
que haría la rata”. El psicólogo Edwin Guthrie, en un artículo de revisión de 1937, se quejaba de que “en lo que
respecta a la teoría, la rata se queda sumida en sus pensamientos”. Tolman no tenía un ordenador moderno y no
42
tenía lenguaje para decir “sí, la Tolman, sin embargo, escribía antes de la invención del mod
rata se queda sumida en sus pensamientos porque está haciendo un cálculo complejo”. En nuestro mundo moderno,
todos hemos experimentado la idea de la complejidad computacional: los algoritmos tardan en procesarse. Cuando
nuestros ordenadores buscan un archivo en un directorio. Cuando un sitio web tarda en cargarse. Cuando un oponente
informático en un juego tarda en responder. No nos resulta tan extraño que un ordenador esté “perdido en sus
pensamientos”. Y, de hecho, Tolman (siguiendo a Muenzinger y Gentry) había observado directamente a las ratas
detenerse en esos puntos de elección, presumiblemente “perdidas en sus pensamientos”.
Además, por supuesto, Tolman y sus colegas no tenían las herramientas neurofisiológicas que tenemos ahora.
Así como los humanos con daño en el hipocampo no pueden imaginar el futuro, también las ratas con daño en el
43
En los hipocampo ya no se detienen en los puntos de elección, ni
44
eventos de “ensayo y error vicarios”, ¿muestran tanto Ahora podemos decodificar representaciones
ensayo y error vicarios? de lugar a partir de conjuntos registrados de neuronas del hipocampo
(Apéndice B). Cuando hicimos esto en mi laboratorio, descubrimos que durante esos eventos de
“ensayo y error vicarios” pausados, la representación del hipocampo se adelantó al animal,
primero hacia una posible elección futura, luego hacia la otra. 45 Así como mi amigo estaba
imaginando cómo sería aceptar un trabajo u otro, también la rata estaba imaginando qué
sucedería si fuera corriendo por el camino de la izquierda o por el camino de la derecha.
H Si los animales son conscientes o no es, por supuesto, una gran pregunta que depende en parte de la
pregunta: ¿Qué es la conciencia ?
40 Cuando daba charlas sobre nuestros datos de ensayo y error indirectos, me
gustaba responder a la inevitable pregunta sobre si las ratas estaban deliberando conscientemente sobre el futuro
diciendo que pensaba que era el mismo proceso que los humanos, pero que “ni Tolman ni yo usaríamos nunca la
palabra 'conciencia'”. Un día, después de oírme dar una de estas charlas, Adam Johnson me entregó el libro de
texto de Tolman de 1932 y me mostró la sección titulada “El ensayo y error indirecto es una prueba de la
conciencia en la rata”. 41 Por ahora, digamos simplemente que la cuestión de la conciencia es difícil.
Una observación importante que hicimos fue que estas representaciones eran secuenciales, coherentes y
seriales. Eran secuenciales en el sentido de que consistían en una secuencia de células que se activaban en el
orden correcto siguiendo un camino. Eran coherentes en el sentido de que las secuencias consistían en
representaciones precisas de lugares que se encontraban por delante del animal. Y eran seriales en el sentido
de que iban por un camino y luego por el otro, no por ambos. Nuestras ratas realmente estaban imaginando el
futuro .
Una cosa es imaginar el futuro, pero ¿cómo lograron nuestras ratas evitar perderse en sus pensamientos?
¿Cómo tomaron nuestras ratas la decisión? El siguiente paso en la deliberación es la evaluación.
Nuestra rata necesita ir más allá de decir “si voy a la izquierda obtendré bolitas de comida con sabor a plátano”
y decir “y las bolitas de comida con sabor a plátano son buenas”. Dos estructuras involucradas en la evaluación
son el cuerpo estriado ventral y la corteza orbitofrontal. Ambas estructuras están involucradas en la motivación
y a menudo son disfuncionales en la adicción a las drogas y otros síndromes con problemas de motivación.
47
Además, el estriado ventral recibe información directa de
la formación hipocampal. 48 El funcionamiento de la corteza orbitofrontal está modulado por la integridad del
hipocampo. 49 ¿Qué hacían estas estructuras cuando el hipocampo representaba estos
futuros potenciales?
Así como podemos registrar conjuntos neuronales del hipocampo y decodificar la representación espacial,
podemos registrar conjuntos neuronales del cuerpo estriado ventral o de la corteza orbitofrontal y decodificar
representaciones relacionadas con la recompensa. Descubrimos que tanto las células relacionadas con la
recompensa del cuerpo estriado ventral como las del cuerpo orbitofrontal (células que normalmente responden
cuando el animal recibe una recompensa) mostraron una actividad adicional en el punto de elección donde el
50
Se estaba produciendo ensayo vicario y Muenzinger, Gentry y Tolman estaban completamente en lo cierto: cuando
un error. Estas ratas se detienen y miran hacia adelante y hacia atrás en los puntos de elección, están probando
indirectamente las opciones potenciales, buscando en el futuro y evaluando esas posibilidades.
El sistema de toma de decisiones deliberativas tiene muchas ventajas. Es extremadamente flexible. Saber
que ir a la izquierda puede darte comida con sabor a plátano no te obliga a ir a la izquierda. Puedes tomar una
decisión sobre a qué universidad ir, qué trabajo aceptar, a qué ciudad mudarte, sin tener que pasar años
probando. Saber que una empresa te ha hecho una oferta de trabajo no te compromete a aceptarla. Pero la
deliberación es computacionalmente costosa. Se necesitan recursos y tiempo para calcular esas posibilidades
futuras potenciales. Si te enfrentas a la misma situación todos los días y la acción apropiada es la misma cada
vez, entonces no hay razón para perder ese tiempo replanificando y reevaluando esas opciones: simplemente
aprende cuál es la opción correcta y tómala.
El sistema procedimental es, a primera vista, mucho más simple: simplemente necesita reconocer la situación
y luego seleccionar una acción o secuencia de acciones almacenadas. 51 Esta es la teoría
I
Es importante señalar que nuestras ratas solo representaban el futuro inmediato. Si esto es episódico, es un pensamiento
Pensar en el futuro, 46 futuro de un futuro inmediato que solo está a unos pocos segundos de distancia. Los humanos pueden
imaginar el futuro dentro de días, meses, años, incluso siglos.
Machine Translated by Google
El aprendizaje procedimental asocia acciones con situaciones. Puede tomar la acción rápidamente porque
simplemente está buscando qué acción tomar, pero como simplemente está buscando cosas, no tiene la
flexibilidad para cambiar fácilmente si es necesario.
Para ver la distinción entre los sistemas Deliberativo y Procedimental, podemos imaginar una rata
entrenada para empujar una palanca para recibir bolitas de comida con sabor a fruta. Una vez que la rata ha
aprendido la tarea (empujar la palanca, obtener comida con sabor a fruta), cuando la rata es colocada
nuevamente en la caja experimental, empujará la palanca y comerá la comida. Podemos imaginar dos posibles
mecanismos de aprendizaje aquí: 52 “Si empujo la palanca, sale comida con sabor a fruta. Me gusta la comida
con sabor a fruta. Empujaré la palanca” o “Empujar la palanca es algo bueno que hacer. Cuando aparezca la
palanca, la empujaré”. La primera lógica corresponde al sistema Deliberativo (basado en la búsqueda,
predicción de resultados de acciones), mientras que la segunda lógica corresponde al sistema Procedimental
(acción almacenada en caché, automática, hábito, estímulo
sistema de respuesta).
Estos dos procesos cognitivos pueden diferenciarse cambiando el valor que la rata le da a la comida con
sabor a fruta. Por ejemplo, se le pueden dar bolitas de comida con sabor a fruta y luego cloruro de litio, una
sustancia química que no daña a la rata pero la hace sentir mal. 53 (El cloruro de litio a menudo hace que los
humanos vomiten). Cuando la rata es colocada nuevamente en la caja experimental, si está usando el sistema
deliberativo, la lógica se convierte en “Si empujo la palanca, sale comida con sabor a fruta. ¡Qué asco! Esa
cosa es repugnante. No empujes la palanca”. Si, en cambio, la rata está usando el sistema procedimental,
entonces la lógica se convierte en “Ahí está esa palanca. Debería empujarla”. Cuando sale comida con sabor
a fruta, la rata la ignora y no la come, pero sigue empujando la palanca. Estas dos reacciones dependen de
diferentes estructuras cerebrales, ocurren después de diferentes paradigmas de entrenamiento y requieren
cálculos computacionales diferentes. 54
La literatura de psicología de la vieja escuela a menudo hablaba de este sistema como “estímulo
respuesta”, con la idea de que las respuestas específicas (presionar una palanca) se vinculan a estímulos
específicos (se enciende la luz), pero ahora sabemos que las respuestas pueden ser bastante complejas
(lanzar la pelota al receptor) y que los estímulos se describen mejor como situaciones completas (está libre).
Un amplio trabajo experimental sobre los mecanismos del control motor muestra que el proceso de aprendizaje
procedimental puede reconocer situaciones muy complejas y parte de la clave para ser una estrella deportiva
Puede aprender secuencias de acciones muy complejas.57 exitosa o dar la respuesta policial correcta es la
capacidad de reconocer la situación y categorizarla correctamente.
58
Una vez categorizada la situación, se procede a la selección de acciones.
Machine Translated by Google
El proceso es simple. Una forma de pensar en la diferencia entre los sistemas deliberativo y procedimental
es que el sistema procedimental traslada toda la complejidad de la toma de decisiones al componente de
reconocimiento de la situación.
Una de mis escenas favoritas de esto está en la película Hombres de Negro. , 59 donde lo nuevo
El recluta (el futuro agente J, interpretado por Will Smith) se enfrenta a una escena simulada de ciudad y
decide ignorar todos los recortes de alienígenas aterradores y dispararle a la niña. Cuando el agente jefe
Zed le pregunta por qué le había disparado a la “pequeña Tiffany” responde explicando que cada alienígena
parecía aterrador pero que solo estaba “tratando de llegar a casa” o “estornudando de verdad”, pero que “la
pequeña Tiffany era una niña de ocho años que llevaba libros de texto de mecánica cuántica por una calle
insegura de la ciudad por la noche”. El punto, por supuesto, es que el agente J tenía excelentes habilidades
de categorización de situaciones y notó las sutilezas (como el pañuelo del alienígena aterrador y los libros
de texto cuánticos de la pequeña Tiffany) y pudo reaccionar rápidamente a las preguntas.
situación correcta
Los datos actuales sugieren firmemente que el sistema procedimental incluye los ganglios basales,
particularmente los circuitos de los ganglios basales dorsales y laterales, comenzando con el núcleo
caudado y el putamen, que reciben entradas de la corteza. Estas conexiones
sinápticas entre los circuitos corticales (que se cree que representan información sobre el mundo) son
entrenadas por señales de dopamina. 62 Si recuerdas nuestra discusión sobre el
valor, la euforia y la señal de "hazlo de nuevo" (Capítulo 4), recordarás que la dopamina señaló el error en
nuestra predicción de cuán valiosas eran las cosas 63 —si las cosas salieron mejor de lo esperado, hubo
un aumento de dopamina y queríamos aumentar nuestra disposición a tomar una acción; si las cosas fueron
peores de lo esperado, hubo una disminución de dopamina y queríamos disminuir nuestra disposición a
tomar una acción; y si las cosas salieron como esperábamos, entonces no necesitábamos aprender nada
sobre qué hacer en esa situación. La conexión entre la corteza y el caudado/putamen codifica nuestra
"disposición a tomar una acción" y es entrenada por estas señales de dopamina.
Sistemas de apoyo
La mayoría de las acciones requieren que movamos nuestros músculos. Esto es así tanto si corremos por la
calle, nos damos la vuelta para enfrentar a un adversario, sonreímos o fruncimos el ceño, o firmamos en una
línea de puntos. Al final, movemos nuestros músculos y tenemos un efecto en el mundo. Incluso el habla es
movimiento muscular. Como sistema de apoyo, a menudo se lo denominaría el sistema de “control motor”,
porque es el paso final en la interacción física con el mundo. Para completar, probablemente valga la pena
incluir las acciones no motoras dentro de este sistema de apoyo. Por ejemplo, en nuestra descripción de la
selección de acciones pavloviana, los perros de Pavlov estaban salivando, liberando un líquido en sus bocas,
lo que en realidad no es un movimiento muscular.
De la misma manera, el sobrecalentamiento provoca sudoración, que tampoco es realmente un movimiento
muscular. Sin embargo, la mayoría de los efectos del sistema de acción física son motores.
movimientos.
Los detalles de cómo funcionan los músculos se pueden encontrar en cualquier libro de texto de medicina.
descripciones. 64 La cuestión importante para Muchos libros de texto de neurociencia tienen buenas
nosotros es que dentro del sistema de control motor (acción física), los bloques de construcción no son
movimientos musculares individuales, sino más bien componentes hechos de conjuntos de movimientos
65
no relacionados, llamados sinergias musculares . Pero incluso dentro de esas sinergias musculares,
colocamos un pie abajo , talón a punta, colocamos el otro abajo y levantamos el primer pie; no ponemos
nuestros pies un paso a la vez; en cambio,
El caminamos .
caminar humano, como el nadar de un pez o una lamprea, es un
ejemplo de un proceso llamado generador de patrones centrales , llamado así porque es capaz de generar
sin entrada externa. Pueden continuar oscilando sin entrada, pero puedenuna secuencia de manera central,
modificarse directamente a partir de señales sensoriales externas y también de señales de arriba hacia abajo
(presumiblemente de los mismos sistemas de selección de acción).
Dado que nuestro objetivo en este libro es comprender el proceso de selección de acciones, vamos a
eludir la cuestión de cuáles son esas acciones a nivel de control motor individual, pero obviamente estos
procesos pueden ser muy importantes clínicamente.
Percepción
Al igual que el termostato con el que comenzamos al principio del libro (Capítulo 2), para
tomar las acciones adecuadas en el mundo, uno necesita percibir el mundo. Por supuesto,
nuestros sistemas perceptivos son mucho más complejos que simplemente medir la
temperatura. Los sistemas perceptivos humanos toman información sobre el mundo a
partir de señales sensoriales, procesan esa información y la interpretan. Aunque nuestros
ojos transforman la luz (fotones) en actividad neuronal, no vemos los fotones en sí, vemos objetos.
El árbol que está fuera de mi ventana, el carbonero saltando de rama en rama. De manera similar, nuestros
oídos detectan vibraciones en el aire, pero oímos sonidos: el silbido del viento, el canto del carbonero.
Al igual que con el sistema de acción física, los detalles de cómo funcionan los sistemas perceptivos se
pueden encontrar en muchos libros de texto de neurociencia. Fisiología del comportamiento y Avi de Neil Carlson
J Por supuesto, es posible colocar conscientemente nuestros pies paso a paso, pero esto implica que uno de nuestros
sistemas de selección de acciones tome el control de un subconjunto de movimientos motores. Este es un ejemplo de
, en el que los
arquitectura de subsumpción . nuevos sistemas no sustituyen a los antiguos, sino que les añaden bucles de control. 66
Machine Translated by Google
Los Fundamentos de la percepción sensorial de Chaudhuri son excelentes puntos de partida. No dedicaremos
mucho tiempo a la transición de la realidad física a la actividad neuronal (de los fotones a la vista, de las
vibraciones al sonido), pero sí dedicaremos algo de tiempo a explorar cómo los sistemas neuronales categorizan
la percepción para identificar objetos y extraer información de esas señales sensoriales (véase el capítulo 11).
Reconociendo la situación
Cuando los psicólogos clásicamente probaban animales en experimentos de aprendizaje, utilizaban individuos...
estímulos identificables individualmente para que pudieran controlar las variables en sus experimentos. 68;K
Pero, ¿cuál es la señal importante en el mundo en este momento? Estoy escribiendo este párrafo en un portátil
Lenovo negro, sentado en un escritorio cubierto de madera y vidrio de color marrón oscuro, escuchando la
guitarra quejumbrosa de Carlos Santana, mirando por la ventana hacia la oscuridad (son las 6 de la mañana en
invierno). Afuera, una farola ilumina la intersección vacía, la sombra de un árbol se cierne sobre mi ventana, hay
nieve en el suelo y puedo ver los copos de nieve cayendo. La luz sobre mi escritorio se refleja en la ventana. A
mi lado están mis notas.
¿Cuáles de estas señales son importantes para la situación? Si algo sucediera, ¿qué identificaría como importante?
Aunque es una idea controvertida, mi intuición actual es que el neocórtex es una gran máquina de
reconocimiento de situaciones. Básicamente, cada sistema cortical clasifica la información sobre el mundo. La
corteza visual reconoce características de las imágenes que vemos; la corteza auditiva reconoce características
de los sonidos que escuchamos. También hay componentes de la corteza que reconocen características más
abstractas: la corteza parietal reconoce la ubicación de los objetos que nos rodean; la corteza temporal reconoce
qué son esos objetos.
Hay un área de la corteza que reconoce caras y un área que reconoce la habitación.
Estás dentro. 70 Incluso la corteza motora puede verse como una categorización de acciones potenciales. 71
A medida que uno avanza desde la parte posterior del cerebro (donde tienden a estar las cortezas sensoriales)
hacia la parte frontal del cerebro, las categorías se vuelven cada vez más abstractas, pero la estructura cortical
se conserva notablemente y la estructura del proceso de categorización no parece cambiar mucho. 72
Los modelos dirigidos a cada una de estas cortezas individuales parecen funcionar a través de un proceso
llamado memoria direccionable por contenido
73. La memoria direccionable por contenido se puede distinguir del
tipo de memoria indexada con la que estamos familiarizados en las computadoras típicas porque la memoria
direccionable por contenido recupera la memoria completa a partir de una parte de la memoria, mientras que la
memoria indexada se recupera a partir de un identificador no relacionado. Una imagen de la fiesta de cumpleaños
de su hija almacenada en su computadora podría titularse IMG3425.jpg (memoria indexada, sin relación entre el
título y el tema), pero el recuerdo se recuperaría en su cerebro a partir de una sonrisa en su rostro, una torta,
velas que se apagan...
K Por supuesto, los experimentos se llevan a cabo en presencia de otras abundantes señales, como la caja, la habitación o el laberinto
experimentales. Estas otras señales suelen identificarse en una descripción general llamada "contexto". Las diferencias específicas entre el
contexto y las señales son muy complejas y sutiles y parecen tener que ver con las diferencias entre las señales ambientales (la habitación
en la que estás) y las señales de objetos pequeños (una luz o un tono) y con las diferencias en la estabilidad (los contextos son estables) y
la variabilidad (las señales de los objetos cambian rápidamente). Sin embargo, parece claro que el contexto y las señales individuales son
Motivación
Por último, necesitamos un sistema de motivación, que incluye dos componentes importantes: primero,
¿cuáles son los objetivos que necesitamos alcanzar? (queremos tomar acciones diferentes si tenemos
hambre o si tenemos sed) y segundo, ¿qué tan duro debemos trabajar para alcanzar esos objetivos?
(La sed que tengamos se traducirá en la desesperación que tengamos por encontrar agua). Veremos que
ambas cuestiones están relacionadas con el concepto de valor que analizamos por primera vez en el
Capítulo 3.
Históricamente, estas cuestiones se han abordado mediante la reducción de los “impulsos” innatos. 76
Pero, ¿qué crea esos impulsos? Sin duda, existen algunas motivaciones para mantener nuestro equilibrio
homeostático interno, pero las personas a menudo comen cuando no tienen hambre. ¿Por qué?
yo
La homeostasis es el mantenimiento de un parámetro interno en un nivel determinado. Por ejemplo, los mamíferos son
animales de sangre caliente y tratan de mantener su temperatura en un nivel determinado. Cuando tenemos frío, temblamos,
nos abrigamos o buscamos fuentes de calor. Cuando tenemos calor, sudamos, jadeamos o buscamos charcas en las que nadar.
Machine Translated by Google
Para entender esto, es necesario tener en cuenta dos conceptos adicionales: primero, el de las funciones de
recompensa intrínsecas77 y segundo, el del papel del aprendizaje en los cálculos de valor. 78
Nuestro complejo sistema de toma de decisiones evolucionó porque los animales que tomaban mejores
decisiones eran más capaces de sobrevivir y encontrar mejores parejas, tenían más probabilidades de
procrear y de tener descendencia que sobreviviera a sí misma. 79 Pero no hay nada en este proceso que
requiera que las razones proximales para las decisiones estén relacionadas con cualquiera de estos
objetivos evolutivos. En cambio, lo que la evolución tiende a hacer es encontrar objetivos que están
correlacionados con estos factores. Por ejemplo, un animal que viviera en un entorno donde la comida era
escasa tendría menos probabilidades de morir de hambre y más probabilidades de sobrevivir si comiera
80
siempre que hubiera comida disponible, tuviera hambre o Pero ¿qué sucede cuando estos intrínsecos...
no. ¿Estos procesos ya no rastrean la supervivencia? ¿Qué sucedería con una especie que hubiera
evolucionado para comer siempre que hubiera comida disponible pero que ahora se enfrentara a una sobreabundancia
81
Engordaría y aparecerían nuevas enfermedades, como la diabetes.
Podemos ver ejemplos de cómo las funciones de recompensa intrínseca correlacionadas con el éxito
evolutivo pueden corromperse en muchos animales y en muchas situaciones. A los perros les encanta perseguir
animales grandes (por ejemplo, ciervos, alces, etc.). Lo hacen porque así es como obtienen su alimento.
Ese era su nicho evolutivo. Los perros domésticos persiguen coches. Está bastante claro que si un perro alguna
vez atrapara un coche, no podría comérselo. Pero persiguen coches por el mero placer de perseguirlos. En los
humanos, el ejemplo clásico es la pornografía. A los hombres les gusta mirar a mujeres bonitas porque sentirse
atraídos por una mujer hermosa los ayuda a juzgar quién sería la mejor pareja, pero leer Playboy o ver pornografía
imaginaren Internet no va a ayudar a los hombres a encontrar pareja, mejores parejas. De hecho, uno podría
fácilmente un argumento de que estas opciones no reproductivas perjudican la capacidad de encontrar mejores
parejas.
Así pues, sí, tenemos impulsos que están directamente relacionados con el éxito evolutivo (el hambre, la
sed, el sexo) y tenemos funciones de recompensa intrínsecas que están correlacionadas con el éxito evolutivo
(la persecución de una presa, la atracción por la belleza). Pero también hay un componente aprendido en la
motivación de los mamíferos. Este componente aprendido se puede ver tanto en aumentos (o disminuciones)
generalizados de la excitación como en aumentos o disminuciones específicos de la disposición a trabajar por
una recompensa determinada.
¿Se da también este componente de aprendizaje en los seres humanos? En realidad, se trata de uno de los
efectos mejor comprobados en los drogadictos: ver los accesorios de su droga preferida provoca un deseo
85
intenso de consumirla y un aumento de las acciones que conducen a su consumo.
Los símbolos de marketing (CocaCola, McDonald's) aumentan nuestras percepciones internas de sed o hambre
y hacen que sea más probable que la gente vaya a comprar un refresco o una hamburguesa. 86 Todos estos son
ejemplos del sistema motivacional que impulsa otros sistemas de acción.
M En la actualidad, existen pruebas bastante sólidas de que muchos (pero no todos) los estándares de belleza se correlacionan realmente con la salud y la
fertilidad (tanto para hombres como para mujeres). Por supuesto, este es solo otro ejemplo de una función de recompensa intrínseca: ciertas características (como
una proporción específica entre el pecho y la cintura y la cadera, la simetría de la cara) se correlacionan con la fertilidad, por lo que las personas se sienten atraídas
por esas características. 82 Estas características indican salud y fertilidad y llamamos "bellas" a las personas con esas características. Por supuesto, en los humanos,
tener hijos exitosos que logren tener sus propios hijos es mucho más complejo que la simple salud, 83 lo que puede explicar por qué los humanos encuentran a otros
84
atractivo.
Machine Translated by Google
interacción entre los sistemas pavlovianos emocionales y otros sistemas de toma de decisiones más complejos
(deliberativo, procedimental).
Resumen
La toma de decisiones conductuales se produce como consecuencia de una serie de sistemas diferentes que
interactúan entre sí. Hemos identificado cuatro sistemas de selección de acciones (reflejo, selección de acciones
pavloviana, deliberativo y procedimental) y cuatro sistemas de apoyo (realización de la acción física, percepción,
reconocimiento de la situación y motivación). Uno de los hechos notables que ha ocurrido en las últimas décadas es la
convergencia de diferentes campos en estos múltiples sistemas de toma de decisiones. Varios campos han estado
examinando cómo interactúan diferentes agentes entre sí y con el mundo (por ejemplo, la psicología y la psiquiatría
humanas, la teoría del aprendizaje animal, la robótica y la teoría del control, la inteligencia artificial y la neurociencia,
incluidos tanto el modelado computacional como los nuevos campos de la neuroeconomía y la psiquiatría
computacional). 91
Una de las cosas que me motivó a escribir este libro ha sido la observación de que estos diferentes campos
parecen estar convergiendo en una categorización similar de los sistemas de toma de decisiones. Incluso los debates
dentro de los campos son similares: por ejemplo, ¿el cálculo del valor dentro de los sistemas basados en búsquedas
(deliberativos) y de acciones almacenadas en caché (procedimentales) es independiente o unitario? 92 (He
argumentado aquí y en otros lugares que son independientes, pero la cuestión está lejos de estar resuelta).
Por ejemplo, los especialistas en robótica han llegado a la conclusión de que se necesitan múltiples niveles de
sistemas de toma de decisiones: sistemas rápidos, de bajo nivel y cableados (no chocar contra las paredes; un sistema
reflexivo), así como procesos de búsqueda más lentos (lentos pero flexibles; un sistema deliberativo) y procesos
rápidos de acción almacenada en caché (rápidos pero inflexibles; un sistema procedimental ). 93
Los científicos informáticos que estudian la inteligencia artificial y los neurocientíficos computacionales que
intentan modelar la toma de decisiones animal han identificado estos sistemas en términos de sus expectativas: los
sistemas pavlovianos crean una expectativa de un resultado y conducen a acciones incondicionadas relacionadas con
ese resultado; los sistemas deliberativos buscan entre futuros potenciales, producen una expectativa del resultado y la
evalúan; los sistemas procedimentales
Los sistemas evalúan directamente las acciones en respuesta a situaciones específicas. 94
De manera similar, los teóricos del aprendizaje que trabajan en los campos de la psicología y el aprendizaje animal
95
Identificar tres sistemas. En primer lugar, existe un sistema de estímuloresultado en el que las reacciones
incondicionadas asociadas con los resultados pasan de ser realizadas en respuesta al resultado a ser realizadas en
respuesta al estímulo (pensemos en los perros de Pavlov que salivan en respuesta a una señal que predice una
recompensa de comida). En segundo lugar, identifican un sistema de acciónresultado en el que los animales aprenden
qué resultados se producirán si realizan una acción determinada. Estas acciones se realizan para lograr ese resultado
esperado. En tercer lugar,
norte
Una de las cosas que veremos al final de este libro (capítulos 22 al 24) es evidencia de que parte
88
La moralidad humana surge porque somos criaturas sociales que hemos evolucionado para vivir en grandes
sociedades, con funciones de motivación intrínsecas basadas en imponer la cooperación.
89 Como decía Aristóteles, “somos animales políticos”. 90
Machine Translated by Google
Matt hijs AA van der Meer, Zeb KurthNelson y A. David Redish (2012)
Procesamiento de información en sistemas de toma de decisiones. El neurocientífico, 18,
342–359 .
• Yael Niv, Daphna Joel y Peter Dayan (2006) Una perspectiva normativa sobre la motivación
ción . Tendencias en Ciencias Cognitivas, 10, 375–381 .
• Mortimer Mishkin y Tim Appenzeller (1987) La anatomía de la memoria. Scientific 256
Americano, (junio), 80–89.
Machine Translated by Google
Reflejos
La geografía de la concha
recuerda la natación, la lenta
expansión y contracción de los siglos, el recuerdo de una orilla
lejana, ahora sólo mar abierto.
El reflejo es el sistema de toma de decisiones más simple. Implica una reacción simple basada en reglas.
En cierto sentido, el termostato es un reflejo. Cuando hace demasiado calor, el termostato enciende el aire
acondicionado; cuando hace demasiado frío, el termostato enciende la calefacción. En los animales, una regla
refleja está preprogramada en el agente, presumiblemente genéticamente. Esto significa que podemos imaginar
la regla como algo aprendido a lo largo de escalas de tiempo evolutivas. Los animales que tenían respuestas
apropiadas (retirar la mano de un estímulo doloroso que quemaba) tenían más probabilidades de sobrevivir y
de tener hijos que sobrevivieran. Pero fundamentalmente, la clave de un reflejo es la simplicidad de la regla y
1
su naturaleza preprogramada.
Las ventajas de un reflejo son (1) que puede responder muy rápidamente y (2) debido a que se ha aprendido
a lo largo de la evolución, está presente desde el principio en un animal y el animal puede reaccionar
correctamente la primera vez que encuentra el estímulo. No tienes que aprender a apartar la mano de una
estufa caliente. (Realmente deberías aprender a no tocar la estufa caliente en primer lugar. Pero ese es un
sistema diferente.)
Los reflejos son cosas simples: las neuronas sensoriales reconocen el estímulo y estas neuronas se
conectan, ya sea directamente o a través de una o más neuronas intermedias, con las neuronas que toman
acción y que impulsan los músculos. 2 En los vertebrados, esto generalmente ocurre en la médula espinal
porque cuanto más rápido pueda actuar el sistema, mejor será el reflejo evolutivamente. Recuerde, los reflejos
responden a estímulos ya presentes. Es decir, su
61
Machine Translated by Google
La mano se está quemando. Cuanto más espere, más daño se le está haciendo a sus tejidos. Tener las neuronas que
responden lo más cerca posible del estímulo permite que el sistema reaccione rápidamente. Llevar el mensaje hasta el
cerebro lleva tiempo.
Las fibras nerviosas mielinizadas transportan potenciales de acción a una velocidad de 150 metros por segundo .
Dado que la distancia entre tu mano y tu cabeza es de aproximadamente un metro, el viaje de tu mano a tu cabeza y
viceversa podría tomar 14 milisegundos. Dado que tus dedos se están quemando, son 14 milisegundos que no tienes.
(Imagina cuánto tiempo tardaría una señal en ir desde el pie hasta el cerebro de una jirafa o desde la cola hasta la
cabeza de una ballena azul). Las respuestas reflejas, por lo tanto, tienden a estar ubicadas en la médula espinal, que
está más cerca
A la acción.
Los reflejos pueden ser simples conexiones entre una neurona sensorial y una neurona motora, o
incluso entre una neurona sensorial y el propio músculo, pero en la práctica la mayoría de los reflejos
tienen neuronas intermedias entre la neurona sensorial y la neurona motora.
4
Una pregunta interesante es por qué
a menudo hay una etapa intermedia dentro del reflejo, dado que el tiempo entre la detección y la respuesta es tan
valioso. La presencia de neuronas intermedias proporciona etapas adicionales en las que los sistemas de toma de
decisiones superiores y más complejos pueden intervenir para cambiar las respuestas.
5 Así es como podemos evitar que los reflejos actúen si así lo deseamos.
Pensemos, por ejemplo, en aquella escena de Lawrence de Arabia de la que hablamos en el capítulo 6.
Normalmente, Lawrence respondería arrojando reflexivamente la cerilla o sacudiéndola cuando la llama llega a sus
dedos, pero con su voluntad indomable, Lawrence se niega a dejar que sus reflejos reaccionen y mantiene la cerilla
firme. La presencia de neuronas intermedias permite más controles para que los otros sistemas manipulen, pero también
aumenta el tiempo que tarda la decisión en pasar del sensor a la acción. Algunos reflejos no incluyen neuronas
Ejemplos clásicos de reflejos son los reflejos de huida, como los sensores de viento en los insectos y las neuronas
oculomotoras de giro cruzado (visual [oculo] a motora) en los peces de colores. 7
Los insectos como los grillos y las cucarachas tienen un conjunto de pelos muy
pequeños en las antenas de sus colas. Cada pelo puede ser arrastrado por el viento, pero solo
puede moverse en una única dirección, de ida y vuelta. Esto significa que la cantidad de movimiento
del pelo depende de la dirección del viento: el viento que está alineado con el pelo lo moverá más;
el viento que está desviado 90 grados lo moverá menos. Estos pelos (sensores del viento) se
proyectan a cuatro interneuronas que representan las cuatro direcciones cardinales (adelante,
atrás, izquierda, derecha). Estas interneuronas se proyectan a las estructuras de control de los
músculos de las patas y hacen que el animal se aleje de ese viento. ¿Por qué el insecto tiene este
reflejo de respuesta al viento altamente evolucionado? Porque puede huir de un zapato que lo
pisotea en menos de 20 milisegundos.
Existe un sistema similar en los peces de colores que conecta el reconocimiento de señales visuales de un lado con
un giro repentino hacia el otro. Un pez de colores puede identificar que hay una señal inminente (como un depredador
que se come a un pez de colores, como un ave que se zambulle) y comenzar a alejarse en menos de 20 milisegundos.
Los peces de colores pueden alcanzar velocidades de 22 longitudes corporales por segundo en menos de 20 milisegundos.
A
Las neuronas comunican información enviando picos o potenciales de acción a lo largo de sus axones de
salida. Una fibra nerviosa (como las que conectan la médula espinal con el cerebro) es simplemente un conjunto de
axones alineados en la misma dirección. La velocidad de desplazamiento de estos potenciales de acción a lo largo
de una fibra nerviosa depende de varias propiedades, entre ellas, si los axones están o no rodeados de mielina, una
forma de células gliales “auxiliares”. 3
Machine Translated by Google
Reflejos 63
Aproximadamente 10 milisegundos desde el inicio del movimiento. ¡Eso es increíblemente rápido! Es de suponer
que este notable reflejo evolucionó porque el pez dorado y el pájaro que se zambulle están en una carrera
armamentista para ver quién es el más rápido, el pájaro hambriento o el pez dorado que huye.
Los reflejos pueden cambiar y, por supuesto, cambian a lo largo de una vida (los animales tienen ciclos vitales;
los renacuajos y las ranas probablemente necesitan reflejos muy diferentes para sobrevivir en los entornos muy
diferentes en los que habitan), pero estos cambios están preprogramados en el desarrollo. Los bebés humanos, por
ejemplo, tienen un reflejo en el pie llamado reflejo de Babinski, en el que los dedos se curvan y se abren siguiendo
un patrón específico en respuesta a las caricias en la planta del pie. El reflejo es completamente normal (y se utiliza
para comprobar la integridad de la médula espinal) en los bebés. Con el desarrollo del tracto corticoespinal (las
conexiones de la corteza cerebral a la médula espinal), el reflejo desaparece. En los adultos, un reflejo de Babinski
indica daño en la médula espinal, desacoplando la información cortical de la base de la médula espinal. 8
El problema de los reflejos es su inflexibilidad. Los reflejos se aprenden en una escala temporal evolutiva; están
preprogramados genéticamente en la criatura. Aunque los reflejos cambian en respuesta a estímulos repetidos, los
mecanismos de estos cambios no son particularmente complejos y los cambios potenciales son muy limitados.
Estos efectos han sido estudiados en detalle de manera más famosa en el reflejo de retracción branquial de la aplysia.
9 Una aplysia es una
especie de babosa marina, con una branquia ancha y delgada que flota en su espalda. (Imagínese un caracol sin
concha y un par de abanicos de seda). Utiliza esta branquia para respirar oxígeno fuera del agua. Pero, por supuesto,
esta branquia es frágil y se daña fácilmente. Imaginemos a la aplysia en el agua: las olas se intensifican y la aplysia
retrae su branquia. Pero si las olas van a ser grandes durante mucho tiempo y no empeorar, entonces necesita
abrirse de nuevo. La aplysia puede aprender a ignorar un estímulo repetido (es decir, puede habituarse). Sin
embargo, incluso estos cambios potenciales están preprogramados.
Por ejemplo, el reflejo de retracción branquial en la aplisia puede aumentar su respuesta a ciertos estímulos (es
decir, puede sensibilizar), pero estos cambios se deben a conexiones preestablecidas entre neuronas específicas.
Si bien la evolución puede hacer que las poblaciones cambien con bastante rapidez (en el orden de un par de
generaciones), los reflejos B no se aprenden en una sola vida. 11 Para aprender a responder de manera diferente a
diferentes situaciones, es necesario recurrir a uno de los otros sistemas de toma de decisiones.
B
Un ejemplo maravilloso de la velocidad del cambio evolutivo que mueve los fenotipos dentro de las poblaciones
son las polillas blancas y negras que cambiaron su distribución en respuesta al smog en la Inglaterra industrial, donde
una población de polillas moteadas cambió de ser mayoritariamente blanca a mayoritariamente oscura cuando la
contaminación del carbón oscureció los cielos y los árboles de Inglaterra a fines del siglo XIX, y luego cambió de ser
mayoritariamente oscura a volver a ser mayoritariamente blanca cuando se controló la contaminación. 10 Se pueden ver
ejemplos más detallados de cuán rápidamente la evolución puede cambiar las poblaciones en los estudios de Rosemary
y Peter Grant que midieron la forma y la longitud de los picos de los pinzones en las Islas Galápagos. Los estudios de
pinzones de los Grant se describen en detalle en The Beak of the Finch de Jonathan Wiener .
Machine Translated by Google
Debido a que el reflejo se entiende tan bien, está bien descrito en muchos libros de texto médicos y de
neurociencia, como
• Robert C. Eaton (1984) Mecanismos neuronales del comportamiento de sobresalto Nueva York: Springer
Editorial.
Un libro encantador que muestra cuán complejas pueden ser las reacciones preprogramadas es
La emoción y el pavloviano
Sistema de selección de acciones
Aunque no se suele pensar en ellas en términos de selección de acciones, las emociones son un mecanismo de selección
de acciones. 1
Cada emoción es un conjunto de respuestas que se han aprendido a lo largo
de escalas de tiempo genéticas para que sean útiles. Por ejemplo, en situaciones peligrosas, dependiendo de las
caracterizaciones emocionales de la situación, uno se asusta y su cuerpo se prepara para huir, para ponerse de pie y
luchar, o para someterse, a veces denominada respuesta de lucha o huida (o más exactamente, respuesta de lucha
huidaparálisis).
Existe un debate en la comunidad científica sobre si la categorización
2
El proceso de transformación de lo que conscientemente etiquetamos como emociones es consistente entre individuos.
Estas preguntas se centran más en la cuestión de las etiquetas que damos conscientemente a las emociones que en el
efecto físico de esas emociones: nadie niega que la ira nos prepara para luchar, pero otras emociones (como el miedo)
también nos preparan para ello. Aunque una situación determinada puede hacer que una persona se enfade y otra sienta
miedo, los animales (incluidos los humanos) tienen conjuntos de respuestas coherentes ante situaciones coherentes.
Volveremos a la relación entre estos conjuntos de respuestas y las emociones más adelante en este capítulo.
65
Machine Translated by Google
La ventaja de tener un sistema con estos conjuntos de respuestas es que hay un complejo de
acciones internas relacionadas con el cuerpo que deben funcionar correctamente la primera vez. No
tienes la oportunidad de aprender a huir del león. Puedes aprender que un susurro en la hierba
probablemente significa que un león te está acechando. Y así puedes aprender a huir del susurro en la
hierba. De hecho, puedes aprender que un susurro en la hierba significa que un león te está acechando
incluso sin ser acechado. Puedes aprenderlo observando a un león acechando a otro animal, o puedes
aprenderlo escuchando una historia vívida junto al fuego, o de alguna otra manera. En cualquier caso,
lo que realmente has aprendido es que los leones que acechan a sus presas producen un susurro en
la hierba. Entonces, cuando escuchas el susurro, te das cuenta de que hay un león, y tienes la misma
respuesta emocional que si un león apareciera de repente frente a ti.
Lo que se necesita es un sistema que pueda reconocer el peligro e implementar todos los cambios
corporales rápidamente, de una sola vez. Ese sistema es el sistema de selección de acciones
pavloviano, en el que una acción aprendida genéticamente ocurre en respuesta a una situación dada
basada en una caracterización emocional de la misma ( me gusta, me acercaré a ella. Tengo miedo de
ella, huiré de ella. Estoy enojado con ella, la atacaré. No tengo adónde correr, me congelaré de miedo
y espero que no me mate ). 3
En los experimentos de psicología clásica, el aprendizaje pavloviano se describe como lo que se
aprende cuando el animal no tiene que realizar una acción para obtener el resultado.
En la práctica, el animal hace algo para prepararse para el resultado esperado: el perro saliva, la rata
se congela .
5—
En un tiempo se suponía que el animal estaba aprendiendo que las señales se dan simultáneamente;
sin embargo, ahora sabemos que el condicionamiento pavloviano implica el reconocimiento de contingencias
informativas: los animales aprenden que cuando hay una señal, es más probable que sucedan ciertas
cosas. Una señal omnipresente no es informativa. 6 Los animales pueden incluso aprender que ciertas
señales predicen que un evento no ocurrirá. Como muestra el ejemplo del león al comienzo de este
capítulo, estamos aprendiendo que una señal predice un resultado. (La campana de Pavlov también
funcionaba de esta manera: se hacía sonar la campana y luego se alimentaba al perro). Dicho de esta
manera, la parte de aprendizaje de la selección de acción pavloviana es que un estímulo (el susurro en la
hierba, el sonido de una campana) predice un resultado (un león te está acechando, la comida está
llegando). A partir de esa predicción, puedes tomar la acción apropiada (¡corre!, saliva).
Cuando se estudia en experimentos de psicología clásica, la parte de selección de acción del sistema de
selección de acción pavloviano a menudo se considera como respuestas conductuales específicas de la
y respuestas de aproximación o evitación, especie7 , pero los cambios más grandes son, de hecho, somáticos.
cambios en el propio cuerpo. 8 En respuesta al miedo, por ejemplo, aumenta la frecuencia cardíaca (al
igual que la fuerza de cada latido) para hacer llegar más sangre a los músculos, las vías respiratorias de los
pulmones se dilatan para permitir la entrada de más oxígeno y se producen una serie de otras respuestas que
preparan al animal para luchar o huir. La atención aumenta, lo que aumenta la capacidad de percibir estímulos.
Una de las mejores maneras de medir el miedo de un animal es medir las respuestas de sobresalto
en una situación dada. Un sonido sorprendente literalmente hace que el animal salte; en condiciones
de mayor anticipación al peligro (miedo), el animal saltará más alto. Al medir la fuerza de los músculos
cuando el animal salta, se puede medir cuantitativamente su preparación para la acción y su miedo. 9
Por supuesto, también se observan los mismos efectos en los seres humanos. Una vez, cuando
estaba montando mi laboratorio, me preocupaba si podría conectar de forma segura un componente
de computadora muy caro sin apagar el ordenador primero. (El ordenador estaba en proceso de
Machine Translated by Google
(Estaba realizando un cálculo muy largo y no quería interrumpirlo, pero necesitaba acceder a esa parte).
La noche anterior, una nueva unidad Zip (una especie de unidad portátil especializada antes de que
existieran las unidades flash USB) se había incendiado y quemado en mi casa (con hermosas chispas
azules), por lo que estaba razonablemente nervioso por conectar esta parte tan cara. Expresé mi
preocupación al laboratorio y decidí que debería ser yo quien la conectara para que, si algo salía mal,
fuera culpa mía. Mientras esperaba nerviosamente para conectar la parte, sin que yo lo supiera, uno de
mis estudiantes de posgrado se había acercado sigilosamente por detrás de mí. En el instante en que
conecté la parte, mi estudiante susurró "¡bzzzzt!" en mi oído.
Debí haber saltado un metro en el aire.
Otro efecto relacionado en los seres humanos es que tendemos a sudar cuando estamos
emocionalmente excitados. 10 Como el sudor es básicamente agua salada, conduce la electricidad, y
esto se puede medir por un aumento de la conductancia de la piel. Incluso los cambios muy sutiles se
pueden detectar como un cambio en la conductividad de la piel. Estos cambios se conocen como la
respuesta galvánica de la piel (GSR) o la respuesta de la conductancia de la piel (SCR) y son una medida
sorprendentemente confiable de la excitación emocional.
A
Neurofisiológicamente, estas respuestas están controladas por pequeños haces de neuronas en la
base del cerebro, llamado hipotálamo, B y por estructuras en la parte superior de la
D
médula espinal, particularmente la capa gris periacueductal
C y la amígdala.
Estas estructuras cerebrales interactúan con el resto del cuerpo a través de un circuito de
retroalimentación entre el hipotálamo en el cerebro y los órganos del cuerpo a través de las hormonas
que circulan en la sangre. El hipotálamo envía información a (y recibe señales de) una estructura llamada
glándula pituitaria, que es un conjunto de glándulas liberadoras de hormonas y
12
células detectoras de hormonas que traducen señales neuronales hacia y desde señales hormonales.
Esta vía desde el cerebro hasta el cuerpo es en realidad un circuito completo que incluye señales
de las hormonas al resto del cerebro también. Las neuronas del cerebro son células y, por lo tanto,
requieren nutrientes, que obtienen de la sangre. Estas hormonas (como la adrenalina,
A Estos pequeños haces se les llama “núcleos”, que no deben confundirse con el núcleo de la célula. La palabra
núcleo (del latín “grano” o “nuez”) simplemente significa una concentración central. En un átomo, el núcleo (de donde
obtenemos “bombas nucleares” y “física nuclear”) es la concentración central de partículas. En una célula, un núcleo es
el depósito central del ADN. Y en el cerebro, un núcleo es una concentración de células que forma un objeto separable
e identificable anatómicamente.
B
Hipo (abajo) + tálamo (otra parte del cerebro).
do
Una pequeña estructura de materia gris (cuerpos celulares neuronales) que rodea una bolsa de líquido
cefalorraquídeo en la base del cerebro ( periacueductal , cerca del acueducto). La sustancia gris periacueductal se
encuentra en el camino del tracto espinotalámico, donde las células de la médula espinal envían información hacia el
tálamo y las células talámicas envían información de regreso hacia la médula espinal.
D
Un pequeño núcleo (kernel) de células ubicado entre la corteza orbitofrontal y la estría ventral.
Tum, con forma de almendra. Amygdala es la palabra latina para almendra.
mi
En realidad, el cerebro de los mamíferos tiene una etapa intermedia entre la sangre y el cerebro, formada por una
especie de células gliales que filtran las sustancias químicas de la sangre, de modo que sólo determinadas sustancias
químicas pueden pasar de la sangre al cerebro. Los capilares están rodeados por paredes muy herméticas formadas
por estas células gliales para impedir que pasen cosas grandes (¡como las bacterias!). En los libros de texto de medicina,
esto se denomina barrera hematoencefálica y es una de las razones por las que ciertos fármacos afectan principalmente
al cuerpo, mientras que otros lo hacen principalmente al cerebro. Muchas de las hormonas de las que estamos hablando
sí se traducen a través de la barrera hematoencefálica, pero otras no. La barrera hematoencefálica es más débil en las
partes del cerebro donde viven estas estructuras liberadoras y detectoras de hormonas (como la pituitaria) y en las
zonas donde las señales químicas externas necesitan llegar al cerebro (como los sensores olfativos de la nariz).
Machine Translated by Google
Curiosamente, una de estas glándulas liberadoras de hormonas que conectan el cerebro con el
cuerpo es la glándula pineal, que era la estructura cerebral específica que el filósofo René Descartes
(15961650) identificó como la conexión entre el cuerpo y el alma. 14 Descartes sostuvo que los animales
eran máquinas, pero los humanos no, porque los humanos tienen alma. Descartes sostuvo que la
conexión entre el cuerpo y el alma se encontraba en la glándula pineal. Esta hipótesis (que el alma y el
cuerpo son cosas diferentes) se llama dualismo y generalmente se expresa en la era moderna en
términos de una hipótesis
, de que la mente y el cuerpo son cosas diferentes. Por supuesto, como todo el
que ha estudiado anatomía sabe (incluido Descartes, que fue un anatomista excepcional, muy familiarizado
con ambas 15 ), todos los mamíferos tienen glándulas pineales. Anatomía humana y no humana Esta
16 Regresaremos a
cuando abordamos directamente las discusión se presenta al final del libro,
filosofías dualistas y materialistas.
Un lector atento puede preguntarse en este punto de nuestra discusión sobre la “emoción”, ¿dónde
está exactamente la emoción ? La ira, los celos, la lujuria, el miedo, la felicidad, la tristeza: son
sentimientos ; son más que la respuesta de un cuerpo a los estímulos. Las emociones son más que la
respuesta de lucha o huida. La respuesta está en el hecho de que también hemos desarrollado un
mecanismo para monitorear estas respuestas corporales, y tenemos un mecanismo para categorizarlas.
17
emociones eran F (1842–1910) y Carl Lange (1834–1900) fueron los primeros en proponer que las
18
una conexión entre la mente y el cuerpo. Cuando nos enojamos, Todo el mundo sabe que cuando
nuestro ritmo cardíaco aumenta y nuestros capilares se dilatan para permitir que llegue más sangre a
nuestros músculos, lo que nos hace sonrojar y, de hecho, calienta nuestra piel. Como señalaron George
Lakoff y Mark Johnson en su análisis de los idiomas, las metáforas que utilizamos para describir las
19
emociones reflejan los cambios corporales reales que ocurren durante esas emociones.
Como se mencionó cuando presenté el sistema de reconocimiento de situaciones (Capítulo 6),
sospecho que la corteza es una gran máquina de categorización. (En el Apéndice C se puede encontrar
una discusión computacional de los mecanismos de categorización. Como se discute allí, la interacción
entre estos procesos de categorización y la realidad produce categorías que a menudo son similares pero
que pueden divergir entre individuos. El hecho de que no todos estén de acuerdo en los límites específicos
de estas categorías no implica que no exista un conjunto de respuestas basadas en especies que se
categoricen de manera similar entre individuos). Si aplicáramos esta maquinaria de categorización a
nuestro sistema sensorial visceral interno ( ¿Qué tan rápido late tu corazón? ), categorizaríamos estas
respuestas pavlovianas. Diferentes partes de la corteza reciben diferentes entradas y categorizan
diferentes aspectos: la corteza visual procesa la entrada visual porque recibe entrada de la retina (a
través del tálamo); La corteza auditiva procesa la información auditiva porque recibe información de la
cóclea (de nuevo a través del tálamo y otras estructuras). ¿Existe una zona cortical que reciba información
del hipotálamo, que pueda reconocer estos estados internos, algo que reciba información visceral?
F William James es el hermano mayor del novelista Henry James, quien, hay que decirlo, estaba muy
familiarizado con las emociones.
Machine Translated by Google
, a veces
GRAMO
prefrontales ventrales tienen la conectividad anatómica necesaria, se sabe que están activas durante la toma de decisiones
(como lo demuestra la fMRI) y juegan un papel importante en la toma de decisiones (como lo demuestran los estudios de
lesiones). 23
El más famoso de estos pacientes fue Phineas Gage, un trabajador del ferrocarril que en
1848 recibió una explosión de hierro fundido (una barra de hierro fundido de 13 libras, 3 pies de
largo y 1,25 pulgadas de diámetro) en el cráneo. Su trabajo era apisonar (comprimir) la pólvora
explosiva antes de que estallara. Desafortunadamente, el proceso de apisonar la pólvora explotó
y la barra de hierro atravesó su cráneo. Sorprendentemente, Gage sobrevivió; aún más
24
sorprendente, se recuperó de sus heridas y vivió una docena deGage
años tenía
más.deficiencias
sorprendentemente específicas, aunque complejas, a causa de sus heridas: sus capacidades físicas
y sensoriales, sus capacidades lingüísticas e intelectuales, su capacidad para percibir el mundo, su
memoria y su capacidad para actuar estaban intactas. Sin embargo, lo que cambió fue su
personalidad y su capacidad para tomar decisiones. La reconstrucción del recorrido de la barra de
hierro a través de un cerebro del mismo tamaño que el de Phineas Gage sugiere una destrucción
completa de la parte prefrontal del cerebro, incluidas las partes ventral y dorsal. La corteza prefrontal
dorsal parece estar involucrada en la capacidad de planificar, mientras que la corteza prefrontal
ventral parece estar involucrada en la capacidad deestuvieran
Si ambos reconocer emociones.
dañados, la capacidad de Gage para tomar
de un paciente moderno (al que se hace referencia como “Elliot”) con daño conocido en la corteza
prefrontal ventral (confirmado por resonancia magnética estructural), J que tiene un déficit específico en
Ventro (hacia la base) + medial (hacia el medio) + prefrontal (delante del frente). Estas estructuras se denominan
GRAMO
“pre”frontales porque otros anatomistas ya habían denominado “frontales” a partes del cerebro de animales no humanos,
y los anatomistas que estudiaban el cerebro humano querían identificar un área que fuera incluso más frontal que los
cerebros de otros primates. El grado en que los mamíferos no humanos, como los monos y las ratas, tienen corteza
“pre”frontal es un tema de mucho debate. 20
H Orbito (cerca de los ojos, de la palabra órbita , que significa el hueso circular alrededor de los ojos) + frontal .
La ínsula, de la palabra latina que significa “isla”, porque se encuentra en lo profundo de los pliegues de la corteza humana.
La resonancia magnética estructural utiliza una tecnología similar a la más conocida resonancia magnética funcional
(fMRI) para medir el tamaño de la materia gris (cuerpos neuronales) y la materia blanca (cableado neuronal, principalmente
axones y estructuras de soporte glial [mielina]) en el cerebro. Debido a que estas áreas no cambian, es posible obtener
26
imágenes muy precisas de la estructura de un cerebro con la resonancia magnética estructural.
Machine Translated by Google
Emoción. Al igual que los replicantes de Blade Runner,, este paciente era ciego a las emociones: incapaz
de procesar los sentimientos, reconocerlos o mostrarlos. En situaciones en las que las emociones son
casi inevitables, Elliot no mostraba ninguna reacción. Damasio cuantificó esto midiendo la conductancia
de la piel y descubrió que la conductancia de la piel de Elliot era completamente plana.
Históricamente, los filósofos han sugerido que existen dos sistemas de toma de decisiones:
un sistema de toma de decisiones emocional (caliente) y un sistema cognitivo (frío). Esta
hipótesis se remonta a Platón, quien describió al ser humano como un auriga que conduce
dos caballos, uno de ellos bien educado y que siempre hace lo correcto, y el otro salvaje y
difícil de controlar. 27;K San Agustín describe dos almas, una que vive en la Ciudad del
Hombre, conectada con los animales, llena de emoción, lujuria e ira, y la otra en la Ciudad
de Dios, separada de los animales, llena de razón y deliberación. 29 (La dicotomía inherente
de esto está encarnada en la maravillosa línea de las Confesiones de Agustín : 30 )
«Hazme casto, Señor, pero no hoy».
La teoría de Freud sobre el inconsciente sigue esta misma dicotomía. Freud propuso que
había tres componentes: el ello , el yo ,y el superyó. 31 Esto sigue los tres seres de Platón
en el carro: el caballo salvaje que necesita ser controlado (el ello), el caballo angelical que
intenta llevarnos a la razón (el superyó) y el auriga atrapado en el medio (el yo). Gran parte
yo
de la psiquiatría moderna todavía permanece dentro de esta hipótesis del sistema dual,
basada en gran parte en conceptos freudianos del inconsciente. Por supuesto, como hemos
visto, es fundamentalmente errónea. No estás separado de tu yo emocional, ni eres un
auriga que conduce a otros dos tomadores de decisiones; eres la suma de todos tus sistemas
de toma de decisiones.
Las teorías modernas de doble proceso abogan por una separación entre un sistema
inconsciente, impulsivo (dionisíaco) y un sistema consciente, de función ejecutiva (apolíneo).
tema.32 La analogía típica que se presenta es la de un caballo y su jinete, aunque algunos
autores se refieren a esto como un elefante y su jinete. En esta analogía, usted es el jinete
que intenta dirigir al caballo (o al elefante), pero el caballo (elefante) tiene mente propia y a
veces sigue su propio camino.
La traducción de estas teorías de doble proceso a nuestros cuatro sistemas de selección de
acciones sugiere que el ser consciente que eres es el sistema deliberativo, mientras que los sistemas
reflexivo, pavloviano y procedimental son no conscientes. Incluso si asumimos que existen múltiples
sistemas no conscientes, esta teoría de múltiples procesos sugiere que el yo consciente lucha por
controlar los otros sistemas. Esta es la diferenciación entre el sistema no cognitivo y el sistema de selección de acci
Este es un gran ejemplo de la falacia del homúnculo, en la que quien toma las decisiones es visto como una
28 El problema, como
pequeña persona (un “homúnculo”) que controla un cuerpo o sistema de toma de decisiones separado.
señaló Daniel Dennett en la década de 1980, es que alguien tendrá que explicar qué controla ese impulsor, lo que dará
lugar a una regresión infinita. Uno de los puntos de este libro es que usted es su cerebro.
No existe un homúnculo conductor separado; ustedes son todos estos sistemas de toma de decisiones, interactuando entre sí.
El hecho de que siempre se haga referencia a esto como una hipótesis de “sistema dual” enfatiza el peligro de la
Falacia del homúnculo: las teorías de sistema dual olvidan que los dos caballos de Platón requieren un conductor.
Machine Translated by Google
El otro (inconsciente) y el yo cognitivo (consciente) requieren que eliminemos las emociones de nosotros
mismos y las coloquemos en la caja del “otro”. No sé qué piensen ustedes, pero yo siempre he sentido
(¡una palabra emocional!) que mis emociones son una parte fundamental de quién soy.
Separar el “yo” cognitivo y el “otro” no cognitivo también requiere que separemos el sistema
procedimental (hábito, acción almacenada) como parte del “otro”. El sistema procedimental no es emocional
en ningún sentido de la palabra: es un simple almacenamiento de pares estímulorespuesta y cadenas de
acción respuestarespuesta. En lugar de los dos procesos inherentes a la teoría del proceso dual
(emocional, inconsciente, el caballo o elefante versus el yo cognitivo, el jinete), tendríamos que separar tres
sistemas (emocional, procedimental, el yo). Pero, nuevamente, las respuestas procedimentales son parte
de nosotros. Veremos que estos pares estímulorespuesta y estas cadenas de acción son la clave para que
los atletas golpeen pelotas de béisbol, hagan jugadas, lancen y atrapen pelotas de fútbol y den otras
respuestas entrenadas. Cuando se les pregunta, la mayoría de los atletas hablan de entrar en sí mismos,
no de salir de sí mismos, cuando están “en la zona”.
Como ha señalado Antonio Damasio en varios libros, las personas como “Elliot” con sistemas
emocionales deteriorados no toman decisiones normales. 33 De hecho, ahora hay cierta evidencia de que
las personas psicópatas o sociópatas son calculadoras y poco emocionales, y toman decisiones
34
independientemente de cualquier sensibilidad emocional.
Cuando hablamos de emociones y del papel de las emociones en la toma de decisiones, es importante
señalar que nuestros recuerdos del pasado se reconstruyen, se reconstruyen cada vez de nuevo y no son
necesariamente correctos. (Abordaremos esta cuestión en profundidad en nuestros análisis del
pensamiento episódico sobre el futuro, la memoria episódica y la deliberación en los capítulos 9 y 16). Esto
significa que si realizamos una acción basándonos en uno de nuestros otros sistemas (por ejemplo, debido
a nuestro sistema de aprendizaje procedimental), podemos imaginar que realizamos esa acción porque
nuestro sistema deliberativo quería hacerlo, o podemos imaginar que realizamos esa acción debido a una
respuesta emocional. Aunque uno puede recordar haber realizado una acción de hecho, las partes
35
“Porque se sentía bien”, emocionales de nuestro cerebro que realmente codifican
“sentirse bien” podría no haber estado activo en absoluto en ese momento; en cambio, es posible
que hayas retroconstruido la emoción.
Esto se ha visto explícitamente en estudios sobre el ansia y la recaída
en la adicción a las drogas: la mayoría de los adictos informan que recuerdan un ansia imparable en los
días previos a la recaída, pero los estudios prospectivos que observan a los adictos durante la recaída
37 ;M
encuentran que solo una pequeña proporción realmente muestra ansia.
Dicho esto, las emociones desempeñan un papel importante en nuestra toma de decisiones. A menudo,
las situaciones en el mundo o las situaciones con nuestros semejantes producen emociones, que guían
nuestras decisiones. Las emociones pueden describirse como nuestra interpretación de estados reactivos
que hemos aprendido a lo largo de escalas de tiempo evolutivas, que producen cambios en nuestras
respuestas corporales y sesgan nuestras acciones.
Cuando caminamos por una calle oscura de noche, los sonidos comienzan a ponernos nerviosos y
empezamos a pensar que podemos estar viendo cosas. La ansiedad que se desarrolla aumenta nuestra
atención hasta el punto en que incluso podemos ver cosas que no existen. No he profundizado en la
percepción en este libro, en gran parte porque se sabe tanto sobre ella que
Los estudios prospectivos son, por supuesto, mucho más difíciles de realizar porque tienen que examinar a
METRO
muchos más sujetos para encontrar a los que recaerán naturalmente durante el curso del estudio, y porque tienen
que construirse con mucho cuidado para no preparar a esos sujetos para que comiencen a desear o recaigan (lo que
sería poco ético y estaríamos observando una recaída inducida en lugar de una recaída natural).
Machine Translated by Google
Necesitaría un libro adicional para explicarlo todo. 38 Sin embargo, aquí son útiles dos conceptos
39
importantes. En primer lugar, la percepción es fundamentalmente una acción interpretativa. Aunque
nuestra retina responde a la luz, no vemos “luz”, vemos objetos: árboles, casas, caras.
Aunque las neuronas de la cóclea de nuestros oídos responden al sonido, no oímos “sonidos”, oímos
voces y música. Las ilusiones se producen porque los mecanismos de interpretación del cerebro son
engañados y procesan la información de forma incorrecta. En segundo lugar, la percepción consiste
fundamentalmente en detectar señales. 40 Esto significa que hay que hacer una estimación
de si el conjunto de señales luminosas percibidas es una cara o algo más. Cuando miro un árbol a
plena luz del día, es bastante fácil darse cuenta de que es un árbol. Pero tarde por la noche, en la
oscuridad, ¿es un árbol que se mece con el viento o algo más siniestro?
Una vez, poco después de graduarnos de la universidad, mi esposa y yo estábamos visitando Irlanda.
Estábamos en las islas Aran, una zona muy rural de la parte más occidental de Irlanda. Caminábamos de
regreso desde el pub hasta el bed and breakfast donde nos alojábamos. Estaba todo muy oscuro, salvo
por la tenue luz de las estrellas que se asomaba entre las nubes que se movían rápidamente.
Como conocíamos muy bien la poesía y los mitos irlandeses, era bastante fácil asustarse con la
oscuridad. Al borde de la carretera, frente a nosotros, vimos una luz naranja flotando en el aire, como un
fuego fatuo. Había un olor en el aire, como un perro o un lobo. Cuando llegamos a la luz, nuestra
adrenalina estaba a toda potencia y yo estaba lista para saltar. Cuando pasamos, un joven, sentado en la
entrada de su casa, fumando un cigarrillo, con la mano sobre la cabeza de este perro grande y peludo,
nos saludó con la cabeza, dijo "Buenas noches" y nos preguntó a dónde nos dirigíamos. Se lo dijimos y
él dijo que estaba a una milla más adelante en la carretera. Y seguimos adelante, riéndonos de nuestras
interpretaciones emocionales de la luz naranja flotante.
En la detección de señales, se pueden cometer dos tipos de errores: falsos negativos y falsos
positivos. Un falso negativo implica no reconocer algo que está ahí, mientras que un falso positivo implica
reconocer algo que está ahí cuando no lo está. La mayoría de los mecanismos de detección de señales
tienen parámetros (ganancias y umbrales) que se pueden ajustar para compensar la probabilidad de
cometer errores de falsos positivos con los de falsos negativos. 41 El cerebro no es una excepción.
errores.
Esto significa que la percepción, como cualquier mecanismo de detección de señales, tiene que
compensar los falsos negativos (pasar por alto algo que está ahí) con los falsos positivos (identificar
algo que está ahí cuando no lo está). Cuando nos ponemos ansiosos, incluso asustados, por la
oscuridad, nuestro corazón empieza a latir con fuerza, nuestros músculos se tensan, listos para entrar
en acción, y nuestra atención busca cualquier cosa que pueda exigir una respuesta. Al oír el crujido de
una rama bajo nuestros pies, podríamos literalmente saltar por los aires. (Este es un sobresalto
, que ya hemos visto antes.)
potenciado por el miedo . Las emociones son particularmente importantes para las interacciones
sociales. El amor a primera vista puede existir o no, pero la lujuria a primera vista ciertamente sí. Una
persona que responde a una situación (por ejemplo, atrapar a un cónyuge infiel) con ira y rabia va a
seleccionar acciones fundamentalmente diferentes a tomar que alguien que responde a la misma
situación con tristeza y abatimiento. En un ejemplo ahora clásico, las personas a las que se les ofrecen
juego recompensas injustas en el ultimátum N muestran una mayor actividad en la ínsula anterior (involucrada en l
43
y rechazan la oferta injusta con ira y disgusto.
Analizaremos el juego del ultimátum en detalle en nuestro análisis de la moralidad. En resumen, el juego del
norte
ultimátum implica que dos jugadores se dividen una suma de dinero, digamos $20. Un jugador puede hacer una
oferta de (continúa)
Machine Translated by Google
Los estudios sobre las emociones han demostrado que no sólo muchas decisiones están
correlacionadas con reacciones emocionales a la decisión en sí, sino también que estados emocionales no
relacionados pueden afectar a las decisiones. 44 Inducir un sentimiento de ansiedad antes de enfrentarse
a una decisión hace que las personas estén menos dispuestas a asumir riesgos; inducir un sentimiento de
propensas a deliberar sobre las decisiones y más propensas a ira hace que las personas sean menos
responder rápidamente. 45 Esta observación (que estar emocionalmente asustado, enojado o excitado
sexualmente hace que uno sea menos propenso a deliberar cognitivamente) es casi con certeza de donde
Platón, San Agustín y Freud obtuvieron su dicotomía entre emoción y cognición que empuja a la persona
en dos direcciones. Sin embargo, como espero haber dejado claro, la interacción es mucho más complicada que eso.
A menudo se considera que la emoción forma parte de nuestra herencia “animal”, mientras que la cognición se
46
Como espero haber demostrado a lo largo
considera un sistema de toma de decisiones “superior”, “más humano”.
de este libro, se trata de una dicotomía errónea. Las ratas deliberan sobre sus decisiones y las emociones
son fundamentales para las interacciones que nos hacen humanos. Sin embargo, una pregunta que surge
es si los animales tienen emociones y sentimientos. Todos los amantes de las mascotas, en particular
aquellos que tienen una mascota mamífera (un gato, un perro), te dirán que sus mascotas tienen
sentimientos, pero, por supuesto, como vimos al principio del libro, somos notoriamente malos a la hora de
juzgar la capacidad de acción de las criaturas no humanas. Mi padre está convencido de que su GPS se
enoja cuando tiene que recalcular una ruta porque se saltó
Oh un desvío.
Por otra parte, los simios a los que se les ha
enseñado un lenguaje limitado (como Kanzi el chimpancé o Koko el gorila) son capaces de expresar
emociones con palabras. 47 Estos simios utilizan palabras emocionales de maneras muy paralelas a
, las de Charles Darwin.
En su libro La expresión de las emociones en el hombre y los animales , señala que
ciertas expresiones emocionales son comunes en todas las culturas y especies: la ira, el asco, la risa, la
alegría, la tristeza: todas ellas son señales comunes en todos los seres humanos y en todas las culturas.
De hecho, como vimos en el Capítulo 4, estas expresiones faciales son similares en todos los mamíferos.
Kent Berridge y sus colegas estudiaron las expresiones faciales de desagrado (en respuesta a líquidos
amargos) y de atractivo (en respuesta a líquidos dulces) y encontraron expresiones faciales similares en
ratas, monos y humanos (sacar la lengua, hacer cara de asco para los líquidos amargos y lamerse los labios
para los dulces). Berridge y sus colegas pudieron demostrar que estas expresiones no tienen que ver con el
gusto en la lengua porque podían cambiar el desagrado por atractivo y viceversa manipulando el sistema
48
opioide en ratas.
cómo dividir el dinero, y el otro decide si acepta la oferta (y ambos jugadores obtienen la parte ofrecida) o rechaza la
oferta (y nadie obtiene nada). Observe que un receptor que rechaza una oferta está perdiendo dinero para castigar a la
persona que divide el dinero. Este es un fenómeno llamado "castigo altruista", porque castigar a las personas que ofrecen
de manera injusta conduce a sociedades más justas, pero la persona que castiga a la persona que ofrece de manera
42
injusta también ha perdido dinero. Exploraremos el castigo altruista y sus efectos en las sociedades en
Nuestro capítulo sobre la moralidad (Capítulo 23).
Por supuesto, sabe que el GPS simplemente utiliza un algoritmo para identificar cuándo recalcular y reproducir un
archivo de generación de voz para informarlo. (De hecho, probablemente podría programar el algoritmo).
Sin embargo, nuestras respuestas emocionales a situaciones sociales (como escuchar una voz grabada de una persona
exasperada que dice “recalculando”) están preprogramadas evolutivamente en nuestro cerebro.
Machine Translated by Google
Una pregunta interesante, por supuesto, es en qué momento de la línea temporal evolutiva surgen las
emociones. ¿Las bacterias tienen emociones? Probablemente no tal como las entendemos nosotros. ¿Las tienen los reptiles?
Es poco probable. Una vez más, los científicos no han podido identificarlos de manera fiable. ¿Los mamíferos sí?
Casi con toda seguridad. Una propuesta interesante planteada por Michel Cabanac, Arnaud Cabanac y André Parent
es que los amniotas (mamíferos, aves y algunos reptiles) desarrollaron un sistema de categorización que puede
observar el sistema de selección de acciones pavloviano del cuerpo y que este sistema de categorización es lo que
ahora reconocemos como emoción. 49 Esto
es coherente con los conceptos de William James sobre la emoción como algo que realmente reside en los
cambios viscerales del cuerpo y con los conceptos de Antonio Damasio sobre la emoción como el reconocimiento
50
y la memoria de las respuestas corporales, a lo que él se refiere como la hipótesis del marcador somático .
Cuando las emociones aparecieron en la evolución, es evidente que son una parte importante de los sistemas
de toma de decisiones humanos. Las emociones deben ser vistas no sólo como sentimientos que impulsan a otros
componentes de la toma de decisiones a actuar, sino como sistemas de selección de acciones por derecho propio.
Las emociones interactúan con nuestra categorización de los sentimientos a través de cambios viscerales en el
cuerpo, que identificamos como esas mismas emociones a través de la memoria y la metáfora: la vigilancia del
miedo, la tensión de la ira, el calor de la lujuria, la calidez de la comodidad, el dolor desgarrador de la tristeza.
• Joseph E. LeDoux (1996). El cerebro emocional . Nueva York: Simon and Schuster. • George Lakoff y Mark
Johnson (2003). Metáforas por las que vivimos . Chicago: University of Chicago Press.
Machine Translated by Google
Deliberación
hasta que, de
repente, perturbados por un
soplo, caemos.
La deliberación implica una búsqueda secuencial y serial de posibilidades. Implica una predicción de “qué
sucedería si”, seguida de un proceso de evaluación y un proceso de selección de acciones. Esto significa que la
deliberación requiere una serie de procesos complejos. Este procesamiento complejo hace que la deliberación
sea increíblemente flexible (saber que un camino conduce a un resultado no implica que uno deba tomar ese
camino para llegar a ese resultado), pero también hace que la deliberación sea lenta (lleva tiempo hacer todos
esos cálculos).
La deliberación también requiere un conocimiento de la estructura del mundo, particularmente de la estructura
definiciones previas). La deliberación
de causa y efecto . (Si no puedes predecir, no puedes buscar entre esas
requiere imaginación. 2 La deliberación requiere que uno sea capaz de
construir futuros posibles, y un proceso para saber que esos futuros potenciales son imaginarios y no reales. Una
deliberación también requiere un proceso de memoria activa capaz de recordar qué caminos ya ha recorrido y qué
caminos le quedan por recorrer.
A La incapacidad de diferenciar la imaginación de la realidad es, por supuesto, un componente clave de varias
Trastornos psicológicos (como la esquizofrenia). 3
75
Machine Translated by Google
explorar. 4 Al comparar opciones, es necesario tener en la cabeza varias opciones, sus evaluaciones y los
caminos que llevan a ellas. Si se presta atención a los pros y contras específicos, se puede incluso manipular la
evaluación. 5 Esto requiere un proceso llamado memoria de trabajo , en el que los conceptos se mantienen en un
B
bucle de procesamiento activo.
El concepto de mapa cognitivo fue introducido por Edward Tolman en la década de 1930.
Tolman sugirió que tanto las ratas como los humanos (y presumiblemente otros mamíferos también) mantenían
un “mapa de posibilidades”. 11 Esto significaba que el aprendizaje no tenía por qué apuntar a
obtener recompensas y evitar castigos (como sugerían sus contemporáneos, como Clark Hull y BF Skinner 12 ).
El concepto de Tolman implicaba que valía la pena para un individuo.
Los animales pueden aprender información sobre el mundo incluso cuando esa información no les proporciona
una recompensa o un castigo inmediatos. La información sobre el mundo puede utilizarse para tomar decisiones
futuras, lo que hace que la información básica sea en sí misma una actividad que vale la pena.
En la neurociencia moderna, el mapa cognitivo suele describirse como si fuera un mapa espacial, pero el
concepto original de Tolman era más "cognitivo" que "mapa", y las interpretaciones más modernas de los mapas
cognitivos se acercan más al concepto de un esquema sobre la estructura del mundo. 13 Sin duda, una de las
cosas más importantes que hay que saber sobre la estructura del mundo es dónde están las cosas y cómo se
A estos hechos a veces se los llama declarativos14 porque son cosas que se pueden “declarar”: si te digo
que Tokio es la capital de Japón o que crecí cerca de allí,
B
La memoria de trabajo mantiene las ideas, conceptos y resultados fácilmente accesibles para su procesamiento inmediato.
La complejidad y los mecanismos que permiten la memoria de trabajo son un tema muy amplio y son
objeto de múltiples libros. 6 Está relacionada con el concepto de recordar , donde uno repite la cosaa
una y otra vez lo que se ha hecho 7 y con la memoria prospectiva , en la que uno tiene que recordar estar preparado para
un evento futuro 8 (“No olvides la leche”). La capacidad de la memoria de trabajo está fuertemente ligada al cociente
intelectual, la habilidad mental, el éxito en la vida y el autocontrol. 9 Experimentos recientes han sugerido que es posible
10
entrenar la memoria de trabajo y que este entrenamiento tiene efectos en la toma de decisiones.
do
Para mis lectores que usan el sistema métrico, ¡eso es 17° Celsius! La mayoría de los edificios de la Universidad
de Minnesota están conectados por pasarelas, puentes entre edificios colocados sobre la calle, generalmente en el
segundo piso o en pisos superiores. Estas pasarelas suelen ser hermosas, con grandes ventanales de vidrio, pero forman
un laberinto complejo. Algunas conexiones entre edificios están sobre la calle, mientras que otras son túneles debajo de
la calle. Si conoces los pasadizos secretos, a menudo puedes recorrer un largo trecho del campus sin siquiera salir al exterior.
Machine Translated by Google
Deliberación 77
Como vivo en Washington DC, Minnesota, ya sabes esos hechos. No necesitas practicarlos. Por el
contrario, puedo decirte cómo lanzar una pelota de béisbol, andar en bicicleta, tocar el piano o el
clarinete, pero para ser bueno en eso, necesitas practicar. En la literatura sobre la memoria, estas otras
habilidades se denominan procedimentales porque requieren recuerdos del proceso y los procedimientos
en lugar de hechos.
La memoria declarativa a menudo se divide en dos subcategorías: memoria semántica y memoria
episódica . 15 La memoria semántica implica los hechos y el conocimiento sobre la
estructura del mundo. Las memorias episódicas son las memorias de tu propia vida. La afirmación de
que en mi fiesta de sexto cumpleaños, mis padres me hicieron una torta con la forma de un teléfono de
disco es una memoria semántica. Mi recuerdo de que mi papá me dijo que tenía que esperar para
obtener el último pedazo porque mis iniciales estaban en el centro (probablemente tratando de
enseñarme a ser educado y dejar que mis invitados comieran la torta primero), y que metí mi dedo y me
comí las iniciales mientras mi papá le estaba sirviendo un pedazo a alguien, y luego exigí un pedazo de
torta porque ya había obtenido las letras, es una memoria episódica.
La evidencia clave de que los animales (incluidos los humanos) utilizan un mapa cognitivo para
tomar decisiones es un proceso llamado aprendizaje latente . El aprendizaje sobre la estructura del
mundo puede no aparecer en la conducta hasta que uno necesita recurrir a ese conocimiento. La
16
hipótesis inicial de Tolman surgió de la observación de ratas que Ratas con experiencia en una
corrían por laberintos. Las ratas que recorrían un laberinto específico (solo explorando, sin recompensas
en el laberinto) aprenderían posteriormente mucho más rápido que las ratas sin experiencia en ese
laberinto. El experimento que finalmente convenció a Tolman de que los animales tenían que recordar
el conocimiento sobre la estructura del mundo fue que una rata (que no tenía hambre ni sed) a la que
se le permitió explorar un laberinto en forma de Y con comida en la bifurcación izquierda y agua en la
derecha iría inmediatamente a la bifurcación izquierda cuando tuviera hambre y a la bifurcación derecha
cuando tuviera sed. Para los humanos, al menos, este aprendizaje latente se trata de causa y efecto.
Reconocemos este conocimiento en términos de reglas de sientonces. Si dejo caer este vaso, se
romperá. Si dejo caer esta botella de plástico, no lo hará. Por lo tanto, es más seguro darle una botella
de plástico a mi hija de tres años, ya que podría dejar caer el vaso.
Podemos pensar en la deliberación como algo que tiene cuatro partes: el conocimiento del mundo,
el proceso de búsqueda que utiliza ese conocimiento del mundo para predecir lo que sucederá, un
proceso de evaluación que mide qué tan bueno es ese resultado y, finalmente, un proceso de selección
de acciones para realmente dar el primer paso adelante.
Buscar
Los primeros intentos de construir sistemas artificiales de toma de decisiones se basaron en procesos de búsqueda entre posibilidades
Newell y Herb para encontrar un camino desde un punto de partida hasta un objetivo. 17 El Solucionador General de Problemas de Allen
Simon (propuesto originalmente en 1957) buscaba entre posibilidades para encontrar un camino desde un punto de partida hasta un objetivo.
Fue capaz de crear subobjetivos en el plan y luego resolverlos. Funcionó buscando entre subobjetivos
potenciales y luego resolvió cada subobjetivo buscando entre acciones conocidas hasta que pudo
encontrar un camino desde el punto de partida hasta el objetivo final dado. Durante los últimos 50 años,
se ha realizado una enorme cantidad de trabajo para mejorar los algoritmos de búsqueda hasta el punto
de que los algoritmos de búsqueda altamente eficientes pueden superar a los humanos.
Machine Translated by Google
en partidas complejas (como la ahora famosa Deep Blue que pudo vencer al gran maestro Garry Kasparov en
ajedrez en 1997). 18 ;D
Sin embargo, en las últimas décadas ha quedado claro que estos procesos de búsqueda altamente eficientes
y optimizados no son la forma en que los expertos humanos resuelven la mayoría de estas tareas. 19
La búsqueda es algo que se hace al principio del aprendizaje y como respuesta a situaciones cambiantes. Cuanto
más experiencia adquieren las personas en un campo, más pequeño es el conjunto de futuros que buscan.
Las teorías actuales sugieren que esto se debe a que los expertos han almacenado en caché (mejora) la
opciones que tienen por delante.20 información. La búsqueda requiere mantener una gran cantidad de resultados
temporales en la memoria y realizar un seguimiento de una enorme cantidad de subpartes. Esto significa que es
21
laboriosa y requiere un amplio procesamiento computacional.
Cuando quedó claro que los expertos humanos no resuelven juegos como el ajedrez mediante búsquedas
profundas a través de largos caminos posibles, se hizo popular decir que la búsqueda era exclusivamente humana.
Estas hipótesis sugirieron que la búsqueda era difícil de realizar, que los humanos podían realizarla cuando la
necesitaban, pero que requería procesos cognitivos y conscientes complejos.
En particular, estas teorías sugerían que la búsqueda requería una descripción lingüística del
problema (que las personas necesitaban hablar consigo mismas mientras buscaban entre esas
posibilidades). Esto implica que se trata de una característica exclusivamente humana y que los
animales no querrían o no podrían realizar
22 búsquedas.
Por otra parte, se sabía desde hacía muchos años que los animales podían tomar decisiones basadas en
expectativas de los resultados de sus acciones. 23 Dados los procesos
simples que se plantearon en ese momento, se supuso que estas expectativas se formaban a partir de
asociaciones simples entre la acción y el resultado. Sin embargo, los estudios computacionales de la toma
de decisiones que comenzaron a desarrollarse en la última década llevaron a la conclusión de que esas
asociaciones simples son insuficientes para resolver el problema. Aunque se puede resolver una decisión
de un solo paso (acercarse a la Señal Uno cuando se tiene hambre, a la Señal Dos cuando se tiene sed)
con una asociación simple (la Señal Uno tiene comida, la Señal Dos tiene agua), si el reconocimiento de
,
las expectativas debe cruzar opciones (ir a la izquierda, luego a la derecha, luego a la izquierda nuevamente
para llegar a la comida), entonces la única manera de resolver esto es con procesos que codifiquen toda la
estructura de causa y efecto de la situación.
24 Así, varios autores han sugerido que los animales en realidad realizan procesos de búsqueda y
una nueva técnica matemática 29 que nos permitió decodificar estas representaciones en escalas de tiempo muy
rápidas (la cognición ocurre más rápido que el comportamiento 30 ), y cuando miramos películas de esa
representación decodificada a lo largo del tiempo, encontramos que a veces el animal se detenía en un punto de
decisión difícil y esas representaciones barrían los caminos posibles, primero en una dirección y luego en la otra.
mi
D
Curiosamente, aunque los algoritmos de búsqueda parecen ser capaces de vencer de forma fiable a los jugadores humanos al ajedrez,
Pero un día, Adam entró en mi oficina y me dijo: “Dave, ¡mis animales están mostrando viajes mentales en el
tiempo!” (continúa)
Machine Translated by Google
Deliberación 79
En los seres humanos, la deliberación depende del proceso de imaginación, en el que uno crea una
imagen mental de un futuro potencial. 32 Si estos barridos secuenciales de representación a lo largo de
los caminos potenciales que tiene por delante la rata que vimos son el mismo fenómeno que un ser
humano que piensa conscientemente sobre el futuro es todavía una pregunta abierta, pero las estructuras
neuronales involucradas coinciden notablemente bien. Sabemos, por ejemplo, que los seres humanos con
lesiones hipocampales tienen dificultad para imaginar el futuro, y que el pensamiento episódico sobre el
futuro en los seres humanos produce actividad hipocampal medida por fMRI. En los seres humanos, las
decisiones deliberadas conscientemente dependen de estructuras prefrontales acopladas a sistemas
hipocampales. En ratas, estructuras prefrontales similares se acoplan funcionalmente a sistemas
33
hipocampales durante la toma de decisiones deliberativa. Como veremos en la siguiente sección, la
Las mismas estructuras (corteza orbitofrontal y estriado ventral [núcleo accumbens], ambos acoplados
funcionalmente al hipocampo) están involucradas en los procesos de evaluación tanto en seres humanos
como en animales. 34
Evaluación
Para decirlo con cortesía, no le creí; estaba profundamente incrédulo. A medida que comprobábamos y volvíamos a comprobar
nuestros hallazgos en busca de posibles hipótesis alternativas, finalmente llegamos a la conclusión de que nuestras ratas efectivamente
representaban posibles caminos por delante de sí mismas. Esto es lo divertido de la ciencia: descubrir algo completamente
inesperado. Esto se captura elegantemente en la famosa cita que generalmente se atribuye a Isaac Asimov: "La frase más importante
umbral, la evidencia tiende a provenir de experimentos que incluyen ambigüedad perceptiva, pero que no han incorporado los múltiples
Un experimento ha examinado el efecto de la ambigüedad de valores y ha encontrado evidencia de una integración de carrera
hacia el umbral en humanos que toman decisiones entre alimentos igualmente valorados pero diferentes. 36 Examinaremos
los modelos de carrera hacia el umbral en nuestro análisis del papel de la percepción en la toma de decisiones (Capítulo 11).
Una posibilidad interesante es que la evaluación utilice los mismos mecanismos que la percepción, aplicados a hipótesis sobre estados
internos futuros.
Vale la pena hacer una digresión para hablar de la introspección y la psicología. La introspección es el examen interno
GRAMO
consciente de nuestros propios procesos mentales. Tiene una tradición muy larga en psicología, que se remonta a los primeros
que, como todos sabemos (y como se desprende de gran parte de lo que trata este libro), a menudo nos equivocamos en nuestros
39
propios procesos de toma de decisiones.
(continuado)
Machine Translated by Google
Las observaciones introspectivas y casuales de las situaciones en las que deliberamos sobre las
decisiones sugieren que tienden a tener más que ver con las dificultades en el paso de evaluación que
en el paso de predicción futura. Gran parte de la literatura computacional ha dedicado su tiempo a
44
trabajar en el paso de predicción de las decisiones, Probablemente porque surgió de la robótica.
literatura en la que es necesario que el robot realice cada paso. Pero, como se señaló en los primeros
modelos de búsqueda (como el Solucionador de problemas generales de Newell y Simon), no dedicamos
45
nuestro tiempo a calcular el camino hacia el resultado; en cambio, creamos subobjetivos .
Por ejemplo, si imaginamos a una persona con dos ofertas de trabajo, la acción necesaria es sencilla:
Envía un correo electrónico a un trabajo diciendo "sí" y otro al otro trabajo diciendo "lo siento". Esto puede
generar una larga serie de acciones posteriores (firmar un contrato, encontrar una casa, mudarse), pero
nuestro candidato hipotético no necesita considerar cómo llegar al trabajo para evaluar las dos
posibilidades, solo saber que es posible mudarse a donde sea que esté el trabajo. La complejidad de
determinar si los subobjetivos importan es que atravesar el subobjetivo puede importar en algunas
condiciones, pero no en otras. Si estoy decidiendo si tomar el tren o el avión desde Washington DC a
Nueva York, llegar a la estación de tren o al aeropuerto es fácil (ambos están en el metro). Sin embargo,
si estoy considerando si tomar el tren o el avión desde Baltimore, atravesar el subobjetivo se convierte
en un problema porque la estación de tren está en la ciudad, mientras que el aeropuerto está muy lejos
de la ciudad. La cuestión de cómo identificar cuándo se puede omitir el paso del subobjetivo y cuándo es
necesario incluirlo es un asunto complejo que es objeto de mucha investigación actual.
La psicología normal (el estudio del procesamiento mental normal, en comparación con la “psicología anormal”,
el estudio de los trastornos mentales) surgió en el siglo XIX con el estudio de la percepción.40 Estos psicólogos
experimentales desarrollaron una técnica en la que se entrenaron para responder rápidamente a las señales y
midieron cuantitativamente la rapidez con la que reconocían algo (como la imagen de una cara).
Los psicólogos que utilizaban la introspección a finales del siglo XIX se llamaban a sí mismos psicólogos de la
Gestalt , de la palabra alemana Gestalt , que significa forma o figura, porque creían que estaban aprendiendo a
reconocer la forma general del mundo. El problema era que estaban midiendo respuestas introspectivas. ( ¿Con
qué rapidez reconozco esta señal? ) Con el descubrimiento de Sigmund Freud (18561939) de que parte de la
psicología era inconsciente, los experimentos basados en la conciencia de los gestaltistas se volvieron problemáticos.
(Es importante reconocer que los experimentos Gestalt eran cuantitativos [midían qué tan rápido respondían a una
señal], incluso si eran introspectivos). A principios del siglo XX, estos experimentos introspectivos fueron
abandonados en favor de medidas directas del comportamiento, bajo el disfraz del conductismo, lo que llevó a la
creencia de que, dado que era imposible medir la cognición interna, la introspección no era una buena práctica
científica. 41 El argumento era que
deberíamos tratar el cerebro como una caja negra, ya que lo único que podemos medir es la conducta. Por supuesto,
como hemos visto a lo largo de este libro, ahora podemos abrir la caja negra y medir otras cosas además de la
42
conducta (como la actividad neuronal; véase el Apéndice B). Ahora podemos medir esos estados cognitivos internos.
Sin embargo, los problemas con la introspección persisten.
El problema fundamental de la introspección, por supuesto, es que, como vimos en el Capítulo 1, nos
contradecimos, cada uno de nosotros contiene multitudes y no todos nuestros procesos internos son accesibles a nosotros.
Nuestra conciencia. 43 Esto no significa que no podamos utilizar la introspección para orientar nuestras hipótesis
científicas, pero vamos a tener que comprobarlas con experimentos cuidadosos basados en observaciones directas.
En psicología, esto se llama operacionalizar nuestra hipótesis: la idea es que no podemos medir los conceptos
introspectivos directamente, pero sí podemos medir el comportamiento (o las señales neuronales). Si podemos
encontrar algo que se correlacione con nuestras hipótesis introspectivas o las diferencie, entonces podemos
estudiarlo científicamente.
Machine Translated by Google
Deliberación 81
En cualquier caso, una vez que hemos identificado los resultados potenciales, necesitamos evaluarlos. Esta
etapa de evaluación es compleja, depende de la atención a los detalles y está sujeta a interesantes efectos de
46
encuadre. Aunque actualmente se desconoce el proceso mecanicista mediante el
cual evaluamos estos múltiples objetos no comparables, sabemos que este proceso se ve afectado por los demás
47
sistemas de toma de decisiones, en particular el sistema emocional.
No es sorprendente para nadie que haya observado a sus semejantes, pero las pruebas han demostrado que su
estado emocional al comienzo de una decisión puede influir en su decisión deliberativa final. 48 En el nivel más
trivial, podemos ver esto en el experimento original de Tolman con ratas: las ratas hambrientas fueron a la comida,
esto también ocurre en niveles más complejos: por ejemplo, las personas que están enojadas o tristes
50
tienen más probabilidades de rechazar ofertas en juegos de intercambio.
También conocemos algunas de las estructuras cerebrales implicadas en estos procesos de evaluación,
porque sabemos lo que ocurre cuando estas estructuras dejan de funcionar. Dos estructuras que se sabe que
están profundamente implicadas en la evaluación en general y en la evaluación deliberativa en particular son el
cuerpo estriado ventral y la corteza orbitofrontal . 51 El estriado ventral, a veces
llamado núcleo accumbens , se encuentra en la parte inferior del cuerpo estriado, que
La corteza orbitofrontal se encuentra en la parte
es una estructura subcortical grande y evolutivamente antigua.
inferior de la parte frontal de la corteza, justo detrás de los ojos. I Cuando estas estructuras están dañadas, las
53
personas y los animales tienen dificultades para evaluar sus opciones.
El disparo neuronal en ambas estructuras se relaciona con los juicios de valor de los resultados. Ambas
estructuras contienen algunas células que responden al consumo de recompensas, así como otras células que
responden a señales que predicen recompensas y otras células que parecen representar el valor esperado de un
ratas. tomando decisiones económicas resultado. 54 Esto se ha probado de manera más explícita en monos y
entre objetos. Por ejemplo, Camillo PadoaSchioppa y John Assad dieron a monos sedientos opciones entre dos
sabores de jugos. Al variar la cantidad de jugo ofrecido, pudieron determinar cuánto valía cada jugo para el
mono. ( ¿Una gota de jugo de uva vale dos gotas de jugo de manzana? ) Lo que descubrieron es que algunas
células en la corteza orbitofrontal representaban lo valioso que era el jugo de manzana, otras células representaban
lo valioso que era el jugo de uva y algunas células representaban lo valiosa que era la elección que hizo el mono,
traducida a una moneda común, independientemente de si eligió manzana o jugo de uva. Se han encontrado
efectos similares en humanos utilizando experimentos de fMRI.
55
Las neuronas orbitofrontales también reflejan los efectos de encuadre. En tareas en las que todas las
opciones están intercaladas, las neuronas reflejan correctamente el valor de preferencia revelado entre las
opciones. 56 En tareas en las que las opciones se dan en grupos, las células reflejan la valoración
yo
Ventral significa "hacia el pecho" en latín y se puede contrastar con dorsal, que significa "hacia la espalda" en
latín. En los animales que corren a cuatro patas (cuadrúpedos, como perros y gatos), el mentón del animal está
hacia el pecho, mientras que la parte superior de la cabeza está hacia la espalda. En los humanos, debido a que
nos hemos puesto de pie (nos hemos vuelto bípedos), la parte inferior del cerebro está hacia el suelo y la parte
dorsal del cerebro está hacia el cielo. Los científicos se apegan a estos términos para poder usar la misma
terminología para las mismas partes del cerebro, como el estriado dorsal y ventral, que están bien conservados
entre otros animales y los humanos. 52 Piense en ventral como hacia la parte inferior del cerebro y dorsal como hacia la parte sup
Yo Th nosotros orbito ,
de la “órbita” de los ojos, en referencia al hueso circular que rodea el ojo, y frontal . Encontramos
la corteza orbitofrontal en nuestro análisis de la emoción y los sistemas pavlovianos de selección de acciones
(Capítulo 8).
Machine Translated by Google
entre las opciones disponibles. Leon Tremblay y Wolfram Schultz dieron a un mono la opción de elegir entre
pasas y manzanas o manzanas y cereales. Por experimentos anteriores, sabían que el mono al que estaban
registrando prefería las pasas a las manzanas y las manzanas a los cereales. Descubrieron que las neuronas
codificadoras de valores se activaban muy poco en el caso de las manzanas en la comparación entre pasas y
manzanas, pero mucho en el caso de las manzanas en la comparación entre manzana y cereal. Por el contrario,
Camillo PadoaSchioppa y John Assad no encontraron estos cambios en sus tres opciones de zumo, pero el
experimento de PadoaSchioppa y Assad intercaló las opciones, mientras que el experimento de Tremblay y
Schultz las agrupaba. Esta agrupación se denomina "bloques" en la jerga de la neurociencia conductual. Es decir,
un sujeto puede recibir un bloque de opciones entre manzana y uva (por ejemplo, durante 50 ensayos) y luego
otro bloque de opciones entre naranja y plátano (por ejemplo, durante 50 ensayos) y luego otro bloque de
manzana y naranja. ... etc. En experimentos posteriores, PadoaSchioppa descubrió que la actividad de las
neuronas de la corteza orbitofrontal dependía exactamente de esta cuestión: ¿cuál es el menú de opciones
disponible? Al igual que los humanos al elegir entre televisores determinan el valor de las opciones en relación
con las otras opciones , los monos al elegir entre alimentos o las opciones en relación con las otras opciones
en relación con las otras opciones disponibles. disponibles, los jugos determinan el valor de las opciones
Por supuesto, estas preferencias pueden cambiar. Si te enfermas después de comer algo, aprenderás a
desagradar ese alimento. 58 (Es por eso que a los pacientes de quimioterapia se les dan sabores extraños de
alimentos, para que las náuseas extremas que induce la quimioterapia no les enseñen a desagradar sus alimentos
favoritos. 59 ) De manera similar, la sobreexposición a un sabor de alimento determinado puede producir saciedad
y preferencia por otros alimentos. 60 Cuando un animal cambia su preferencia (por ejemplo, porque se sacia
porque ha bebido suficiente jugo de manzana, o porque tiene una mala experiencia después de beber ese jugo
de manzana), las neuronas de la corteza orbitofrontal cambian para reflejar ese cambio de preferencia.
61
Uno de los efectos de las drogas de abuso, en
particular la cocaína, es que alteran la capacidad de las neuronas de la corteza orbitofrontal para reconocer
cambios en el valor. 62 Las neuronas orbitofrontales en animales con una amplia experiencia con la cocaína no
logran cambiar la valoración cuando la acción que conduce a un sabor dulce se cambia para conducir ahora a un
sabor amargo. Parte del problema con las drogas es que afectan la capacidad del cerebro para reevaluar
correctamente las situaciones cuando cambian.
En un experimento reciente muy interesante, Geoff Schoenbaum y sus colegas probaron si las ratas podían
reconocer un cambio en la recompensa que se produciría después de tomar un 63 (ya sea aumentando el número
acción de bolitas de comida proporcionadas, digamos de una bolita de comida a tres, o cambiando el sabor de
la comida proporcionada, digamos de sabor a plátano a cereza). Si el cambio en el valor era numérico (es decir,
cambiando el tamaño pero no el sabor de la recompensa), el animal necesitaba el estriado ventral intacto, pero
no la corteza orbitofrontal. Sin embargo, los animales necesitaban tanto el estriado ventral como la corteza
orbitofrontal para reconocer el cambio entre sabores. Esto sugiere que el estriado ventral es clave para reconocer
Por lo tanto, los datos sugieren que estas estructuras están involucradas en la evaluación, pero ¿están
activas durante el paso de evaluación en la deliberación? Los datos de fMRI sugieren firmemente un papel para ambas
J Recuerde el ejemplo de la televisión del Capítulo 3. Cuando se les da a elegir entre televisores de $100, $200 y
$300, las personas tienen muchas más probabilidades de elegir el televisor de $200 en lugar del de $300. Pero cuando
se les da a elegir entre televisores de $200, $300 y $400, las personas tienen muchas más probabilidades de elegir el
televisor de $300 en lugar del de $200. Esto se llama encuadrar , porque el conjunto de opciones enmarca sus decisiones. 57
Machine Translated by Google
Deliberación 83
había descubierto que el hipocampo recorría esos caminos futuros, las células de recompensa del
estriado ventral (células que respondieron positivamente durante el consumo) se activaban de nuevo,
como si el estriado ventral estuviera representando de manera encubierta algo sobre el hecho de que el
animal obtendría una recompensa si iba en esa dirección. Al registrar de nuevo las neuronas de la
corteza orbitofrontal de la misma tarea, Adam Steiner descubrió que las células de recompensa
orbitofrontales (células que respondieron positivamente durante el consumo) también se activaban, de
nuevo, como si la corteza orbitofrontal estuviera representando de manera encubierta algo sobre el
hecho de que el animal obtendría una recompensa. Sin embargo, una diferencia interesante que
encontramos es que las células estriatales ventrales reflejaban la expectativa de recompensa antes de
que el animal se volviera hacia esa recompensa (lo que sugiere participación en la selección de la
acción), mientras que las células de la corteza orbitofrontal estaban activas después de que el animal ya
se había vuelto hacia la recompensa (lo que sugiere participación en la predicción de un resultado más que en la sele
El paso de evaluación en la deliberación es todavía un área de investigación activa tanto en humanos
como en animales no humanos. Conocemos algunas de las estructuras que intervienen, y algo sobre la
sincronización de los mecanismos, pero aún no entendemos cómo la atención cambia el marco del
proceso de evaluación. Por ejemplo, al comparar automóviles, imaginemos que tratamos de decidir entre
un automóvil deportivo y una minivan o un híbrido: uno es más elegante, uno puede llevar más cosas, uno
obtiene un mejor rendimiento de combustible. No hay una manera directa de comparar el estilo, el tamaño
y el rendimiento de combustible en una "moneda común". En cambio, las personas van y vienen,
deliberando sobre lo que es importante para ellos, construyendo hipótesis de valor para la comparación.
En un giro interesante, los pacientes con daño en la corteza orbitofrontal no van y vienen entre opciones;
en cambio, miran una opción a la vez y determinan si es lo suficientemente buena.
68
No se sabe, sin embargo, si este cambio de estrategia se produce porque la
corteza orbitofrontal controla realmente la estrategia utilizada o porque la corteza orbitofrontal ayuda en
la comparación y los pacientes reconocen que simplemente no son muy buenos haciendo comparaciones.
En cualquier caso, está claro que la corteza orbitofrontal participa de manera crítica en la comparación de
opciones durante la deliberación.
Selección de acciones
El paso final de la deliberación, la adopción de la acción, sigue siendo una cuestión casi completamente
abierta. ¿Cómo convergen las personas y otros animales en una decisión? ¿Se trata de un proceso en
el que simplemente se dice “¿es eso suficiente?” después de cada evaluación? ¿Se trata de un proceso
en el que las evaluaciones se guardan en la memoria y se comparan directamente? En este punto, los
científicos no lo saben, pero hay algunas pruebas a favor de la hipótesis de la comparación (que el
resultado esperado y su evaluación se guardan en la memoria de trabajo y se comparan con otras alternativas).
Machine Translated by Google
Si la deliberación implica predecir opciones futuras y compararlas, entonces hay que recordar cada opción para poder
compararlas. La memoria de trabajo es la capacidad de mantener varias cosas en la cabeza al mismo tiempo. El efecto de
hacer que las personas sean más inconsistentes en sus elecciones: con menos poner a prueba la memoria de trabajo sería
recursos de memoria de trabajo, hay menos tiempo para acertar en la deliberación y es más probable que uno abandone la
búsqueda en el futuro antes de tiempo. Esto es lo que muestran las pruebas. 70 Las personas con mejor memoria de
trabajo están más dispuestas a esperar recompensas posteriores. También son mejores a la hora de tomar decisiones. De
hecho, es posible entrenar la memoria de trabajo y mejorar la capacidad de algunas personas para esperar recompensas
retrasadas.
La ventaja de la deliberación es que proporciona flexibilidad. Saber que ir al casino me permitirá jugar no me obliga a ir
al casino. Combinar la deliberación con la imaginación puede permitirnos tomar decisiones sobre decisiones muy complejas
que no podemos (o no deberíamos) tomar muchas veces (como qué trabajo aceptar, a qué universidad ir o con quién
casarnos). Combinar la deliberación con la atención nos permite alejarnos de las opciones que estamos muy motivados a
tomar (ese cigarrillo) y acercarnos a opciones que son mejores para nosotros a largo plazo (hacer ejercicio en el gimnasio).
El problema con la deliberación es que podemos “perdernos en nuestros pensamientos”. Como Hamlet, atrapados entre
posibilidades difíciles, pasamos nuestro tiempo prediciendo resultados, sopesando opciones, enumerando pros y contras,
71
Tolman y Hull
Me gustaría terminar este capítulo con una breve discusión sobre la historia de la deliberación y su papel en la toma de
decisiones. La diferencia entre la toma de decisiones deliberativa y la toma de decisiones basada en el hábito (lo que hemos
llamado "procedimental") se convirtió en uno de los grandes debates científicos de los años 1930 y 1940, dos importantes
72
nuestro tiempo.
laboratorios hacían correr ratas por laberintos, tratando de determinar cómo encontraban la meta. (Ambos
laboratorios eran conductistas en el sentido de que querían ser cuantitativos y operacionalizar el proceso de toma de
decisiones en animales que pudieran estudiar con controles apropiados, en respuesta a la introspección de los gestaltistas.)
En la Costa Este, en la Universidad de Yale, Clark Hull sostuvo que las ratas aprendían a asociar estímulos con respuestas,
mientras que en la Costa Oeste, en Berkeley, Edward Tolman sostuvo que las ratas eran criaturas cognitivas que planificaban
mentalmente rutas para alcanzar metas. En 1970, en una reseña de este debate aún en curso, Endel Tulving y Stephen A.
Madigan escribieron que “los organismos que aprenden lugares, guiados por mapas cognitivos en sus cabezas, sortearon
con éxito las carreras de obstáculos para conseguir comida en Berkeley, mientras que sus contrapartes que aprenden
Ya hemos visto cómo el aprendizaje latente llevó a Tolman a plantear la hipótesis de la presencia de un mapa cognitivo.
Tolman también observó a sus ratas mientras aprendían a recorrer el laberinto y se dio cuenta de que, a medida que
cometían errores, parecía haber un método para esos errores: las ratas hacían todos los giros a la izquierda, luego todos
los giros a la derecha y luego alternaban izquierda y derecha, como si realmente estuvieran probando hipótesis.
haciendo elecciones aleatorias durante el aprendizaje, entonces a veces las ratas que hacen elecciones aleatorias tomarían
todas las opciones de izquierda a derecha. (Si hay tres opciones de izquierda a derecha en el laberinto, entonces una rata
de cada ocho irá a la izquierda en las tres opciones incluso si las ratas realmente estuvieran haciendo elecciones aleatorias).
Machine Translated by Google
Deliberación 85
(Como a nuestro cerebro le gusta encontrar patrones, las ratas que eligen todas las opciones de izquierda a
derecha se destacarían. De manera similar, incluso una rata que sabe la respuesta correcta no necesariamente
siempre va a elegir esa opción. (Tal vez haya algo de ruido en el resultado; tal vez el animal esté explorando
para verificar sus hipótesis). De hecho, determinar cuándo el animal sabe la respuesta es matemáticamente
74
complicado.
Ahora tenemos los métodos estadísticos para identificar si estas secuencias son aleatorias, 75 pero Tolman
no disponíade estas estadísticas complejas. Randy Gallistel, Stephen Fairhurst y Peter Balsam utilizaron estos
nuevos análisis estadísticos para examinar explícitamente cómo aprenden las ratas y descubrieron que (en
ciertas tareas) las ratas individuales no aprendían gradualmente, sino que de repente cambiaban en un solo
ensayo de equivocarse en su mayoría a acertar en su mayoría . 76 Argumentaron que la tasa de aprendizaje
cada una de las gradual observada en muchos estudios era un artefacto de promediar entre diferentes ratas,
cuales alcanzaba su momento "¡Ajá!" en diferentes momentos.
K
Como era tan difícil analizar la variabilidad de los errores cometidos en las primeras fases del aprendizaje,
Hull decidió analizar ratas que habían alcanzado una regularidad en sus trayectorias y que ya no cometían
errores. Hull utilizó la analogía de un operador de centralita que crea una conexión entre dos teléfonos para
explicar sus ideas, mientras que Tolman sólo contaba con la analogía de la inspiración humana para intentar su
explicación. Mientras que Hull pudo proporcionar una explicación matemática de sus sugerencias, Tolman no.
Esto hizo posible que Hull (y otros que argumentaban en contra de los procesos cognitivos, como BF Skinner)
explicaran específicamente cuándo ocurrirían los fenómenos y les permitió ser cuantitativos al respecto.
78
La ciencia se basa en la predicción y la replicación. Las observaciones de
Tolman eran difíciles de cuantificar. La inspiración llegaba a las ratas en diferentes momentos. Así, mientras que
cualquier rata individual de repente "lo entendía" y comenzaba a recorrer el laberinto correctamente, el promedio
de todas las ratas mostraba una curva que se desarrollaba lentamente. De manera similar, aunque cada rata
mostrara individualmente un comportamiento de ensayo y error indirecto en algunos ensayos, los ensayos en
79 a otra.
los que se producía el comportamiento de ensayo y error indirecto diferían de una rata
Las matemáticas son una tecnología. Como cualquier otra tecnología, nos permiten ver cosas que antes no
podíamos ver (compárese con el microscopio, que permitió a Robert Hooke ver células, o el telescopio, que
permitió a Galileo Galilei ver las lunas de Júpiter) .
Es importante tener en cuenta que Tolman fue anterior a Claude Shannon, por lo que carecía de las matemáticas
de la teoría de la información. Fue anterior a la primera computadora (desarrollada durante la Segunda Guerra
Mundial), a John von Neumann y Alan Turing, y al revolucionario libro de Norbert Wiener, Cibernética (publicado
en 1948), y por lo tanto no tuvo acceso a la nueva conceptualización de la inteligencia como computación. Y fue
anterior a Alan Newell y Herb Simon, por lo que carecía de las matemáticas de los algoritmos.
81 El trabajo
principal de Tolman fue en los años 1930 y 1940, resumido en su artículo de Psychological Review “Mapas
cognitivos en ratas y hombres” publicado en 1948. Claude Shannon publicó su artículo innovador sobre la teoría
de la información en 1948. Alan Turing hizo su trabajo principal sobre computabilidad a fines de los años 1930 y
durante la Segunda Guerra Mundial a principios de los años 1940, pero no tuvo una influencia importante en la
psicología hasta el desarrollo del campo de la computación artificial.
K
Como vimos en nuestro análisis de los sistemas de toma de decisiones múltiples (Capítulo 6) y volveremos a
abordarlo en nuestro análisis del aprendizaje procedimental (Capítulo 10), hay algunas tareas que los individuos sí
77
La tarea se resuelve de forma aprenden. Obtener de repente la respuesta correcta (un momento “¡Ajá!”) es una señal de que una
gradual e incremental mediante el sistema deliberativo en lugar del sistema procedimental.
Machine Translated by Google
inteligencia en la década de 1950. Allen Newell y Herb Simon desarrollaron los primeros
conceptos algorítmicos de búsqueda e inteligencia con su publicación del General Problem
Solver en 1959, el año en que murió Tolman.
La teoría de la información cuantifica la capacidad de una señal para ser extraída del ruido.
El algoritmo proporciona el concepto de que una secuencia de cálculos se puede vincular entre sí a
través de mecanismos de control para llegar a una conclusión que está oculta en los datos. Sin
embargo, una de las ideas más importantes fue la de la complejidad computacional, que se originó
con Turing. Ahora estamos familiarizados con los ordenadores que ejecutan algoritmos largos: todos
hemos visto ordenadores que funcionan a toda velocidad, el disco duro girando, calculando un
cálculo complejo. Antes de los conceptos de teoría de la información, algoritmo y computación, la idea
de que los resultados ocultos en los datos solo se podían encontrar después de cálculos que
inherentemente requieren tiempo para ser calculados no era apreciada.
Ahora sabemos que tanto Tolman como Hull tenían razón. Cuando se enfrentan a decisiones complejas
entre opciones similares o entre opciones cambiantes, se necesita un sistema flexible aunque sea
computacionalmente complejo, pero cuando se enfrentan a una decisión regular en la que la respuesta
correcta no cambia, los animales desarrollan hábitos de cadena de respuesta (secuencias de acciones).
82 En la práctica, el desempeño temprano en los laberintos se logra a menudo mediante procesos de
búsqueda deliberativa similares a los de Tolman, mientras que el desempeño posterior a menudo se logra
83
realizado mediante procesos de hábito estímulorespuesta similares a los de Hull. mediante procesos de
búsqueda deliberativa similares a los de Tolman. De hecho, si volvemos a mirar sus datos, Tolman estudió
cómo se aprendían los laberintos y concentró su análisis en el momento del aprendizaje temprano,
mientras que Hull estudió el "rendimiento asintótico" una vez que la conducta se había establecido en una
rutina regular. Ambos sistemas (el proceso de búsqueda computacionalmente costoso de Tolman y el
proceso de estímulorespuesta computacionalmente simple de Hull) son capaces de resolver tareas y
tomar decisiones. Sin embargo, cada sistema tiene ventajas y desventajas y se logra mediante un conjunto
diferente de estructuras cerebrales que interactúan. En el próximo capítulo abordaremos lo que se sabe sobre ese siste
10
Vacía la mente
excepto el cielo azul arriba y las
rocas rojas debajo de nuestros pies.
Los poetas suelen referirse a nosotros como “criaturas de hábitos”. Por la mañana nos levantamos a la misma hora,
tomamos el mismo café todas las mañanas, comemos los mismos cereales. Por la noche, queremos nuestro libro o
nuestra televisión antes de acostarnos. Todos hemos desarrollado nuestros propios hábitos a lo largo de nuestras vidas.
En cambio, los hábitos se desarrollan a partir de la regularidad y la fiabilidad. Nos gustaría pensar que los hábitos se
desarrollan a partir de lo que individualmente hemos descubierto que es más útil para nuestras vidas, pero, por supuesto,
todos tenemos hábitos que nos gustaría abandonar. ¿Por qué desarrollamos malos hábitos? ¿De dónde surgen los hábitos?
¿Qué son los hábitos? ¿Por qué el camino que recorremos para ir al trabajo se convierte en un hábito, pero el que
A
recorremos para ir al aeropuerto no?
En esencia, los hábitos son secuencias de acciones que hemos aprendido a llevar a cabo. El ejemplo más simple
de hábito es el de conducir hasta el trabajo. La primera vez que conduces hasta el trabajo, necesitas usar un mapa,
seguir un GPS y prestar atención a la ruta que quieres tomar. Pero si conduces por esa ruta todos los días durante
semanas, meses o años, con el tiempo dejas de prestarle atención. Conduces hasta el trabajo incluso mientras estás
A La respuesta obvia es que se conduce mucho más para ir al trabajo que para ir al aeropuerto (a menos que se trabaje
en el aeropuerto). Como saben muchos viajeros de negocios, con suficientes viajes al aeropuerto, el trayecto hasta el
aeropuerto también se convertirá en un hábito.
87
Machine Translated by Google
Esto sugiere la trayectoria habitual del aprendizaje: los mecanismos flexibles y deliberativos predominan al principio
del aprendizaje, mientras que los mecanismos inflexibles y basados en los hábitos se desarrollan con la experiencia.
1
Pero, por supuesto, el control también puede pasar del hábito a la deliberación. 2 Cuando se
construyó el puente 35W, que era el conducto principal a través de los sistemas del Mississippi.
En 2007, el río que atravesaba Minneapolis colapsó y el tráfico tuvo que ser desviado por toda la ciudad. Esto cambió el
flujo de tráfico en mi ruta al trabajo y descubrí que la ruta que normalmente tomaba para ir al trabajo era mucho más
lenta que antes. Así que encontré una nueva ruta, que resultó ser más rápida, incluso después de que se construyó y
¡Esto no significa que sea seguro conducir distraído! Se ha demostrado que conducir mientras se habla por el
teléfono móvil, incluso si es un teléfono con manos libres, cuadruplica la probabilidad de sufrir un accidente. 3
En particular, las distracciones sensoriales (como hablar o, peor aún, enviar mensajes de texto por el
teléfono móvil) interfieren en el procesamiento sensorial necesario para responder adecuadamente mientras se conduce.
Como veremos, existe una gran diferencia entre permitir que la mente divague para pensar en otras cosas y desviar la
atención de la carretera.
Esta diferencia se puede ver fácilmente al aprender a tocar un instrumento musical. Ningún músico intentaría tocar
una pieza compleja mientras ve la televisión o lee un libro: las señales sensoriales interferirían con la música. Sin
embargo, con la experiencia, los músicos se vuelven expertos en pensar cada vez menos en los detalles y cada vez más
en los aspectos artísticos de la música. Cuando se aprende a tocar un instrumento musical, al principio hay que pensar
en qué teclas están en cada lugar, qué combinaciones de teclas producen qué notas. Tocar una pieza musical de
principio a fin sin tocar una nota incorrecta a menudo significa hacer una pausa antes de cada nota para encontrar la
digitación correcta (lo que, por supuesto, arruina por completo el ritmo). Pero a medida que uno adquiere experiencia con
el instrumento, comienza a asociar las notas con las teclas, hasta que llega un momento en que ya no piensa en la
digitación de una nota determinada; en cambio, piensa "toca un sol" y sus manos simplemente hacen lo correcto. Esto le
permite concentrarse en las notas. Con el tiempo, a medida que aprendes una pieza musical, prestas cada vez menos
atención a cuál es la nota siguiente, lo que te permite dedicar tu cálculo mental a aspectos cada vez más complejos de
la música. Los músicos expertos con mucha experiencia con diferentes piezas y diferentes géneros pueden incluso crear
B
En la literatura psicológica, el aprendizaje de “situaciónacción” se conoce más a menudo como aprendizaje de estímuloacción.
4
aprendizaje de respuesta (SR), Pero, como hemos visto (Capítulo 6), los animales reaccionan a situaciones, categorizando
adaptaciones de estímulos, no de estímulos específicos. 5 (Discutiremos este tema con más profundidad en el Capítulo 12.)
Ciertamente, algunos estímulos son más importantes que otros para determinar la situación en cuestión, pero rara vez
una situación está definida completamente por un solo estímulo (fuera de una caja de pruebas psicológicas con animales
donde (continúa)
Machine Translated by Google
Son exactamente lo que parecen, recuerdos que han aprendido que en esta situación debes tomar
esta acción. 6
La fragmentación es el encadenamiento de secuencias AA, como si una secuencia de
sistema de “acción en caché”, porque ha almacenadoacciones 7 (El sistema de hábitos a veces se denomina
en caché o almacenado la acción a realizar. 8 En el Capítulo
6, 9 ) llamamos a este sistema “Procedural”, porque aprende y almacena procedimientos.
Es interesante observar que la mayoría de los ejemplos de conductas de tipo “estímuloreacción” que
suelen identificarse como “hábitos” son en realidad iniciaciones voluntarias más que respuestas: cuando se
enciende la luz, la rata empuja la palanca; cuando se le da el cigarrillo, el adicto lo fuma. Aunque el impulso
de ir al trabajo se convierte en un “hábito” automático y ya no requiere atención durante el proceso, sigue
siendo una acción voluntaria iniciada y controlada en todo momento. El sistema recupera una secuencia
voluntaria de acciones motoras y la libera en respuesta a una señal.
10
Así es exactamente como los atletas practican deportes. Un mariscal de campo que lanza un pase a un
receptor reconoce la situación, la evalúa y recupera una secuencia de acciones. No importa lo que digan
algunos fanáticos, nadie “obligó” al mariscal de campo a realizar el lanzamiento que llevó a la intercepción;
colocó “lanzar el balón” en el conjunto de acciones que estaba listo para hacer y luego interpretó mal la
cobertura. La toma de decisiones procedimental se entiende mejor en términos de preparación y
posibilidades : en cada momento, el agente está combinando situaciones hasta que aparece una que
coincide con una acción que se puede liberar. 11;C
La fragmentación es un proceso en el que los subobjetivos se almacenan como partes completadas
para que el proceso de planificación cognitiva pueda funcionar a un nivel más abstracto. 13 Así, el músico
experto no piensa: “para tocar un sol en este clarinete, necesito poner mis dedos en esta posición y soplar
con esta fuerza en la lengüeta”; en cambio, el músico simplemente “toca sol”. De hecho, los músicos
expertos a menudo fragmentan secuencias de notas en acordes y arpegios. De manera similar, un lanzador
de béisbol no piensa: “para lanzar la bola rápida, coloco dos dedos en las costuras de la pelota de béisbol y
tiro mi brazo hacia atrás, no te olvides de girar las caderas…”. En cambio, el lanzador experto simplemente
lanza la pelota de béisbol. Como el receptor Crash Davis (Kevin Costner) le dice al lanzador Ebby LaLoosh
,
(Tim Robbins) en la película Bull Durham: “No pienses, carne, simplemente lanza”. Este consejo es
fundamental porque pensar demasiado en el proceso altera tanto el componente de SA (porque obliga al
componente de deliberación a tomar el control) como el componente de fragmentación (porque está
trabajando a un nivel demasiado bajo). Como vimos en el Capítulo 9, la deliberación requiere una cantidad
variable de tiempo para llegar a la siguiente acción. Una secuencia de acciones confiable y fluida necesita
el sistema procedimental .
En el laboratorio, estas cuestiones se estudian con tareas como la tarea de tiempo de reacción serial
secuencial (SSRT, por sus siglas en inglés). En esta tarea, se coloca la mano del sujeto sobre un teclado y
15 Se le
simplemente se le indica que presione cada tecla tan pronto como aparezca la letra en la pantalla.
dice al sujeto que las letras aparecerán al azar; sin embargo, sin que el sujeto lo sepa, las letras
aparecen en una secuencia. La secuencia puede ser simple o complicada.
Sólo hay disponibles un par de estímulos muy discretos). Por lo tanto, prefiero el término “situación” a “estímulo”
(convenientemente, ambos comienzan con S). No tengo ningún problema con el término “respuesta” en sí, pero sigo
confundiendo la R en SR con “recompensa”, por lo que prefiero el menos ambiguo “acción”, lo que nos permite llamar
a esto aprendizaje SA.
En la literatura psicológica, esto se ha conocido históricamente como ventajas., porque cada situación
do
Las dos estructuras cerebrales más involucradas tanto en la fragmentación como en las asociaciones SA se
19
Los ganglios basales encuentran en el centro del cerebro de los mamíferos (debajo de la corteza, por lo tanto,
20
(también conocidos como “subcorticales”) y , en la base del cerebro, ambos son evolutivos.
21
el cerebelo son estructuras muy antiguas y se encuentran componentes similares en todos los vertebrados.
El circuito de los ganglios basales es muy complejo. Dedicaremos algún tiempo a explorarlo en
este capítulo, pero, brevemente, hay dos vías a través de los ganglios basales: una fomenta las
acciones y la otra las inhibe (Figura 10.1). 22 (En realidad, hay tres Volveremos
23
vías a través de los ganglios basales; la tercera detiene una acción aprendida.
(Nos referiremos a esta tercera vía en el Capítulo 15 en nuestra discusión sobre el autocontrol y la
anulación de las acciones aprendidas). Las dos vías principales se pueden identificar por sus influencias.
Machine Translated by Google
excitatorio (+)
corteza hiper
tálamo inhibidor (–)
directo dopaminérgico
Directo camino
(¡detener!)
camino
(ir) Indirecto
(no va)
STN
GPe
GPi
SNc
VTA
acciones motoras
Figura 10.1 Vías a través de los ganglios basales. Los ganglios basales son un circuito
subcortical que aprende a controlar las acciones motoras. Hay tres vías a través de él. (1) La
primera es una "vía directa" en la que la corteza excita el cuerpo estriado, lo que inhibe el globo
pálido interno (GPi). Debido a que las neuronas del GPi se activan tónicamente, inhibirlas libera
los circuitos de acción motora talamocortical y subcortical. (2) Una "vía indirecta" agrega un paso
inhibidor intermedio (globo pálido externo, GPe), que crea un triple negativo. (3) La tercera es una
"vía hiperdirecta", en la que el núcleo subtalámico excitador (STN) aumenta la activación en el
GPi, lo que detiene las acciones. El aprendizaje se produce en el cuerpo estriado a través de
entradas de dopamina que provienen del área tegmental ventral (VTA) y la pars compacta de la
sustancia negra (SNc).
sobre los sistemas de selección de acciones talámicos y corticales. La vía “ir”, que estimula las
acciones, inhibe las células que inhiben los sistemas de selección de acciones talámicos y corticales
(una doble negación, que estimula las acciones), mientras que la vía “no ir”, que desalienta las
acciones, añade un tercer paso de inhibición (una triple negación, que desalienta las acciones). La
tercera vía interviene en la última etapa, excitando directamente a las células que inhiben los
sistemas de selección de acciones talámicos y corticales (una única negación, que desalienta las acciones).
La primera vía, que alienta las acciones, reconoce los aumentos de dopamina, mientras que la segunda vía,
que desalienta las acciones, reconoce las disminuciones de dopamina. 24 (Recuerde que la dopamina es una
aumentoseñal donde los aumentos significan "eso fue mejor de lo que esperaba" y deberían conducir a un
en la disposición a realizar una acción, y las disminuciones significan "eso fue peor de lo que esperaba" y deberían
conducir a una disminución en la disposición a realizar una acción. Vea el Capítulo 4). Estos cambios en la
dopamina son reconocidos por diferentes receptores (prosaicamente llamados receptores D1 y D2). Esto significa
que ligeras diferencias en la genética pueden hacer que una persona aprenda más fácilmente de las recompensas
positivas (zanahorias) y otra aprenda más fácilmente de los castigos negativos (palos). 25
Esta diferencia sugiere que los cambios genéticos en estos receptores podrían cambiar la
capacidad de aprender de la información positiva o negativa. En un experimento notable, Michael
Frank y sus colegas descubrieron exactamente eso. 26 Desarrollaron una tarea en la que las personas
aprendieron a reconocer qué caracteres arbitrarios D probablemente conducirían a una recompensa y cuáles
D
En realidad, utilizaron caracteres hiragana japoneses . Es de suponer que los sujetos de experimentación
estadounidenses no los reconocieron.
Machine Translated by Google
No era probable que lo hicieran. Mediante una elegante combinación de procedimientos de entrenamiento
y prueba, pudieron separar el aprendizaje de la información positiva (más probable que conduzca a una
recompensa) que de la negativa (menos probable que conduzca a una recompensa). Hicieron pruebas
mi
Se estudiaron los sujetos y se examinó un polimorfismo genético común genéticas en sus receptores D1 y
en los receptores D2. El polimorfismo en la vía del receptor D1 afectó la capacidad de las personas para
aprender de las señales positivas, mientras que el polimorfismo en la vía del receptor D2 afectó la
F
capacidad de las personas para aprender de las señales negativas.
Como también comentamos en el capítulo 4, la dopamina se relaciona principalmente con las
recompensas positivas (refuerzo), no con los castigos negativos (aversión). En ese capítulo, argumentamos
que debería haber una contraparte negativa de la dopamina que indique cuándo los castigos son peores
de lo esperado (aprender a no ir) y cuándo los castigos no son tan malos como se esperaba (alivio,
aprender a ir). Como señalamos en ese capítulo, actualmente no se sabe cuál es esa señal. En las últimas
décadas, se han sugerido dos posibles candidatos para esta antidopamina negativa: la serotonina y la
noradrenalina (también llamada noradrenalina). 28
Ambos neurotransmisores están relacionados químicamente con la dopamina (y por lo tanto son buenos
candidatos desde la perspectiva de que la evolución tiende a funcionar modificando los sistemas existentes)
y están definitivamente involucrados en la toma de decisiones.
La dopamina, la serotonina, la noradrenalina y otro neurotransmisor relacionado, la octopamina, son
sustancias químicas relacionadas que pertenecen a una familia llamada catecolaminas. 29 Las
catecolaminas desempeñan papeles interesantes en el aprendizaje y la toma de decisiones en varias
especies muy distantemente relacionadas. En los insectos, el componente positivo (refuerzo) es la
30
octopamina, mientras que la señal negativa (aversión) es la dopamina. La serotonina y la Dopamina,
octopamina también controlan la activación y la detención del movimiento (nadar, arrastrarse) en animales
simples como las sanguijuelas, los gusanos y las lampreas. 31 Esto sugiere
que el papel de estas catecolaminas en el estímulo y el desaliento de acciones tiene una larga historia
evolutiva. Sin embargo, todavía se desconoce cómo se relacionan los papeles que desempeñan estas
catecolaminas en estos otros animales con su papel en la toma de decisiones humana.
Experimentos recientes han descubierto que la serotonina está relacionada con la capacidad de
retener recuerdos a través de retrasos y con la perspectiva a largo plazo, pero que la serotonina no refleja
señales de error de predicción de valores negativos. 32 Por el contrario, la noradrenalina está implicada en el afecto
mi
Toda especie tiene una distribución de cambios genéticos sutiles entre sus miembros; por eso no todos somos
idénticos. Son estas pequeñas diferencias las que constituyen la clave de la evolución, que modifica la distribución
de estas pequeñas diferencias a lo largo del tiempo. 27 Estas diferencias se llaman polimorfismos : poli
personas para responder a los cambios en la contingencia de recompensa. Como veremos más adelante en el Capítulo 12, la corteza prefrontal es importante
para la caja de reconocimiento de situaciones, en particular ante cambios, y estas señales de dopamina se utilizan para determinar cuándo uno necesita cambiar
Al igual que ocurre con la dopamina, es probable que tanto la serotonina como la noradrenalina transmitan señales
generales que puedan utilizarse de muchas maneras.
GRAMO
En la actualidad, en la neurociencia es objeto de controversia si los ganglios basales son en realidad los que
impulsan el movimiento o si simplemente influyen en las decisiones que se toman en la corteza. Lo más probable, por
supuesto, es que ambas teorías sean correctas y que las sugerencias de acción realizadas por los ganglios basales
se envíen tanto a las estructuras motoras profundas del cerebro (y luego a la médula espinal) como a los circuitos
corticales (que luego se proyectan de vuelta a esas mismas estructuras motoras profundas del cerebro y a la médula
espinal). 40
Corteza motora
¿Cómo pueden los circuitos corticales tomar decisiones? Las estructuras corticales de control motor categorizan las
41
entradas provenientes de las estructuras sensoriales. Las estructuras sensoriales están categorizando aspectos del
mundo, y esos aspectos se vuelven cada vez más complejos a medida que se alejan 42 (En la corteza visual primaria,
manchas de color, esquinas, etc. En las las "categorías" son realmente "características del mundo", puntos, líneas,
cortezas visuales secundarias y terciarias, se encuentran otras "características" hasta que se convierten en categorías,
como caras, casas, objetos, etc. De manera similar, la corteza auditiva primaria reconoce características del sonido, y
las áreas auditivas secundarias y terciarias reconocen el habla, las palabras, la música, los géneros musicales, etc.)
El resultado de una categoría de situaciones puede tratarse como una señal de acción.
G Esta cuestión se complica aún más por el hecho de que estos neurotransmisores tienen efectos en el cerebro
más allá del error de predicción de valores, 37 y que todos estos neurotransmisores también tienen efectos fuera del
cerebro. 38 La serotonina tiene efectos en el intestino y los intestinos. La noradrenalina tiene efectos en la frecuencia
cardíaca y la presión arterial. La dopamina y la noradrenalina afectan a los sistemas simpático y parasimpático
periféricos del cuerpo (sin relación con la emoción de la simpatía, por supuesto). Los sistemas simpático y
parasimpático funcionan en contradicción entre sí: el sistema simpático prepara al cuerpo para la actividad estresante
(lucha, huida y el acto de reproducción), mientras que el sistema parasimpático mantiene el cuerpo en una actividad
sin estrés (seguridad, descanso y relajación poscoital). 39 Los complejos y diversos efectos de una determinada
sustancia química sobre diferentes estructuras implican que los medicamentos a menudo tienen efectos secundarios
no deseados y complican la farmacología.
Los mecanismos computacionales de este proceso de asentamiento ( cuencas de atracción en memorias direccionables
por contenido ) se comprenden bien. En el Apéndice C se puede encontrar una discusión detallada de este mecanismo.
Machine Translated by Google
Descubrimos que hay dos respuestas a las señales sensoriales en la corteza motora: una muy rápida (menos de
46
Respuesta de 50 milisegundos) y luego una respuesta más lenta (superior a 100 milisegundos).
La primera respuesta se produce a través de conexiones directas entre las cortezas sensoriales y motoras; la
segunda respuesta se produce a través de un camino más largo a través de más circuitos frontales. Por ejemplo,
cuando se les pide que se alejen de una señal, las neuronas corticales motoras inicialmente representan la
dirección hacia la señal, pero luego, influenciadas por la información procesada en los circuitos frontales
47
premotores, cambian su activación para reflejar la dirección de la acción.
Este problema se puede ver mejor en términos de la reacción a un derrape sobre el hielo. La primera
reacción que tiene la mayoría de las personas es frenar y girar contra el derrape, pero esto solo empeora las cosas.
De hecho, lo correcto en caso de derrape es disminuir la velocidad soltando el acelerador y luego girar hacia la
zona de derrape hasta recuperar la tracción. 48
Esto plantea un problema interesante con las interfaces cerebromáquina. Muchas personas han
argumentado que las interfaces cerebromáquina podrían acelerar los tiempos de reacción, pero parte de la
lentitud de los tiempos de reacción se debe a que el cerebro tiene que desarrollar la respuesta correcta.
Si se descodifica demasiado rápido la información de la corteza motora, se puede obtener una respuesta
errónea. Al igual que ocurre cuando se conduce durante un derrape, no se desea la primera reacción, sino la
reacción correcta, que a veces aparece en segundo lugar, solo después de que el cerebro haya tenido la
oportunidad de realizar un procesamiento adicional para encontrar la categorización correcta de la situación compleja.
También es importante recordar que estas categorías son en realidad dinámicas: aunque es más fácil
construir modelos computacionales de categorías como un valor estático, la corteza en realidad está encontrando
un camino a través de estas categorías. 49 Este camino es en realidad
una secuencia de categorías: mi camino al trabajo consiste en bajar primero por Roselawn, luego a la izquierda
en Hamline y a la derecha en Larpenteur... En cada punto, necesito ejecutar correctamente la conducta en dos
niveles diferentes: en un nivel, necesito ejecutar las acciones correctamente, detenerme en el semáforo cuando
está en rojo, avanzar cuando está en verde, no chocar con el coche que tengo delante, etc. Y en el otro nivel
(que suele denominarse nivel "superior" porque es más abstracto), necesito decidir el siguiente paso en nuestro
viaje: ¿hacia dónde giro en esta intersección? El objetivo de este capítulo es que, a veces, incluso esas
decisiones de nivel superior pueden ser inconscientes.
Sin embargo, incluso cuando decidimos conscientemente hacia dónde girar en una intersección, normalmente
no pensamos conscientemente “luz roja significa parar” o “luz verde significa seguir”. Esto es dividir en bloques
50 —Hemos almacenado el comportamiento en un fragmento para que podamos pensar
“girar a la izquierda”, no
“quitar el pie del freno, poner el pie en el acelerador, girar el volante”, etc. Un programador informático podría
decir que hemos compilado el proceso en una subrutina a la que podemos acceder fácilmente. Por supuesto, el
cerebro cognitivo todavía puede dividir estos bloques y controlar los componentes, como cuando intentamos
enseñar a alguien a conducir y decimos: “¡Es luz roja! ¡Para!” mientras pisamos a fondo el pedal imaginario del
lado del pasajero del coche.
En general, conducir es un gran ejemplo de este proceso de fragmentación. Recuerdo mis primeras
experiencias al volante de un coche, intentando calcular cuánta presión me atrevía a poner en el acelerador,
mientras el coche se lanzaba de repente hacia delante. O la forma nerviosa en que agarré el volante la primera
vez que entré en una autopista con coches que pasaban a toda velocidad a 112 kilómetros por hora. Otros
grandes ejemplos de este tipo de fragmentación son tocar un instrumento musical y caminar.
Caminar sobre dos piernas es en realidad una interacción compleja de equilibrio, movimiento hacia adelante
y control de uno mismo. Como cantó Laurie Anderson en su canción Walking and Falling de 1982 , “Estás
caminando. Y no siempre te das cuenta, pero siempre estás cayendo. Con cada paso te caes ligeramente hacia
adelante. Y luego te detienes para no caerte. Una y otra vez, estás caminando”.
Machine Translated by Google
“Caerse y luego detenerse para no caerse. Y así es como puedes caminar y caer al mismo tiempo…”
Cualquiera que observe a un niño pequeño dar sus primeros pasos puede ver lo complejo que es el proceso.
Cerebelo
La clave de estos comportamientos recopilados es el cerebelo, una fascinante estructura cerebral que se
encuentra en la parte posterior del cerebro, colgando sobre la médula espinal. En un cerebro humano, el
cerebelo parece un apéndice adicional que sobresale de la parte posterior del cerebro, pero de hecho el
cerebelo es una estructura evolutivamente mucho más antigua que la corteza. El cerebelo aparece por
primera vez evolutivamente en los vertebrados, y no ha cambiado su estructura básica desde los primeros
peces hasta los mamíferos. 51 (Debido a que el cerebelo es una estructura bulbosa distintiva, los cráneos de
muchos animales tienen bolsillos para acomodarlo. Por lo tanto, la ubicación del cerebelo se puede ver en
los fósiles de cráneos de animales antiguos, incluidos los peces e incluso los dinosaurios. 52 )
esta señal de aprendizaje es el experimento del prisma, realizado por un estudiante de 56 Un ejemplo clásico de
secundaria como parte de programas de divulgación de la neurociencia. En este experimento, se le da al sujeto un conjunto de
prismas que desplazan el mundo visual hacia un lado (por ejemplo, 20 grados a la izquierda). La persona intenta lanzar una
bolsa de frijoles a una canasta que se encuentra a unos pocos pies frente a él. Debido a que existe un desajuste entre el
mundo visual y las acciones motoras, el sujeto intenta lanzar una bolsa de frijoles a una canasta que se encuentra a unos pocos pies frente a
En el momento en que la persona está acostumbrada, lanza la bolsita de frijoles 20 grados hacia el lado
opuesto (hacia la derecha). En el transcurso de una docena de lanzamientos aproximadamente, el sujeto
ajusta su comportamiento para lanzar correctamente la bolsita al balde. Luego, cuando se quitan los prismas,
hay nuevamente un desajuste y la persona lanza la bolsita de frijoles 20 grados hacia el lado original (hacia
la izquierda). Nuevamente, en el transcurso de unos pocos lanzamientos (menos que antes), el sujeto
recupera la antigua asociación y puede golpear la canasta nuevamente. Estos cambios ocurren debido a
cambios de conectividad en el cerebelo.
En una feria de divulgación de neurociencia en una escuela secundaria local, una vez nos encontramos
con una persona que no mostró ningún efecto de los prismas al lanzar la bolsa de frijoles (aunque nunca había
I
Pronunciado “PURRkinjay” en honor a Jan Purkinje (1787–1869), un anatomista checo del siglo XIX.
quien notó por primera vez la hermosa estructura en abanico de las células de Purkinje.
Machine Translated by Google
EspañolHabía usado prismas antes); acertaba a canasta en el primer intento, en todos los intentos. Al
principio nos sorprendió mucho, pero después nos enteramos de que era una estrella local del
baloncesto. Es de suponer que había enseñado a su sistema motor a lanzar en línea recta
independientemente de lo que le dijera su visión. Ya había identificado la distancia a la canasta antes
de ponerse los prismas. Sabía que estaba mirando hacia delante y no tenía que usar las señales
visuales para corregirlo. Ya había aprendido a lanzar a cierta distancia y ángulo. A través de una extensa
práctica, había desarrollado una acción motora compilada que le permitía acertar con fiabilidad a canasta.
El cerebelo parece estar involucrado en estas acciones motoras compiladas o agrupadas.
Caminar, conducir, tocar un instrumento musical... El cerebelo es la clave para cronometrar
57 Hay algunas pruebas de que el cerebelo también puede
acciones y secuencias motoras fiables.
compilar secuencias cognitivas, pero esto sigue siendo controvertido. 58 (Es mucho más difícil
medir una secuencia cognitiva que una secuencia motora). Sin embargo, que el cerebelo tenga un
papel en las secuencias cognitivas no debería sorprendernos. Las personas pueden, sin duda,
agrupar
mentales de la misma manera que lo hacen con las secuencias secuencias
motoras físicas.cognitivas
Resumen
En este capítulo, hemos visto dos formas de decisiones de acción arbitrarias: el almacenamiento en
caché de decisiones almacenadas en un nivel alto (abstracto) y la compilación de secuencias
motoras almacenadas en un nivel bajo (concreto). El primero utiliza los ganglios basales para
identificar el siguiente paso correcto y el segundo utiliza el cerebelo para cronometrar las secuencias
de acción motora. Pero ambos sistemas de control motor/toma de decisiones pueden contrastarse
con los otros tres sistemas que hemos estado discutiendo: los reflejos están cableados
(evolutivamente) en nuestro sistema, no pueden cambiar ni los estímulos sensoriales que los
desencadenan ni las acciones que realizan; los sistemas pavlovianos/emocionales no pueden
cambiar las acciones desencadenadas pero pueden aprender a asociar nuevos estímulos con ellas;
los sistemas deliberativos pueden decidir tomar acciones arbitrarias en respuesta a situaciones
arbitrarias, pero requieren una gran atención y tiempo computacional para procesarlas. La
compilación de secuencias de acción nos permite tomar decisiones sobre fragmentos de
comportamiento en lugar de preocuparnos por cada pequeño detalle. Y el almacenamiento en caché
de pares situaciónacción nos permite prestar atención a otros planes mientras tomamos incluso
acciones arbitrarias complejas en respuesta a estímulos complejos. En los próximos capítulos,
analizaremos los sistemas adicionales necesarios para comprender la máquina de toma de
decisiones humana (sistemas perceptuales, de reconocimiento de situaciones y de motivación), y
luego pasaremos a analizar cuestiones de interacción entre los sistemas (el equilibrio entre
exploración y explotación, y el proceso de autocontrol), antes de analizar las consecuencias del cerebro físico y
Rudolpho Llinas (2002). Yo del vórtice . Cambridge, MA: MIT Press. • Paul Cisek
y John F. Kalaska (2010). Mecanismos neuronales para interactuar con un mundo lleno de
opciones de acción. Annual Review of Neuroscience, 33. • Kenji Doya, 269–298 .
(1999). ¿Cuáles son los cálculos del cerebelo, los ganglios basales,
¿Y la corteza cerebral? Redes neuronales, 12 , 961–974 .
Machine Translated by Google
11
Integración de información
Hojas en el viento
¿O un leopardo en el bosque?
¡No tardes mucho en decidir!
Cuando miras una imagen (por ejemplo, de un rostro), tus ojos se mueven de un rasgo importante a
Al siguiente. 1 otro. En parte, necesitas hacer esto porque los fotorreceptores en el ojo humano están
más concentrados en el centro de tu retina que en la periferia, lo que significa que tu visión es más
precisa (tiene mayor resolución A ) cuando miras algo directamente. Cada pocos cientos de milisegundos,
tus ojos hacen otro viaje (hacen un movimiento sacádicoB ) a otra ubicación. En el transcurso de unos
pocos segundos o minutos, has integrado la información importante sobre la imagen para responder
cualquier pregunta que tengas. A dónde miras, durante cuánto tiempo miras y durante cuánto tiempo se
detienen tus ojos en cada punto dependen de las preguntas que estás tratando de responder sobre la
do
imagen.
Los estudios experimentales sobre la toma de decisiones a menudo dificultan el reconocimiento
2 Los
perceptivo de la información, lo que significa que hay que integrar la información a lo largo del tiempo.
estudios antiguos hicieron esto porque les permitía usar el tiempo de reacción para diferenciar entre
condiciones. Los estudios nuevos lo hacen porque les permite estudiar cómo se activan las neuronas.
A
Todos estamos familiarizados ahora con los problemas de resolución visual gracias a la industria de las cámaras digitales.
B
Rara vez somos conscientes de estos movimientos sacádicos, aunque, como la mayoría de los sistemas motores, pueden tomarse
bajo control consciente.
do
Es posible identificar información sobre el mundo sin mirarlo directamente (como sucedería si intentaras que alguien no se diera
cuenta de que lo estás mirando. Como los ojos humanos tienen esclerótica blanca, podemos saber hacia dónde está mirando otra
persona, una cuestión importante para las criaturas sociales). No mirar algo requiere más esfuerzo porque uno tiene que recopilar la
información de los sensores de la periferia con una resolución menor y porque uno tiene que inhibir la tendencia natural a hacer
97
Machine Translated by Google
El proceso de toma de decisiones cambia a medida que el sujeto decide qué hacer. Es interesante que,
debido a esto, gran parte de la literatura neurocientífica sobre la “toma de decisiones” se centre en el
reconocimiento de situaciones, más que en la deliberación o en otros procesos de selección de acciones que
hemos estado analizando. En estas tareas perceptualmente difíciles (que analizaremos en detalle más
adelante), lo difícil es reconocer en qué situación las señales implican que uno no está decidiendo qué hacer.
Cada situación tiene un único resultado correcto. (Compare esto con los ejemplos que analizamos en el
Capítulo 9 cuando hablamos de personas que deliberan sobre opciones laborales o sobre grandes compras como automóv
Sin embargo, la categorización perceptiva es una parte clave del proceso de toma de decisiones, y estas
tareas perceptualmente difíciles nos han enseñado cómo integramos la información a lo largo del tiempo.
Se podría decir que Alan Turing (19121954) salvó el mundo. Turing dirigió el equipo de descifrado de
códigos en Bletchley Park, Inglaterra, que descifró los códigos nazis. Los alemanes habían desarrollado un
código que era tan complejo que creían que era indescifrable. Se basaba en una máquina, llamada Enigma , que
mensaje constaba de tres diales. La persona escribía un mensaje en la máquina y la máquina codificaba el
carácter por carácter en función de los diales. Los diales se configuraban de una manera específica cada día,
por lo que el equipo de descifrado de códigos tenía que descifrar el código de cada día de nuevo. Pero una
máquina capturada proporcionó a los Aliados el conjunto de diales posibles. Incluso si no conocían la
configuración para ese día, conocían los parámetros y podían calcular la probabilidad de que un mensaje
determinado viniera de una configuración de dial determinada. Debido a que se enviaban miles de mensajes
cada día, Turing y su equipo podían integrar la información entre estos mensajes. Midieron el peso de las pruebas
para cada escenario y se detuvieron cuando alcanzaron un umbral. Aunque no descifraron el código todos los
días, lo hicieron con la suficiente frecuencia como para poder leer las órdenes alemanas y saber lo que los
alemanes iban a hacer. Los alemanes pensaron que la Enigma era impenetrable y continuaron enviando
mensajes a través de ella hasta el final de la guerra. Tanto el libro de historia de no ficción de David Kahn, The
CodeBreakers, como la novela de ficción de Neal Stephenson, Cryptonomicon, cuentan esta historia con detalles maravillosam
Machine Translated by Google
sus logaritmos; de manera similar, dividir dos números es equivalente a restar sus logaritmos. El logaritmo es
una función que traduce esta razón en un número desde menos infinito hasta más infinito. (Esto resulta ser la
cantidad de información que hay para apoyar una hipótesis sobre la otra). Cuando las dos opciones son
iguales, esta diferencia entre los logaritmos es cero, y la diferencia se aleja de cero a medida que reunimos
información. Esto nos permite definir el peso de la evidencia de elegir izquierda o derecha como un solo
número (mayor que cero significará ir a la izquierda, menor que cero significará ir a la derecha).
,
Simplemente comenzamos desde cero e integramos nuestra información a lo largo del tiempo, moviéndonos
hacia arriba con evidencia para la primera opción y hacia abajo con evidencia para la opción alternativa.
Esto nos deja con tres parámetros importantes. En primer lugar, tenemos la pendiente , que es cuánto
debemos cambiar nuestra proporción con cada pieza de información que respalde una hipótesis sobre la
mi
otra. En segundo lugar, el sesgo determina desde dónde comenzamos nuestra decisión.
Finalmente, en tercer
,
lugar, está la condición de detención , que puede ser tomar la mejor opción después de un cierto tiempo o
(más comúnmente utilizada en la literatura experimental) la razón de probabilidades, donde decidimos que
tenemos suficiente información, es decir, cuando nos hemos desviado de cero (las dos opciones son iguales)
a un cierto umbral (una opción es mucho mejor, nos quedaremos con esa).
Considero que el modelo de carrera hacia el umbral es sumamente intuitivo, ya que implica sopesar los
pros y los contras de dos opciones y detenerse cuando estamos convencidos de que una opción es mejor que
la otra. Los parámetros primarios son aquellos que tienen sentido intuitivamente: el sesgo.
es nuestra preferencia por una opción sobre la otra, la pendiente es la rapidez con la que aprendemos sobre
las opciones y el umbral es qué tan seguros queremos estar antes de comprometernos con una opción.
El modelo de integración al umbral produce una distribución única de tiempos de reacción debido a la
forma en que ocurre la integración (Figura 11.1). 5 Resulta que está relacionado
con lo que en el campo de la ingeniería se conoce como función de riesgo : ¿cuánto tiempo pasará
antes de que algo suceda?, dado que dejamos de contar la primera vez que sucede. Esto se utiliza,
por ejemplo, para medir la primera vez que algo se estropea y debe repararse (como un avión). 6
También rastrea la física de una señal ruidosa que cruza una barrera de energía. 7
Imaginemos que las palomitas de maíz están en una máquina de aire caliente. Tenemos dos casos de una
función de “riesgo” aquí. Primero, las palomitas de maíz están rebotando, y algunas de ellas tendrán el rebote
suficiente para salir y cruzar el umbral de la máquina por sí solas. Cuanto más aire sopla, más rebotan las
palomitas de maíz (más aire = pendiente más rápida; salir de la máquina = cruzar el umbral). Segundo, el
calor en la máquina hace que el agua dentro de cada grano de palomitas de maíz se expanda; en algún
momento el agua se expande lo suficiente y hace estallar el grano (más calor = pendiente más rápida; grano
que explota = cruzar el umbral). Si la primera función de riesgo ocurre antes que la segunda, obtienes granos
sin explotar en tu tazón.
Estas teorías se han probado explícitamente en varios paradigmas experimentales.
F
El más simple es el paradigma del “ruido visual” o “nieve televisiva”. En este paradigma, el
sujeto mira fijamente una pantalla negra en la que se dibujan puntos brillantes. Algunos de esos puntos
mi
Curiosamente, la palabra inglesa “bias” tiene dos significados relacionados. Puede significar la
expectativa inicial, una suposición hecha antes de reunir información. En segundo lugar, puede significar una
preferencia por una cosa sobre otra, en particular cuando uno responde sin integrar adecuadamente la información.
Como señala Jan Lauwereyns en The Anatomy of Bias , en realidad son lo mismo: un estereotipo es una
expectativa inicial (a menudo errónea) que no está dispuesta a cambiar ante información adicional.
F
La mayoría de los televisores (y todos los monitores de computadora que muestran señales de televisión) son digitales en la
actualidad, pero los televisores más antiguos recibían señales analógicas. Los televisores analógicos que no estaban sintonizados con
70 fin
¡Entiendo!
¿acumulación?
Límite
alto
60 coherencia
medio
Acumulando 50 coherencia
evidencia
¿Comenzar la bajo
acumulación? coherencia
40
Inicial
Velocidad
disparo
(picos/
de
s)
inclinación
30
20
0 200 400 –200 0
alineado a alineado
inicio del movimiento Tiempo (ms) para sacar
Figura 11.1 Integración hasta el umbral. (Izquierda) Los acumuladores múltiples comienzan con un sesgo inicial
y cada uno avanza hacia el umbral integrando la evidencia acumulada a una velocidad diferente. El primero en
alcanzar el umbral gana y la percepción colapsa a la decisión. (Derecha) Las neuronas individuales en LIP
integran la información. Todos los ensayos comienzan con velocidades de activación similares (no hay sesgo inicial)
y terminan con las mismas velocidades de activación (al alcanzar el umbral), pero se integran a diferentes
velocidades según la coherencia de la señal sensorial entrante.
Panel derecho de Gold y Shadlen (2002), rediseñado a partir de Roitman y Shadlen (2002).
Reimpreso con permiso del autor y el editor.
desaparecen en el instante siguiente. Otros puntos se mueven en una dirección aleatoria. Pero algunos de los puntos
Los puntos se mueven juntos en una dirección dada (por ejemplo, hacia la izquierda). El objetivo es averiguar en qué
dirección va el subconjunto de puntos coherentes. Al variar la proporción de puntos que se mueven en la misma
dirección, el experimentador puede controlar cuantitativamente la velocidad a la que se proporciona información al
sujeto. Tanto los humanos como los monos son notablemente sensibles incluso a proporciones muy pequeñas,
pudiendo reconocer fácilmente tan solo el 10% de los puntos que se mueven en la misma dirección. 8
Esta tarea depende de la capacidad de los primates para detectar el movimiento. El cerebro quiere detectar
cosas que se mueven por dos razones. En primer lugar, si te mueves, todo el mundo que ves se mueve en sincronía
(este es el secreto de las ilusiones de movimiento que pueden producir las películas IMAX). Pero, en segundo lugar,
el cerebro quiere detectar otras cosas que se mueven en el mundo.
capacidad de detectar cosas que se mueven depende de una estructura cerebral llamada MT, que tiene G que La
yo
células que detectan cosas que se mueven en el mundo visual, y una estructura llamada LIP, que tiene células que
tienen curvas de ajuste a una dirección dada y aumentan su tasa de disparo.
Muestran una mezcla aleatoria de puntos blancos y negros que se denominaba “nieve”. Las señales de movimiento visual que
se muestran en el paradigma del ruido visual se parecen mucho a este ruido de televisión analógica.
G La estructura ahora se conoce únicamente por su acrónimo “MT”, pero en un tiempo este acrónimo
significaba corteza temporal medial (que significa “en el medio” [medial] de la corteza temporal). La corteza
temporal está ubicada debajo del resto del cerebro. En la literatura temprana, MT también se conocía como V5, ya
que fue la quinta área cortical visual descubierta. 9
yo
Nuevamente conocido por sus siglas (LIP), pero refiriéndose a la corteza intraparietal , Porque se sienta
10
lateral en la pared interna de uno de los surcos de la corteza parietal.
Machine Translated by Google
I
con el tiempo, mientras el mono observa la pantalla. (Hay una estructura cercana llamada MST, que detecta el primer
caso, donde todo el mundo visual se mueve, generalmente porque te estás moviendo dentro de él). Las características del
mundo detectadas por las células en MT son buenas para detectar animales y objetos en movimiento. Imagine, por ejemplo,
un animal camuflado (como un leopardo) moviéndose a través de un bosque. La mayoría de los puntos que ve parpadearían
con el viento, pero algunos de ellos (¡el leopardo!) se moverían de manera confiable en la misma dirección juntos.
Las células MT proporcionan información sobre la dirección de esos puntos en movimiento: la velocidad de disparo de
cada célula tiene una dirección preferida y el disparo de esa célula refleja la proporción de puntos que se mueven en esa
Las células LIP parecen estar integrando la información. (MT proyecta directamente a LIP).
La tasa de disparo inicial de una célula LIP refleja las predicciones iniciales del mono sobre si los puntos se moverán en la
dirección favorita de esa célula o no (el sesgo), la velocidad a la que aumenta el disparo refleja la información que viene de
MT (la pendiente), y cuando las células LIP alcanzan una cierta tasa de disparo, el animal reacciona (alcanzando el umbral).
13 Podemos pensar en esta decisión como controlada por dos neuronas, una que busca el movimiento hacia la izquierda y
otra que busca el movimiento hacia la derecha.
Ahora que hemos visto cómo esta idea de integración al umbral puede funcionar con dos
En cuanto a las opciones, es fácil imaginar cómo funcionaría con más opciones. 14 Por ejemplo, dudo que los monos Para
hayan evolucionado para elegir si los puntos iban hacia la izquierda o hacia la derecha. Es más probable que estos
experimentos estén aprovechando un sistema que evolucionó para detectar la dirección (cualquier dirección) en la que se
movía un objeto camuflado. En lugar de dos neuronas, tenemos cientos o miles de neuronas que representan una gama de
posibilidades, cada una integrando la información y cada una corriendo hacia el umbral.
Esto es algo llamado red del tipo "el ganador se lo lleva todo" y surge de un modelo simple que combina células
excitadoras e inhibidoras (células que aumentan la activación de las células a las que envían axones y células que
Se supone que las células excitadoras están conectadas de tal manera que las células que representan cosas similares
(por ejemplo, direcciones similares) se apoyan entre sí, mientras que las células que representan cosas diferentes (por
ejemplo, direcciones separadas 180 grados) no lo hacen. 15 Las células inhibidoras funcionan como una simple
retroalimentación negativa, de modo que la actividad total en las células excitadoras debe permanecer constante. Esta red
se examinó por primera vez en la década de 1970 como un modelo de corteza, y resulta ser un modelo muy razonable de
muchos aspectos de la corteza. El trabajo matemático en la década de 1980 mostró que el estado final estable de esta red
es un acuerdo entre las células excitadoras, con un subconjunto de células que están de acuerdo con un cierto resultado
que tienen todas altas tasas de activación y células que no están de acuerdo con ese resultado que tienen bajas tasas de
activación.
Esta red se utilizó en los años 90 como modelo del sentido de orientación y de ubicación de las ratas (células de ubicación
en el hipocampo) y como modelo de la corteza cerebral. Funcionalmente, estos modelos son un caso especial de las
Se analiza en el Apéndice C.
I
Nuevamente conocido enteramente por su acrónimo (MST), pero que alguna vez significó temporal superior medial , y
corteza“superior” significaba “encima”.
Machine Translated by Google
Un radar que recorre el cielo en busca de aviones que se aproximan es una percepción en serie .
Sólo puede ver una dirección a la vez; cada dirección se comprueba secuencialmente. Una
cámara analógica percibe la luz en paralelo , y cada sustancia química que detecta la luz en la
placa fotográfica reacciona al mismo instante. (Las cámaras digitales utilizan una combinación de
procesamiento paralelo y serial. Cada dispositivo acoplado a la carga en cada píxel de la cámara
detecta la luz al mismo tiempo [integrando los fotones durante el tiempo que el obturador está
abierto], pero luego los píxeles suelen leerse en la memoria en serie). Nuestros sistemas
perceptivos utilizan una combinación de procesamiento paralelo y serial, pero el paso paralelo
16
generalmente va mucho más allá que los detectores de luz simples.
Resulta útil examinar este procesamiento paralelo y serial en la visión. La luz es detectada por
la retina, que funciona de una manera masivamente paralela, como los píxeles de nuestra cámara
digital, integrando los fotones que llegan a nuestros ojos. Desde allí, las señales se envían al
tálamo y luego a la corteza visual primaria, que contiene detectores de características, en particular
para puntos, líneas y bordes. Cada uno de estos detectores de características se repite para cada
parte del campo visual, como si fuera para los píxeles de nuestros ojos. Desde allí, las señales se
envían a muchos sistemas visuales diferentes, que intentan extraer información de la señal en
paralelo. Un sistema, por ejemplo, intenta identificar objetos, otro intenta identificar caras, etc.
Otro reconoce objetos que se mueven a través del campo visual (MT).
El experimento clásico que examina la diferencia entre la percepción paralela y serial es el
experimento de la salida (Figura 11.2). 20 Su objetivo en esta tarea es identificar un determinado
objeto (el objetivo) en un campo de distractores. Cuando el objetivo es realmente diferente de los
distractores ( O en un campo de X ), el objetivo parece salir y la velocidad a la que sale es mayor.
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx XXXXXXXXOX
xxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxx incógnita XXXXXXXXXXXX X
Figura 11.2. Aparece en la pantalla. Intente encontrar la Y en el panel izquierdo y la O en el
panel derecho. Es mucho más fácil encontrar la O porque aparece en la pantalla, mientras que la
Y requiere una búsqueda en serie en la pantalla. Por supuesto, una vez que sepa dónde buscar,
tanto la Y como la O son fáciles de encontrar.
Los humanos hemos desarrollado áreas especializadas de la corteza para reconocer rostros. 17 Por eso
vemos rostros en todas partes (como en los tonos de luz y oscuridad de la luna vista desde la Tierra). Algunas
personas tienen una dificultad particular con esto, que es un trastorno llamado prosopagnosia18 (de prosopon
[ πρ ó σωπον, Griego para cara] y agnosia [ αγνωσíα ; a, α no + gnosis , γνωσις, conocer]). personas con
prosopagnosia tienen que depender de características de identificación (un peinado distintivo o modo de vestir) para
identificar a las personas. Markos Moulitsas describió su prosopagnosia en su blog "Daily Kos", y señaló su incapacidad
para ver películas de guerra (como Salvar al soldado Ryan ) o películas de la mafia (como El Padrino ) porque todos
19
tienen el mismo corte de pelo y están vestidos de la misma Aunque no se sabe qué causa la pros
manera. opagnosia, Doris Tsao descubrió recientemente que uno de los monos que estaba estudiando no tenía actividad
selectiva de caras en su corteza y mostró una incapacidad para reconocer caras, muy similar a las personas con
prosopagnosia, por lo que sabemos que esto también puede ocurrir naturalmente en otros primates.
Machine Translated by Google
El tiempo que tarda en encontrar el objetivo no depende de la cantidad de distractores (porque tiene
diferentes detectores de características para el objetivo y los distractores y puede hacer que el detector
de características se sintonice con el objetivo y lo registre cuando lo encuentre). Cuando el objetivo es
muy similar a los distractores ( Y en un campo de X ), debe verificar cada uno individualmente. Esto
significa que el tiempo que le toma encontrar el objetivo depende de la cantidad de distractores. Para
el reconocimiento paralelo (emergencia), su precisión es independiente del tiempo que le toma
responder. Sin embargo, para el reconocimiento en serie (búsqueda entre candidatos), cuanto más
tarde en responder, más preciso será (hasta cierto punto cuando haya reunido toda la información
disponible). Esto significa que existe una clara compensación entre velocidad y precisión para el
reconocimiento en serie.
El modelo de carrera hacia el umbral proporciona una buena explicación del equilibrio entre velocidad
y precisión en la búsqueda en serie. 21 Si el agente que utiliza un algoritmo de carrera hacia el umbral
quiere responder más rápido, simplemente reduce el umbral. Un umbral más bajo significa que la
carrera termina más rápido (por lo que el agente responde más rápidamente), pero con el umbral más
bajo, el agente ha tenido menos tiempo para analizar la información y, por lo tanto, será más susceptible
al ruido. De manera equivalente, el agente puede aumentar la pendiente. En ambos casos (reducir el
umbral o aumentar la pendiente), con cada pequeña pieza de información que recopile, se acercará al
umbral más rápidamente. Aumentar la pendiente y disminuir el umbral son matemáticamente
equivalentes. Por otro lado, mover su punto de partida más cerca del umbral es diferente: eso es mover
su sesgo, adivinar antes de que llegue la información. Si mueve su sesgo por encima del umbral, ni
siquiera tiene que esperar la información, ¡podría simplemente tomar la decisión sin información!
(Sospecho que esto es más común de lo que debería ser).
Ciertamente, es posible que en algunas tareas hayas reunido toda la información posible, que en
algún momento no haya nueva información disponible y hayas llegado a lo que matemáticamente se
llama una asíntota . En esos casos, esperar más tiempo no empeorará
tu decisión, pero tampoco la mejorará.
En algún momento hay que actuar. Sin embargo, en los experimentos psicológicos con datos ambiguos
y ruidosos (como el experimento de la nieve en la televisión descrito anteriormente), siempre es mejor
esperar y existe un equilibrio entre velocidad y precisión.
Entonces, ¿por qué los expertos pueden actuar con rapidez? ¿Cómo hicieron Ted Williams o Tony Gwynn para pegar cerca de la
K
El 40% de los lanzamientos que se les pelota? Se necesitan unos 400 milisegundos para que una pelota de béisbol
yo
lanzan desde el montículo del lanzador hasta el llegue a la pelota. Dado que el tiempo de reacción humano (incluso para los
23
plato de home. Los atletas más rápidos) tardan Uno tiene sólo un par de cientos de milisegundos.
unos 200 milisegundos (un par de décimas de segundo) en integrar la información sobre cómo gira la
pelota, dónde va a cruzar el plato y cuándo va a estar allí. Los jugadores con mejores tiempos de
reacción tienen mejores promedios de bateo.
K Ted Williams y Tony Gwynn fueron dos de los mejores bateadores de todos los tiempos, llegando a base un promedio de 48,4% y 38,8% del tiempo, con
yo
Un lanzamiento de 100 millas por hora que recorre 60 pies y 6 pulgadas demora aproximadamente 400 milisegundos.
Machine Translated by Google
Los expertos tienen dos ventajas sobre los no expertos: han entrenado su sistema perceptivo para reconocer
mejores características de la tarea y han entrenado su sistema de hábitos para almacenar en caché las opciones
más fiables sobre qué hacer. El entrenamiento perceptivo es como la fragmentación que vimos en el capítulo 10.
Los expertos han aprendido a representar la tarea de tal manera que sea más fácil determinar las respuestas
correctas a partir de las entradas disponibles; han identificado buenas categorías para la tarea. Los ejemplos
clásicos de esto son el ajedrez y los videojuegos. Ya hemos visto cómo un algoritmo de búsqueda computacionalmente
costoso puede vencer a un gran maestro de ajedrez (Deep Blue contra Gary Kasparov), pero que los grandes
maestros de ajedrez en realidad no hacen esa misma búsqueda computacionalmente costosa. 24
En cambio, los grandes maestros del ajedrez han aprendido a representar el tablero de maneras que limitan la
búsqueda que tienen que hacer. El experimento que demostró esto fue que los maestros del ajedrez son mejores a
la hora de recordar las posiciones de las piezas en los tableros cuando esas posiciones pueden surgir de
movimientos legales que cuando no pueden. Así como un músico experto ya no piensa en la digitación de un
acorde en una guitarra, un maestro del ajedrez ya no mira cada pieza del tablero como algo individual. Jugar a
videojuegos produce una pericia específica similar:
reconocimiento más rápido de los eventos del juego (entrenamiento de sistemas de reconocimiento perceptivo,
este capítulo) y reconocimiento más rápido de qué hacer en respuesta a esos eventos (entrenamiento de sistemas
procedimentales, Capítulo 10). 25
Es importante reconocer que esto no significa que la “intuición” sea mejor que el “análisis”, incluso para los
expertos. Los verdaderos expertos pasan de decisiones intuitivas a decisiones analíticas (de procedimentales a
deliberativas) según sea necesario. De manera similar, es importante reconocer que la intuición pura no es
confiable en estas situaciones: los expertos han pasado años (¡a menudo décadas!) entrenando sus sistemas
perceptuales y procedimentales. En cierto sentido, lo que hace el sistema de toma de decisiones procedimental que
examinamos en el Capítulo 10 es intercambiar tiempo perceptual y deliberativo durante la decisión por tiempo
durante el entrenamiento, de modo que, si bien lleva más tiempo aprender a hacer la tarea, una vez entrenada, la
tarea se puede hacer más rápidamente, aunque con menos flexibilidad. Las estimaciones típicas del tiempo de
entrenamiento para la mayoría de las tareas de nivel experto humano son de aproximadamente 10.000 horas. 26
(Eso es cinco años a 40 horas por semana durante 50 semanas por año, o cuatro años a 50 horas por semana
durante 50 semanas por año). Es por eso que la mayoría de los aprendizajes, como la escuela de posgrado, la
METRO
escuela de medicina, el tiempo en las ligas menores, etc., duran aproximadamente de cuatro a seis años.
Es importante reconocer que lo opuesto de “analítico” no es “intuitivo”. Tanto la toma de
decisiones analítica (deliberativa) como la toma de decisiones intuitiva (procedimental) surgen de
sistemas que han evolucionado para tomar decisiones precisas frente a la integración de
información. Lo opuesto de “analítico” es “simplista”, bajar el umbral hasta el punto de que no se
obtiene información (o mover el sesgo por encima del umbral), dos cosas que son desastrosas.
De hecho, tanto las respuestas analíticas como las intuitivas muestran disyuntivas entre velocidad
y precisión. Una clave del éxito de Tony Gwynn es que utilizó un bate muy ligero y esperó hasta
el último momento para golpear la pelota. 27 Una de las grandes diferencias entre Ted Williams,
Tony Gwynn y el resto de nosotros es que Williams y Gwynn tenían una vista mucho mejor.
Cuando Tony Gwynn se retiró, le comentó a un reportero que sus ojos se estaban deteriorando y que no podía
tomar la pelota tan pronto como antes. Cuando el reportero le preguntó cómo era su vista ahora, Gwynn respondió
que ahora era de aproximadamente 20/15, pero en un momento
Esto , por supuesto, nos recuerda el viejo chiste: nuestro protagonista bien vestido detiene a un transeúnte en una
calle de la ciudad de Nueva York y le pregunta: "¿Cómo llego al Carnegie Hall?" La respuesta inevitable: "¡Práctica,
mucha práctica!"
Machine Translated by Google
El tiempo había sido 20/10. Con una mejor vista, pudo captar la rotación de la pelota antes,
lo que le dio más tiempo para reaccionar, más tiempo para integrar la información y una
mejor oportunidad de golpear la pelota.
• Jan Lauwereyns (2010). La anatomía del sesgo . Cambridge, MA: MIT Press. • Joshua
I. Gold y Michael N. Shadlen (2002). El banburismo y el cerebro: descifrando la relación entre los
estímulos sensoriales, las decisiones y la recompensa. Neuron, 36
, 299–308 .
• Joshua I. Gold y Michael N. Shadlen (2007). La base neuronal de la toma de decisiones. 535–574.
Revista anual de neurociencia, 30,
Machine Translated by Google
12
Los experimentos de psicología animal suelen realizarse en entornos en los que no hay señales. Una rata en una
caja pequeña con nada más que un agujero para meter la nariz y tal vez unas cuantas palancas para empujar, o un
mono en una silla pequeña frente a una pantalla en blanco, tienen pocas opciones entre las que elegir.
Cuando suena el tono y se entrega comida al puerto de alimentación, no hay mucha ambigüedad sobre cuál era la
nueva señal. Cuando sucede unas cuantas veces más, el animal reconoce rápidamente que el tono precede a la
entrega de comida. Cuando aparece un punto en la pantalla, el mono lo mira: es lo único que ha cambiado en el
entorno.
Aun así, el comportamiento animal tiene que adaptarse a un entorno. Uno de los 1 Uno de los más
experimentos más famosos que se utilizan en la neurociencia en la actualidad es el laberintoacuático de
Morris, que consiste en una gran piscina de agua (de varios metros de ancho) que se vuelve opaca con una
pequeña cantidad de pintura blanca no tóxica soluble en agua. En esta tarea, se entrena a ratas o ratones
para que encuentren una plataforma oculta bajo el agua. Esta tarea es popular porque es particularmente
A
daños a ciertas estructuras cerebrales, como el hipocampo. sensible a la toma de decisiones.
A
Como en cualquier experimento clínico, la interpretación de los estudios de lesiones debe moderarse con una
comprensión de las implicaciones lógicas. Los daños en el hipocampo provocan problemas en el laberinto acuático
de Morris, pero no es cierto que los problemas en el laberinto acuático de Morris impliquen daños en el hipocampo.
107
Machine Translated by Google
Desde esta perspectiva, el laberinto acuático de Morris es muy interesante porque la tarea se puede resolver
mediante sistemas deliberativos o procedimentales (hábitos), según la secuencia de entrenamiento. Los
3
niños se sientan Pero, ¿qué es lo primero que hacen las ratas en esta tarea? Nadan alrededor.
en el borde de la piscina, buscando una salida. Solo después de explorar a fondo esta posibilidad, comienzan
a dirigirse hacia la plataforma.
En el caso de los seres humanos, las señales importantes en los experimentos de psicología y
neurociencia suelen identificarse explícitamente para el sujeto: "Verás un conjunto de caras. Intenta identificar
"
caras que has visto antes... cuál". Incluso cuando no se identifican explícitamente, aunque los
entornos para los experimentos de psicología humana suelen ser ricos en señales, la señal importante suele
ser obvia para el sujeto. Una máquina de fMRI es un espacio claustrofóbico con paredes estrechas a tu
alrededor, una jaula de metal alrededor de tu cabeza y ruidos extremadamente fuertes y palpitantes.
4
Sabemos Y, sin embargo, cuando la señal visual está activada, sabemos que debemos prestarle atención. En parte,
que debemos prestarle atención porque tenemos una historia de lo que esperamos que suceda en uno de
estos experimentos.
Pero, como ya he señalado antes, la vida fuera de los experimentos psicológicos se compone de una
plétora de señales que inciden en nuestros sentidos en todo momento. No es frecuente que estemos
sentados, mirando una pantalla, intentando averiguar si un pequeño subconjunto de un conjunto de puntos
que se mueven aleatoriamente tiende a moverse más en una dirección que en otra. Es cierto que hay veces
en las que vemos a gente escudriñando la distancia o la oscuridad (pensemos en un marinero de pie en el
puesto de vigía de un barco, vigilando la tierra, o en un cazador acechando a un ciervo); sin embargo, la
mayoría de las veces, el problema es que hay demasiadas señales, no muy pocas.
Reconocimiento de la situación
Me interesé por primera vez en la cuestión del reconocimiento de situaciones cuando hablé con uno de mis
colegas (Steve Jensen) durante el almuerzo. Steve estaba fascinado por un fenómeno de un ensayo 5 Estos
del corazón cambia a un ritmo pacientes tienen un riesgo de arritmias cardíacas repentinas (donde el latido
incorrecto) y se les ha implantado un desfibrilador cardioversor (ICD) conectado al corazón. Estos dispositivos
detectan el ritmo del corazón y, si ese ritmo se altera, proporcionan una descarga eléctrica para reiniciar el
corazón. (Al igual que un desfibrilador externo puede dar una descarga eléctrica al corazón para que vuelva
a tener ritmo, también puede hacerlo uno interno). A diferencia de un marcapasos, que proporciona un ritmo
lento y constante al corazón, el DCI se activa solo cuando el ritmo se detiene o es incorrecto. Además, a
diferencia de un marcapasos, el DCI duele muchísimo cuando se activa. A diferencia de un desfibrilador
externo, que se utiliza solo en pacientes inconscientes, el DCI suele activarse mientras el paciente está
consciente.
En tales situaciones, el paciente se ve repentinamente expuesto a una experiencia extremadamente
negativa (aunque potencialmente podría haberle salvado la vida). Estos pacientes con DCI tienen las
asociaciones negativas más extrañas con las cosas de su vida. Steve quería saber qué hizo que el paciente
decidiera que el culpable era el tenedor y no la cuchara, o que era el acto de sentarse en una silla y no reírse
con los amigos. Claramente, tiene algo que ver con lo que estos sujetos estaban atendiendo en ese momento,
pero nos hizo pensar en la cuestión de cómo decidimos qué señales son importantes.
En la literatura sobre robótica, informática y psicología que estudia el aprendizaje por refuerzo, esto se
6
denomina el problema de asignación de créditos . En general, la suposición en
estos modelos y experimentos es que hay un pequeño subconjunto de señales potenciales que
Machine Translated by Google
Puede ser importante y el agente (el animal o la simulación por ordenador) tiene que averiguar
cuál es la clave para tomar la decisión correcta. Pero sabemos por otros experimentos (como el
laberinto acuático de Morris y otros experimentos de navegación espacial) que a menudo es una
constelación de señales la que informa al animal. 7 Se puede eliminar un subconjunto
de las señales y el animal seguirá encontrando su camino correctamente, siempre que haya suficientes señales
disponibles. Ninguna señal es clave.
Nos dimos cuenta de que la mayoría de los modelos informáticos de toma de decisiones asumían que el
agente sabía qué situaciones posibles estaban disponibles (lo que se conoce técnicamente como espacio de
estados ) y, a menudo, sabía cómo cambiaban de una a otra (lo que se conoce técnicamente como matriz de
transición ), pero que, en realidad, los animales creaban situaciones a partir de señales. Los animales reales
8
(incluidos los humanos) categorizaban las señales en situaciones . La categorización simple en sistemas
neuronales se entiende bien y se puede modelar con memorias direccionables por contenido . De
hecho , existen sistemas de aprendizaje muy bien estudiados que categorizan automáticamente las
entradas, incluso sin supervisión.
10 Estos sistemas se denominan algoritmos de aprendizaje no supervisado.
y trabajar identificando regularidades en las entradas.
Utilizando un algoritmo estándar de aprendizaje no supervisado, construimos un modelo que incorporaba
un componente de categorización de situaciones en un agente estándar de aprendizaje de refuerzo (un
agente que aprendía qué hacer en qué situación, esencialmente un agente de aprendizaje procedimental en
la terminología utilizada en este libro). 11 Descubrimos que este componente de reconocimiento de
situaciones resultó cambiar la psicología observada de nuestro agente de varias maneras importantes. La
más importante fue que la decepción (falta de entrega de recompensa) se volvió diferente del castigo (entrega
de un estímulo negativo). En nuestro modelo, la decepción condujo al reconocimiento de un cambio en la
situación, mientras que el castigo condujo a una nueva asociación.
(Hemos hablado de las diferencias entre recompensa, refuerzo y decepción, y sus contrapartes negativas
[castigo, aversión y alivio] en el Capítulo 4.)
Este modelo sugiere que existe un efecto de contexto significativo en el reconocimiento de cambios en
nuestras expectativas de recompensa o castigo. Esto puede explicar por qué, por ejemplo, los adictos que se
desintoxican en los hospitales recaen al ser dados de alta y volver a su vida normal, o por qué los estudiantes
que aprenden las respuestas correctas sobre electricidad en la clase de física siguen siendo incapaces de
construir correctamente circuitos cuando se les da un conjunto de baterías reales y otros componentes
12
eléctricos para construir.
También pudimos manipular parámetros en nuestro modelo para producir simulaciones de problemas de
juego debido al reconocimiento incorrecto de situaciones, ya sea porque el agente pensó que podía controlar
una situación aleatoria (la ilusión de control , creer que dos resultados se debían a dos situaciones cuando
en realidad ocurrieron debido al azar dentro de una sola situación) o porque el agente no pudo reconocer un
cambio en una situación (lo que llevó al fenómeno de perseguir pérdidas y continuar jugando incluso ante
, es solo una casualidad). 13
una pérdida devastadora porque el agente piensa que la diferencia
Aunque nuestro modelo fue capaz de explicar una serie de fenómenos psicológicos (como por
qué la extinción conductual no es lo mismo que el olvido o por qué los animales tardan más en
extinguir recompensas que se les entregan de forma variable) y una serie de fenómenos clínicos
(como la recaída relacionada con el contexto en la adicción o la ilusión de control en el juego), 14
el algoritmo de aprendizaje no supervisado que utilizamos fue un mecanismo estático de
categorización de señales. El algoritmo tomó el conjunto de señales actualmente disponibles y
determinó si era parte de una situación conocida o si tenía que declararse una
15situación
El mundonueva.
real es,
por supuesto, mucho más complejo.
Machine Translated by Google
Por supuesto, el reconocimiento de situaciones no es todo o nada: las situaciones son similares y
diferentes a otras situaciones. Tomar decisiones correctas requiere que seamos capaces de reconocer
tanto las similitudes como las diferencias entre las situaciones. La afirmación habitual atribuida al filósofo
griego Heráclito es que “nunca te metes dos veces en el mismo río”, pero los fragmentos que tenemos del
griego real sugieren que una mejor interpretación es que algunas cosas permanecen constantes a pesar
aprender, tienes que tener cierta constancia entre tu pasado y tu futuro. del cambio. 16 Si vas a
Necesitas reconocer las similitudes entre tu pasado y tu presente para poder traducir los éxitos y fracasos
pasados en planes presentes. Para resolver esta paradoja, necesitamos un sistema que pueda categorizar
las situaciones, reconociendo tanto las similitudes como las diferencias entre tu pasado y tu presente.
Hago muchas presentaciones científicas para distintos públicos. Cuando preparo las diapositivas para
una presentación, trato de asegurarme de que sean las adecuadas para el público al que voy dirigidas.
Recuerdo la primera vez que fui a dar una charla en Japón. Mi esposa me señaló que la mayoría de los
científicos japoneses podían leer el inglés escrito mucho mejor de lo que podían entender el inglés hablado.
Así que añadí una sección a cada una de mis diapositivas en la que describía los resultados básicos de
esa diapositiva (después descubrí que esto también ayuda a los hablantes nativos de inglés). Pero aunque
la situación era ligeramente diferente, no pensé que dar una charla en Japón fuera una situación nueva,
sino que la definí como un caso especial de mi categoría de dar una charla. Esta naturaleza jerárquica es
17
una clave para la categorización humana. Un pingüino es un pájaro, pero también
nada en el agua y no vuela. Así como clasificamos nuestros conceptos en una jerarquía compleja con
casos especiales que no encajan del todo en las categorías, también debemos clasificar las situaciones
de maneras complejas.
Las situaciones también son dinámicas. No nos limitamos a ver un conjunto de señales, clasificarlas
como una situación y responder a ellas, sino que reconocemos una secuencia de situaciones y viajamos
a través de ella. Yo viajo por el aeropuerto de MinneapolisSt. Paul (MSP) aproximadamente una vez al
mes (a veces más, pero trato de limitarme a viajar menos de una vez al mes). A veces llevo mi computadora
portátil, a veces no. A veces llevo a mi familia conmigo, a veces no. A veces he facturado una maleta, a
veces llevo solo equipaje de mano. Pasar por el control de seguridad con mi computadora portátil es
diferente a no hacerlo. De manera similar, el control de seguridad es diferente si estoy solo o si tengo a
mis hijos, y es diferente si mis artículos de tocador están en mi bolso de mano o los despacho. Y, sin
embargo, no tuve que volver a aprender a pasar por el control de seguridad desde cero la primera vez que
me dijeron que tenía que sacar mis artículos de tocador de mi equipaje de mano y pasarlos por la máquina
de rayos X por separado. Pude tomar lo que sabía sobre pasar por la seguridad del aeropuerto y modificarlo
para incluir sacar mis artículos de tocador de mi maleta de mano.
Pasar por el control de seguridad del aeropuerto es un buen ejemplo de una situación dinámica, lo que
podríamos llamar un guión . 18 Las acciones en cada etapa son muy diferentes, y sin embargo todas
van juntas en una secuencia reconocible. Primero, necesitas tu identificación y tarjeta de embarque.
Una vez que las revisas, debes esperar en la fila para que te entren los recipientes de plástico donde
colocar tus cosas. En los aeropuertos estadounidenses, debes quitarte los zapatos. (Una vez
comencé a quitarme los zapatos en un aeropuerto europeo y el agente de seguridad me miró con
sorpresa y preguntó: "¿Qué estás haciendo?"). Pasar por el control de seguridad del aeropuerto es
una secuencia de sustituciones y acciones.
Machine Translated by Google
Un guión es una línea argumental, una categorización de una secuencia que puede modificarse en
sus subetapas. Los puntos importantes aquí son tres. Primero, categorizamos las situaciones del mundo
para actuar dentro de él ( ¿Cuáles son las claves importantes aquí? ). Segundo, esas categorías son
complejas y jerárquicas ( Dar una charla en Japón es un caso especial de mi categoría de dar una
charla ). Tercero, estos guiones son dinámicos ( Pasar por la seguridad del aeropuerto es una secuencia
compleja y dinámica de situaciones y acciones ). Estos guiones son narrativas, historias que nos
contamos a nosotros mismos sobre nuestras vidas.
Narrativa y literatura
Los instructores de escritura les dicen a los escritores noveles que encuentren el personaje y
luego lo pongan en la situación más difícil posible.20 Lo que hace que una situación sea difícil depende del
personaje sobre el que se está escribiendo. En cada etapa de una historia, nos preguntamos: “¿Qué haría este
personaje en esta situación?” Somos muy buenos para reconocer la ficción forzada, donde los personajes hacen algo
que no es propio de ellos para avanzar en la trama.
21 Nos contamos historias de nuestras
Fundamentalmente, los humanos somos criaturas narrativas.
vidas y definimos nuestras vidas en términos de esas historias. Usamos la narrativa para explicar
nuestro pasado, reconocer nuestro presente y predecir el futuro. Planificamos el futuro contándonos
historias de lo que creemos que sucederá (véase el Capítulo 9). Reconocemos nuestro presente a
través de los guiones que estamos recorriendo e intentamos comprender nuestras acciones pasadas
y las cosas que nos han sucedido en términos de una estructura narrativa, contando historias. Por
supuesto, como vimos en el Capítulo 9, ese pasado se construye, se reconstruye, podríamos decir.
Al cambiar las historias que nos contamos, reinterpretamos por qué hicimos lo que hicimos y
cambiamos quiénes somos.
Por ejemplo, la simple frase “No existe tal cosa como una bebida para un alcohólico” implica que las opciones de
decisión que usted tiene en el futuro no son entre ir al bar y tomar una sola bebida o quedarse en casa y aburrirse,
sino más bien entre ir al bar y emborracharse mucho (y por lo tanto arrepentirse) o quedarse en casa y no hacerlo.
Este es un proceso llamado “agrupamiento” en la literatura de neuroeconomía. Al tomar decisiones futuras juntas, uno
22
ve tanto las consecuencias inmediatas como las de largo plazo. Mediante agrupamiento
Los modelos computacionales de esto muestran que estos efectos de agrupamiento pueden cambiar las decisiones
de maneras que las decisiones no agrupadas no pueden.
En este momento, no sabemos mucho sobre la neurofisiología de cómo se representan las historias dentro del
cerebro. Claramente debe involucrar representaciones de categorías y recuerdos direccionables por contenido.
Sabemos por la literatura psicológica que deben existir, y sabemos algo sobre cómo se representan las categorías
estáticas dentro del cerebro, pero la complejidad de los sistemas de reconocimiento de situaciones (como la naturaleza
jerárquica) y la dinámica de esas representaciones (como la estructura narrativa y el efecto de esa estructura narrativa
en la toma de decisiones) todavía son preguntas muy abiertas en la literatura científica actual.
artículos científicos sobre el papel de la narrativa, simplemente te sugeriré que leas ficción. Los grandes autores son
B
agudos observadores de la condición humana.
B
La buena ficción puede ser tremendamente informativa, pero, como sucede con cualquier artículo científico, hay que involucrarse.
13
Motivación
Montañas tropicales a
través de la red de una hamaca azul,
acurrucados juntos,
leyendo,
despertando.
Hasta ahora, hemos hablado de las decisiones como resultado de reflejos aprendidos evolutivamente
y de sistemas pavlovianos, deliberativos y procedimentales que aprenden de recompensas y
castigos. Hemos hablado de cómo los animales integran información sobre el mundo y categorizan
situaciones para tomar sus decisiones. Sin embargo, a lo largo de nuestra discusión hemos eludido
una pregunta fundamental: ¿qué define el objetivo? Identificamos la señalización opioide como la
medición de los componentes positivos y negativos de recompensa y castigo, y la señalización
dopaminérgica como la medición de las diferencias entre lo previsto y lo esperado (véanse los
capítulos 3 y 4). Pero ninguna de estas define cuáles son esas recompensas positivas o castigos negativos .
Los primeros modelos explícitos de toma de decisiones asumieron que el objetivo era maximizar
su propia utilidad .
2;A Desde el comienzo mismo de la literatura económica, quedó
inmediatamente claro que era imposible definir la utilidad de una manera general que fuera la
A
Aunque generalmente se cita a Adam Smith por el concepto de que cada individuo maximiza su propia
utilidad, es importante señalar que reconoció que esto no era estable en su forma más simple.
La conceptualización de Smith era en realidad bastante compleja, y sugería que el éxito económico nacional
dependía de lo que hoy conocemos como empatía, simpatía y castigo altruista. Por ejemplo, reconocía la
importancia de las garantías gubernamentales de equidad en el mercado, así como los peligros de los
3
monopolios y otras complejidades más allá de la simplicidad de la maximización de las ganancias individuales.
113
Machine Translated by Google
lo mismo para todas las personas, por lo que los matemáticos Nicolaus Bernoulli (16951726) y su hermano menor
Daniel Bernoulli (17001782) propusieron la idea de utilidad subjetiva, que sugiere que cada uno de nosotros tiene una
B Pero todavía no define
medida interna de esa utilidad.
cómo nuestra interacción con el mundo se traduce en recompensas y castigos.
De manera similar, los modelos computacionales originales de toma de decisiones definieron el objetivo a
Estos
maximizar como una función de recompensa del tiempo o la situación, pero nunca definieron cuál era la recompensa.
modelos de computadora hicieron esto para evitar explícitamente la pregunta que estamos tratando de abordar aquí.
Los autores de esos modelos informáticos intentaban comprender los algoritmos de toma de decisiones en un mundo
informático imaginario (sin cuerpo). Cuando esos algoritmos se tradujeron a la robótica, los autores tuvieron que
8
codificar los objetivos en los robots.
B La historia de por qué los hermanos Bernoulli idearon la utilidad subjetiva es interesante, particularmente porque da una
idea de los problemas que surgen al intentar derivar la microeconomía a partir de los primeros principios.
4 Los hermanos estaban tratando de entender cómo incorporar la probabilidad a la utilidad: ¿cuánto
debería gustarle a uno una probabilidad del 10% de obtener $50? Para simplificar, asumieron que uno debería gustarle
un 10% más. Por lo tanto, el 10% de $50 debería ser equivalente a $5. El problema con esto es que se pueden crear
paradojas a partir de esta suposición que son claramente erróneas.
El caso que los hermanos Bernoulli idearon se llama “la paradoja de San Petersburgo” porque fue presentado por
primera vez en la Academia Imperial en la corte de Pedro el Grande en San Petersburgo. Imaginemos un juego con las
siguientes reglas: pagamos una tarifa para entrar y luego se lanza una moneda al aire. El juego se detiene cuando la
moneda sale cruz. El juego paga $1 por cada lanzamiento de moneda. Por lo tanto, si sale cruz en el primer lanzamiento,
ganamos $1, pero si obtenemos 99 caras seguidas de una cruz, ganamos $100. La pregunta es ¿ cuánto pagaríamos
por jugar a este juego? Debido a la forma en que está construido el juego, el pago matemáticamente esperado es
infinito, y una persona lógica (a la que los economistas llaman “racional”) debería estar dispuesta a pagar cualquier
cosa para jugar a este juego.
Por supuesto, la gente sólo está dispuesta a pagar una pequeña cantidad para jugar a esto. (Compare la paradoja
de San Petersburgo, que parece errónea aunque sea lógica, con las distorsiones que vieron Kahneman y Tversky, 5
que parecen correctas aunque sabemos que son ilógicas, como el ejemplo de la gripe asiática, donde describir el
problema en términos de personas salvadas o personas perdidas cambia la elección [ver Capítulo 3]).
Los hermanos Bernoulli propusieron que la razón por la que la gente no pagaba grandes sumas para jugar a este
juego era que en realidad estaban maximizando la “utilidad subjetiva”, en la que los pagos cada vez más altos tenían
cada vez menos valor. Por lo tanto, 200 dólares no valían el doble que 100. Bernoulli sugirió específicamente una
función de raíz cuadrada, es decir, el valor subjetivo es la raíz cuadrada del valor real ofrecido.
Sin embargo, no es difícil modificar la paradoja de San Petersburgo para destruir cualquier función de valor
ilimitada. Una posible explicación es que nuestras funciones de valor subjetivas no son ilimitadas. Al final, no importa
cuánto dinero se paga, es sólo una "gran victoria". El problema con esta hipótesis es que está muy claro (al menos en
lo que respecta al dinero) que esto no es cierto. Los multimillonarios que han visto saciados todos sus deseos durante
mucho tiempo siguen luchando por más dinero. (Veremos por qué más adelante en este capítulo). Las explicaciones
actuales para la paradoja de San Petersburgo se basan en las diferencias en cuanto a cuánto nos gustan las ganancias
y las pérdidas (la gente odia las pérdidas más de lo que le gustan las ganancias) y el reconocimiento de que nunca se
te puede ofrecer una cantidad infinita de dinero porque, al final, te arruinarás.
Mi intuición es que parte de la respuesta puede ser que la valoración se hace en línea y que el sistema de
valoración en nuestros cerebros no puede hacer la suma infinita necesaria para que valga la pena pagar por la paradoja
de San Petersburgo. Si la persona suma sólo los primeros casos y luego dice que la probabilidad de que salgan 10
caras seguidas es tan improbable que no vale la pena pensar en ello, entonces el pago máximo no es infinito. (Por
supuesto, la gente juega a la lotería, que tiene una probabilidad de pago mucho menor). Aunque la explicación de los
hermanos Bernoulli de la paradoja de San Petersburgo como una transformación de la utilidad ya no es la historia
6
aceptada, el concepto de una modificación interna de la utilidad subjetiva sigue vigente.
Machine Translated by Google
Motivación 115
Los teóricos que estudian cómo los animales buscan comida en la naturaleza han argumentado que los animales
(incluidos los humanos) están maximizando sus ganancias de energía y minimizando su consumo de energía. 9
costos.Por ejemplo, imaginemos a un colibrí recolectando néctar de una flor. Para obtener el néctar, el colibrí se
cierne frente a la flor, extrayendo el néctar. A medida que el ave bebe el néctar se vuelve cada vez más difícil
extraerlo. En algún momento, la energía que se gasta para batir sus alas lo suficientemente rápido para flotar es
mayor que la energía que está extrayendo de la flor, y debería ir a otra flor. Ir a otra flor es riesgoso porque el
ave no sabe cuánto néctar hay disponible en esa otra flor.
Tal vez ya se haya agotado. Tal vez el pájaro busque durante mucho tiempo. Es posible calcular el tiempo óptimo
que el pájaro debería pasar en un área de alimento y cuándo debería irse. Este tiempo óptimo depende del
tamaño de la área, la expectativa de cuánta comida queda en ella, cuál es el tiempo de viaje esperado hasta la
siguiente área y la cantidad probable de comida que el pájaro esperaría encontrar en la siguiente área.
Estas ecuaciones predicen correctamente los tiempos de permanencia y salida de aves, mamíferos e insectos
que buscan alimento y cazan, las transiciones en los experimentos de toma de decisiones de los monos, incluso
para los cazadores y recolectores humanos que deciden cuándo y dónde buscar comida, y para las personas
que buscan información en la Web y en el mundo. 10
Pero estas teorías de búsqueda de alimento se basan en el supuesto de que el único propósito de estos
animales es la supervivencia. La teoría de la selección natural de Darwin nos dice que lo que realmente impulsa
el éxito no es la supervivencia sino la procreación de genes en futuras generaciones, en particular la procreación
11
exitosa de futuros procreadores exitosos. Existen numerosos ejemplos de
animales que se sacrifican por su futuro genético. Incluso algo tan simple como que un padre alimente a sus hijos
es una prueba de que hay algo más en juego que la supervivencia individual. Todos conocemos ejemplos de
padres que se sacrifican por sus hijos, ya sean pingüinos que se mueren de hambre para mantener calientes los
huevos, estorninos que llevan comida a un nido, una osa polar que protege a sus cachorros o inmigrantes
humanos que sacrifican sus sueños para que sus hijos puedan triunfar en una nueva tierra.
Por supuesto, también existen los estudios clásicos de los insectos sociales (abejas, hormigas), que viven
en grandes colonias donde los zánganos se sacrifican por una reina y sus hijos. 12 La razón de
esto ahora se entiende bien, y se debe al hecho de que, debido a la forma en que funciona la genética de los
insectos, un zángano es genéticamente más similar a sus hermanas que a sus propios hijos, por lo que
evolutivamente prefiere tener más hermanas que tener más hijos.
Estas descripciones presuponen que los animales están calculando cómo maximizar su éxito genético. No
sé lo que piensa usted, pero yo no suelo pasarme todas las mañanas pensando: “¿Cómo puedo aumentar mi
éxito genético hoy?”. Estoy bastante seguro de que ningún otro animal lo hace. En gran parte, esto se debe a
que determinar qué es lo que conducirá al éxito genético es muy difícil de predecir. Un cálculo de este tipo
requeriría una enorme cantidad de capacidad mental; es poco probable que un individuo que pase demasiado
tiempo preocupándose por ello lo consiga y pronto se vería superado genéticamente.
Entonces, ¿qué define los objetivos que queremos? Una sugerencia es que tenemos funciones de objetivos
intrínsecos preprogramados evolutivamente en nuestros cerebros, 13 pero eso no dice cuáles son esos objetivos.
Apuesto a que nunca pensaste que cocinar para tus hijos tuviera tanto significado.
do
Machine Translated by Google
Estamos de vuelta a los objetivos codificados de forma rígida que los especialistas en robótica pusieron en sus robots. Estos autores
sostienen que nuestra historia evolutiva ha codificado de forma rígida nuestros cerebros con objetivos que luego buscamos
independientemente de su uso evolutivo real. Por ejemplo, a los perros les gusta perseguir cosas, presumiblemente porque en el
pasado evolutivo, las principales cosas que perseguían eran animales grandes como ciervos, alces y wapitíes. Para muchos perros,
las principales cosas que persiguen ahora son automóviles. Estos conceptos se impulsaron en la década de 1970 bajo el disfraz de
la sociobiología , generalmente enunciados de forma demasiado simple y demasiado poco dispuestos a abordar la complejidad de
Los orígenes de la sociobiología se encuentran en los estudios de etología animal, particularmente en los estudios de insectos.
Años 18 .
Mientras que los insectos suelen ser interpretados como pequeños robots, con rutinas simples que a menudo son
reconocibles (las polillas vuelan en espiral hacia las luces) y a menudo con modos de falla simples (como puede ver cualquiera que
observe a una polilla volar hacia una llama), las aves y los mamíferos son más complejos, y los humanos en particular. Los modos
de falla humanos también son particularmente complejos, pero eso no significa que no sean identificables. (Abordaremos muchas
de las formas en que los sistemas de toma de decisiones fallan [sus modos de falla ] en la siguiente sección del libro).
Las interacciones sociales humanas son increíblemente complejas, pero esto no implica que sean aleatorias, inobservables o
no identificables. Como se ha comentado en el capítulo 12, los novelistas y dramaturgos llevan milenios observando a los seres
humanos. Como público, reconocemos que cada individuo tiene un carácter coherente. En una novela, una obra de teatro o una
película, si alguien hace algo que “no es propio de él”, se nota como un pulgar dolorido. Tenemos una gran parte de nuestro cerebro
dedicada a reconocer las interacciones sociales. ¿Significa esto que sabemos hacia dónde saltará un individuo? No a la perfección,
pero podemos predecir lo que es probable que haga un individuo y hacemos nuestros planes en función de esas predicciones.
¿Cuáles son, entonces, esas funciones intrínsecas de recompensa? Obviamente, cuando tenemos hambre, queremos comida;
cuando tenemos sed, queremos agua. Y, obviamente, deseamos sexo. Observemos que el deseo de sexo es diferente al deseo de
tener hijos. El desarrollo evolutivo del deseo de sexo como medio para impulsar la procreación, en lugar del deseo de tener hijos
como medio para la procreación, es un ejemplo clásico de una función intrínseca de recompensa. Por supuesto, algunas parejas
tienen relaciones sexuales porque están tratando de tener un bebé, pero, a menudo, el sexo es por sus propios placeres, y las
D
La sociobiología ha adquirido una mala reputación en las últimas décadas porque sus conclusiones se han
considerado prescriptivas en lugar de descriptivas , y porque a menudo han creado amplias generalizaciones a
partir de observaciones limitadas. 15 Más adelante (en el capítulo 23) analizaremos la cuestión de las diferencias
Motivación 117
Lo interesante, por supuesto, es que los humanos (como todos los animales) en realidad somos muy selectivos
con el sexo: las parejas que tienen más probabilidades de producir hijos fuertes, saludables e inteligentes son más
20
atractivas sexualmente. Además, debido a que los seres humanos requieren de
largos compromisos para criar hijos exitosos, los humanos, particularmente las mujeres, a menudo exigen algún tipo
de compromiso antes de tener relaciones sexuales.Se han realizado numerosos estudios que examinan la compleja
interacción que surge en el juego de apareamiento humano y que muestran, por ejemplo, que la belleza no está en
los ojos de quien la mira, sino que existen estándares de belleza que son consistentes en todas las culturas e
individuos y que señalan información sobre la salud, la fecundidad y la inteligencia .
22
Sin duda, algunos componentes de la belleza parecen variar de una cultura a otra, pero estos componentes
tienden a implicar preparativos elaborados que demuestran que tenemos amigos y tiempo para cuidar nuestra
apariencia. Debido a que los seres humanos viven en comunidades (realmente se necesitan 23 años ), muchos de
a un niño en sociedades humanas normales, las definiciones de los componentes variables de una aldea para criar
belleza requieren una interacción compleja con otros miembros de la comunidad para mantenerse. (Piense en lo
difícil que es cortarse el cabello uno mismo). Los detalles de estos preparativos pueden cambiar culturalmente, pero
indican constantemente el tiempo y el esfuerzo invertidos en la apariencia.
Pero la comida, el agua y el sexo no nos bastan: también queremos ser respetados y buscamos música, emoción,
familia y amigos. Los bebés buscan a sus madres; las madres y los padres buscan a sus hijos. Como caso específico,
tomemos las interacciones maternas. En una de las historias clásicas de la secuencia de la ciencia, los primeros
estudios de la interacción sugirieron que los animales hacían cosas sólo para obtener una recompensa de comida.
24 Esto sugiere a los investigadores que los niños estaban "apegados" a sus madres porque eran alimentados por
ellas . En particular, el
conductista John Watson (a quien hemos conocido antes como uno de los principales actores en el desarrollo del
concepto de “hábitos” de estímulorespuesta) argumentó que tocar a los bebés solo podía transmitir enfermedades y,
por lo tanto, los niños no deberían ser tocados más de un tercio de siglo después, un joven psicólogo llamado Harry
25
Harlow, que Harlow,
estaba creando un nuevo laboratorio en la Universidad de Wisconsin, se encontró con una descripción de cómo los
niños que eran separados de sus madres al ingresar en un hospital gritaban y lloraban. Unas semanas después,
cuando su laboratorio de ratas aún no estaba listo para los experimentos, observó a los monos jugando en el
zoológico de Madison y se dio cuenta de que podía comprobar directamente si esta ansiedad se debía a la separación
de sus madres o si se trataba de un estrés generalizado, como el de ir al hospital. Harlow inició una serie muy
famosa de experimentos sobre la maternidad y descubrió que los bebés necesitaban el calor de una madre (o un
análogo de la madre) tanto como necesitaban comida.
26
Aunque estos experimentos galvanizaron el movimiento por los derechos de los animales27 y todavía se
consideran experimentos terribles y de pesadilla (y sería muy difícil obtener una F ), fueron clave para entender que
el cuidado de los animales. se aprueben bajo las regulaciones actuales sobre
E Esto nos parece una tontería ahora, pero se debió a la incapacidad de cuantificar el componente de
apego no relacionado con la comida. Recordemos que la psicología pasó de los teóricos de la Gestalt (a
finales del siglo XIX), que utilizaban la introspección, a los conductistas (principios del siglo XX), que solo
examinaban conductas cuantificables.
F La cuestión de los derechos de los animales es muy compleja y queda fuera del alcance de este libro. Sin
embargo, para quienes estén interesados en este tema, recomiendo empezar por dos libros de Deborah Blum,
Guerras de monos, The
, que describe las interacciones entre los movimientos de derechos de los animales y los científicos, y
Amor en Goon Park, que describe la vida de Harry Harlow y la influencia de su obra en el mundo.
Machine Translated by Google
Ahora sabemos que las interacciones maternas entre los niños y sus padres (en los humanos, tanto madres
como padres) son impulsadas en parte por el neurotransmisor oxitocina.
, Una sustancia química que se libera en el hipotálamo tanto en las madres como en los bebés poco después
Cintura
del nacimiento. La oxitocina parece ser un componente clave del pegamento social que mantiene unidas a las
32
parejas y a las familias. La oxitocina administrada externamente hace que las personas tengan más
probabilidades de confiar en su pareja en los juegos de decisiones económicas. En las madres y los bebés, la
oxitocina se libera en respuesta a sostener a los niños. (Este fue uno de los puntos del trabajo de Harlow, parte de
El vínculo maternal se debe al contacto social. 33 De hecho, la oxitocina induce el acicalamiento
mutuo y se libera durante el acicalamiento mutuo en varias especies de mamíferos, incluidos los humanos.) El
simple hecho de sostener y jugar con un niño libera oxitocina, incluso en los hombres. Todavía recuerdo
vívidamente la primera vez que sostuve a cada uno de mis hijos y los alimenté y la emoción absolutamente
abrumadora asociada con eso. Incluso hoy, me gusta mucho cocinar para mis hijos y ver que les gusta la comida
que he preparado.
Al igual que comer, beber y tener relaciones sexuales, el cuidado parental es una función intrínseca. No
comemos ni bebemos porque sea necesario para la supervivencia, comemos y bebemos porque lo disfrutamos,
porque satisface una necesidad que sentimos en nuestro cuerpo. De manera similar, no tenemos relaciones
sexuales porque estemos tratando de procrear (por lo general). La prueba de que el cuidado parental es una
función intrínseca se puede ver en la forma en que las personas tratan a sus mascotas (y, tal vez, incluso en el
hecho de que las personas tengan mascotas en primer lugar). En algún momento, podría haber sido cierto que
los perros eran compañeros de caza y que los gatos mantenían los graneros limpios de roedores, pero la mayoría de los hogar
Algunos lectores pueden quejarse de la secuencia que he presentado aquí. En 1900, John Watson, un
GRAMO
psicólogo de primera línea, sostiene que no se debe abrazar ni acurrucar a los niños, lo que conduce, en realidad,
a altas tasas de mortalidad en orfanatos y hospitales. Se necesita una interacción entre John Bowlby
29
Observando lo que ahora identificamos como ansiedad por separación en los niños de los hospitales y haciendo
experimentos terribles con monos, Harry Harlow desmintió esta opinión y recomendó que los niños necesitan
(como dice el dicho popular ahora) “ocho abrazos al día”. La ciencia tardó medio siglo en corregir este error.
¿A qué errores nos enfrentamos hoy? ¿Qué errores científicos se esconden en este libro? ¿Deberíamos confiar en
la ciencia actual? Este tema es demasiado largo y complejo para abordarlo en este libro, pero la respuesta breve
es que la ciencia es un sistema que se autocorrige. Se podría argumentar que la autocorrección es la clave de la
ciencia: puede llevar años o incluso décadas, pero la ciencia se revisa y se corrige a sí misma. 30 Eso es lo que ha
permitido todos los avances que hemos visto hoy, desde los vuelos hasta las computadoras. Newton corrigió a
Aristóteles y Einstein corrigió a Newton. En lugar de decir "la ciencia a veces se equivoca, deberíamos ignorarlo",
necesitamos identificar dónde creemos que las teorías actuales están equivocadas y proponer experimentos que
las prueben directamente, y luego confiar en las respuestas que esos experimentos nos dan. (Compare esto con
los paradigmas alternativos de descripción del mundo que afirman haber conocido la respuesta durante cientos o
miles de años, pero no tienen medios para cambiar las hipótesis en respuesta a su relación con los hechos. 31 )
Machine Translated by Google
Motivación 119
Los entornos urbanos y suburbanos no cazan para sobrevivir ni tienen graneros que se mantengan libres de
roedores. Sin embargo, más de la mitad de los hogares estadounidenses tienen mascotas de un tipo u otro. Las
personas con mascotas viven más y son más felices que las personas sin ellas. 34
Las mascotas, en particular los perros y los gatos, cumplen parte de esa función intrínseca de cuidado parental.
Así como los perros persiguen coches porque les encanta perseguir cosas, nosotros tenemos mascotas porque
necesitamos esa interacción social. Se ha demostrado que los perros son relajantes terapéuticos tanto para
niños traumatizados como para estudiantes universitarios que están estudiando para los exámenes finales. En
la universidad, durante la semana de exámenes finales, grupos locales venían con sus perros de terapia. Puedo
decir por experiencia personal que hay algo extraordinariamente relajante en tomarse un descanso de los
estudios para jugar con un gran San Bernardo.
¿Cuáles son, entonces, las funciones intrínsecas de los seres humanos? La lista sería probablemente muy
larga y puede resultar difícil de precisar directamente, en parte porque algunas de estas funciones intrínsecas
se desarrollan en momentos diferentes. Es bien sabido que el interés por el sexo opuesto fluctúa desde no notar
las diferencias en los muy jóvenes (digamos, menores de siete años), hasta no querer hablar con el otro sexo
(la famosa etapa de la “inhibición”, digamos, de los siete a los once años), pasando por la intriga (doce, trece) y,
finalmente, hasta la obsesión total (digamos, diecisiete). Los intereses maternales y paternales también se
activan a ciertas edades.
Pero todas estas funciones intrínsecas de los objetivos también contienen algo de aprendizaje. Aunque las
chicas adolescentes suelen estar obsesionadas con los bebés, los chicos adolescentes suelen ser desdeñosos.
Sin embargo, los adolescentes, en particular los chicos adolescentes, con hermanos mucho más jóvenes suelen
ser más paternales (en el sentido de tener reacciones positivas ante niños muy pequeños) que los adolescentes
sin hermanos menores.
Muchas de las funciones intrínsecas de los objetivos en los seres humanos son cognitivas. Una de las más
interesantes que encuentro es la satisfacción que produce la finalización de un trabajo bien hecho. Existe una
sensación inherente de éxito no sólo en la finalización, sino en el conocimiento de que el trabajo en cuestión se
ha hecho bien. 35 El acto de descubrimiento es en sí mismo una fuerza impulsora notablemente fuerte. Aunque
ha habido quienes han argumentado que la curiosidad se debe en realidad a cuestiones de recopilación de
información necesaria para un comportamiento adecuado dentro de un entorno, varios estudios computacionales
recientes han descubierto que un impulso inherente a la exploración produce un mejor aprendizaje que los
simples algoritmos de maximización de recompensas y que los seres humanos y otros animales parecen tener
36
un optimismo excesivo que produce exploración. Incluso otros primates trabajarán Muchos
para la curiosidad que para las recompensas de comida. científicos (¡incluido yo mismo!) tienen más dificultades
37 fuerte sentimiento emocional de logro cuando identifican un nuevo descubrimiento: ahora sabemos algo que
no se sabía antes, y esa emoción de logro es una fuerza fuertemente motivadora. 38
De manera similar, muchas de las funciones intrínsecas de los humanos son sociales, el respeto de los
pares (como, por ejemplo, las estrellas del deporte que quieren ser "el receptor abierto mejor pagado" o las
celebridades que no pueden renunciar a ser el centro de atención). Este respeto a menudo se llama
incorrectamente "rango" social, pero las sociedades de primates son muy complejas y difieren de las especies
hembras y machos,a las especies. 39 Por ejemplo, las sociedades de babuinos incluyen jerarquías paralelas de
40 y una notable jerarquía inversa en los machos, donde los machos más exitosos (los que toman decisiones
que todos siguen y los que tienen éxito) son los que tienen más éxito.
yo
Aunque cuando mi esposa y yo estábamos en la universidad teníamos un apartamento que Koshka, nuestro
excelente gato cazador, mantenía libre de ratones, cuando nos mudamos había ratones viviendo en la sala de la
caldera, pero no duraron mucho.
Machine Translated by Google
los que más apareamientos y más hijos) son los que pierden las peleas (porque se alejan). 41;I
Las sociedades humanas son particularmente complejas y los roles de liderazgo varían según la situación. En grupos y tribus
42 contexto. pequeñas, el rango social puede ser muy dinámico. La experiencia individual proporciona roles de liderazgo
transitorios y aumentos de rango correspondientes. En uno de mis ejemplos favoritos de esto, para su tesis de maestría, mi esposa
43 Algunos niños son expertos en dinosaurios, mientras que otros no. En la sección de dinosaurios del museo,
los niños expertos en dinosaurios eran tratados con más respeto y deferencia que sus compañeros. Como control, también observó
a esos mismos niños en la sección de geología, donde su experiencia ya no les daba ese impulso de rango. Por supuesto, el rango
puede traspasarse de la experiencia de uno a otros aspectos de la vida. Los niños expertos en dinosaurios tenían más
probabilidades de que se les pidiera que tomaran decisiones no relacionadas (como dónde ir a comer) que los niños no expertos.
Vemos esto, por ejemplo, en celebridades (como actores o expertos de televisión) a quienes se les pide que comenten las
En el plano neurofisiológico, muchos estudios han descubierto que estas funciones intrínsecas de los objetivos aumentan la
actividad de los sistemas dopaminérgicos (recuerde que la dopamina envía señales de error en la predicción de valores y sirve
como señal de entrenamiento) y aumentan la actividad de un conjunto específico de estructuras ventrales que se sabe que están
implicadas en el placer, el displacer y el impulso. En general, estos estudios se han preguntado qué activa estas estructuras
ventrales de toma de decisiones, incluido el cuerpo estriado ventral, que se encuentra debajo del resto del cuerpo estriado, y la
ínsula (que también se encuentra en el lado ventral del cerebro, pero más anterior, hacia adelante, que el cuerpo estriado ventral).
44 Aunque estos estudios no pueden responder si estas funciones son intrínsecas o aprendidas porque tienen que ser estudiadas
en adultos, los estudios encuentranuna lista intrigante de señales que impulsan esta actividad, incluyendo comida, dinero, drogas,
caras atractivas, jugar videojuegos con éxito, música, emociones sociales como el amor y el dolor, incluso el altruismo (por
En particular, los humanos parecen tener objetivos codificados que fomentan las relaciones sociales positivas.
46 Los humanos parecen tener una capacidad intrínseca
interacciones, particularmente dentro de grupos definidos. objetivo de un
sentido de justicia, o al menos de castigar a los jugadores injustos. En uno de los estudios más interesantes, las personas
interactuaron con dos oponentes, uno de los cuales jugó limpio y otro no. 47 Las personas y los dos oponentes recibieron luego
pequeñas (pero desagradables ) descargas eléctricas. La pregunta clave en el experimento fue la activación de las estructuras
relacionadas con la recompensa ventral del sujeto que observaba a los dos oponentes recibir descargas electrónicas. Tanto en
hombres como en mujeres, hubo más activación en la ínsula (señalando un afecto negativo) cuando el oponente justo recibió la
descarga que cuando el oponente injusto recibió la descarga. En los hombres, incluso hubo actividad en el estriado ventral
(señalando un afecto positivo) cuando el oponente injusto recibió la descarga. Parte del objetivo intrínseco
Una de las funciones más importantes de la moral en los seres humanos es el sentido de justicia en nuestras interacciones con los
demás. Veremos que esto aparece nuevamente en nuestro análisis de la moralidad y el comportamiento humano (Capítulo 23).
I
Para quienes estén interesados en este tema, hay muchos libros excelentes sobre el tema de las
jerarquías de los primates y su complejidad. Véase, por ejemplo, A Primate's Memoir (Robert Sapolsky),
Sex and Friendship in Baboons (Barbara Smuts), Almost Human (Shirley Strum), Chimpanzee Politics
(Frans de Waal) y, por supuesto, toda la serie de divulgaciones de Jane Goodall de sus estudios sobre los
, A través ofde Man
chimpancés de Gombe ( In the Shadow , otros).
y muchos
una ventana
Es notable lo desagradable que puede llegar a ser incluso una pequeña descarga eléctrica . 48
Machine Translated by Google
Motivación 121
En los capítulos anteriores sobre la toma de decisiones, analizamos cómo tomamos decisiones en función de
nuestros objetivos, pero no identificamos cuáles eran esos objetivos. Hemos mencionado algunos de ellos aquí,
pero estos varían en gran medida de una especie a otra y de un individuo a otro dentro de una misma especie.
Identificar los objetivos que se generalizan en el comportamiento humano y las distribuciones de objetivos que
varían entre los seres humanos son dos áreas de investigación activa en la actualidad.
49 Algunas de esas metas se aprenden a lo largo de escalas temporales evolutivas
y están incorporadas en el individuo, mientras que otras son de naturaleza sociológica, dependen de procesos
inherentes a nuestras interacciones culturales y deben aprenderse a lo largo de la vida, y algunas se deben a una
interacción entre la genética y la cultura. 50 Sin embargo, el punto clave aquí es que, aunque las metas
evolucionan a lo largo de generaciones y se aprenden con el tiempo de tal manera que han ayudado a procrear
nuestra genética, las metas que se aprenden solo apuntan indirectamente a una procreación exitosa. Ya se trate
de perros persiguiendo autos o de chicos universitarios navegando por Internet en busca de pornografía, son las
metas intrínsecas las que estamos tratando de satisfacer. Los sistemas de toma de decisiones que hemos
explorado han evolucionado para satisfacer estas metas. En secciones posteriores, veremos cómo estas metas
intrínsecas indirectas pueden llevarnos por mal camino.
El hambre nos informa cuando necesitamos alimento, la sed cuando estamos deshidratados, pero las personas
también comen cuando no tienen hambre y beben cuando no tienen sed. En realidad, esa no es toda la historia:
una afirmación más cuidadosa sería que podemos tener sed incluso cuando no estamos deshidratados y hambre
incluso cuando no necesitamos comida. Esto ocurre porque ciertas señales (señales visuales, señales olfativas)
pueden hacer que tengamos hambre y deseemos comida o que tengamos sed y deseemos agua.
El olor del pan recién horneado, la imagen de una pizza en la pantalla… son señales que nos recuerdan la comida
y que pueden hacernos sentir hambre. Los animales que encuentran una señal que predice la comida suelen sentirse
impulsados a comer.
51
De manera similar, las señales que aparecen antes de algo malo nos hacen sentir miedo. 52
Ya hemos visto cómo estas señales pueden llevarnos a la selección de acciones pavloviana, que, como vimos en
el capítulo 8, involucraba principalmente emociones y acciones somáticas. Además, estas señales pueden crear
una motivación que impulse los demás sistemas de selección de acciones. 53; K
Estos efectos se conocen como transferencia pavloviana a instrumental (PIT, por sus siglas en inglés) porque
implican un entrenamiento similar al aprendizaje que vimos en los sistemas pavlovianos de selección de acciones
(Capítulo 8) y una influencia en los otros dos sistemas de selección de acciones (deliberativo y procedimental,
que históricamente se conocían como aprendizaje “instrumental”; ver nota al pie 6C). 55 En la PIT, como en la
selección de acciones pavloviana, se presentan dos señales de manera que una informa sobre si la otra llegará
(Pavlov hace sonar una campana significa que pronto se entregará la comida). Sin embargo, aquí, en lugar de
impulsar la selección de acciones (salivar), la contingencia aprendida cambia su motivación, su deseo de ese
resultado.
En cierto sentido, la campana hace que el perro piense en comida, lo que le provoca hambre.
Los científicos que estudian los efectos del marketing han sugerido que los íconos de los restaurantes (como
los “arcos dorados” de McDonald's o los símbolos instantáneamente reconocibles de CocaCola o Pepsi) tienen
un efecto similar en las personas, haciéndolas sentir hambre (o sed) incluso cuando
K Varios autores han sugerido que esto es lo que es el anhelo : la motivación para una cosa predicha
54
señales. por Volveremos a la cuestión del anhelo en nuestro análisis de la adicción (Capítulo 18).
Machine Translated by Google
No lo son. Es de suponer que esto sólo funciona en personas con asociaciones positivas con estos
símbolos. Podría ser muy interesante medir las asociaciones emocionales con ciertos restaurantes de
comida rápida (que tienden a producir emociones fuertemente positivas en algunas personas y emociones
fuertemente negativas en otras) y luego medir los efectos de sus símbolos en las elecciones, pero, que yo
sepa, esto aún no se ha hecho. Sin embargo, Sam McClure, Read Montague y sus colegas descubrieron
que las preferencias individuales por CocaCola o Pepsi se reflejaban en las preferencias por vasos
idénticos de refresco etiquetados con diferentes etiquetas. 56 Encontraron que la etiqueta cambiaba lo
que a la gente le gustaba: las personas a las que les gustaba Pepsi preferían el vaso con la etiqueta de
Pepsi, aunque los dos vasos hubieran sido servidos de la misma botella. De manera similar, Hilke
Plassmann y sus colegas estudiaron los efectos del precio en la percepción del vino y descubrieron que
las personas pensaban que los vinos más caros sabían mejor, incluso cuando se les ofrecía vinos
idénticos en botellas caras y baratas. 57
La influencia de este aprendizaje pavloviano de contingencias (la señal implica un resultado) en la
selección de acciones instrumentales (deliberativa, procedimental) puede ser general , lo que lleva a un
aumento de la excitación y un aumento de la velocidad y la probabilidad de realizar acciones en general,
o específica , lo que lleva a una mayor probabilidad de realizar una acción específica. En la PIT
generalizada, una señal con asociaciones positivas produce un aumento general en todas las acciones,
mientras que en la PIT específica, la señal produce un aumento en las acciones que conducen al resultado
58 resultados.
recordado pero no a otros. Abordaremos la PIT generalizada en la siguiente sección, cuando hablemos
vigor y costos de oportunidad; en esta sección, quiero analizar los efectos de un PIT específico.
Imaginemos, por ejemplo, que entrenamos a un animal para que empuje una palanca para las uvas y
otra para las frambuesas (simplemente, hacemos que el animal tenga hambre, le damos palancas y lo
recompensamos adecuadamente por empujar cada palanca. Por supuesto, en experimentos reales, esto
se hace con bolitas de comida con sabor, que se combinan en cuanto a nutrición, tamaño, etc., de modo
que la única diferencia es el sabor). Luego, imaginemos que entrenamos al animal (en otro entorno) para
que cuando escuche un tono, obtenga una uva (simplemente, tocamos el tono y luego, rápidamente, le
damos la uva al animal. Si hacemos esto lo suficiente, el animal esperará que obtener una uva seguirá
al tono). Si volvemos a poner al animal en el entorno de la palanca, cuando tocamos el tono, el animal
tendrá más probabilidades de empujar la palanca para las uvas. Podemos comprobar si el PIT es
generalizado o específico examinando si el animal presiona ambas palancas (un aumento generalizado
de la actividad) o solo la palanca de las uvas (un aumento específico de la acción que lleva a obtener las
uvas). Lo que sucede aquí es que el animal recuerda la posibilidad de obtener uvas mediante el tono, lo
que lleva a un aumento de la probabilidad de realizar una acción que lleve a obtener uvas. En cierto
sentido, el tono hizo que el animal sintiera hambre de uvas.
Por supuesto, esto también ocurre en los seres humanos. Ver los accesorios de una droga que un
adicto suele consumir provoca ansias por consumirla. 59 Algunos fumadores prefieren autoadministrarse un cigarrillo
60
sin nicotina en lugar de una inyección intravenosa de nicotina, lo que sugiere que la señal motivacional condicionada puede ser incluso más
fuerte que la sustancia adictiva. Y, en los ejemplos a los que volvemos una y otra vez en esta sección, los símbolos de marketing aumentan
nuestras percepciones internas de hambre y sed. 61 La semana pasada llevé a mis hijos al cine y, mientras estaba sentado esperando la
película, mi hijo se quejó de que todos los anuncios de comida eran demasiado pequeños para ser verdad .
yo
¡Algunos de los anuncios eran de pizza! ¿Quién come pizza en el cine?
Machine Translated by Google
Motivación 123
La mayoría de las decisiones que tomamos en la vida implican hacer una cosa a expensas de otra: si estamos
trabajando en nuestro escritorio, no estamos haciendo ejercicio; si estamos durmiendo, no estamos trabajando...
Existen docenas, si no cientos, de libros de autoayuda orientados a la gestión del tiempo. Las pérdidas que se
producen por no hacer algo se pueden definir como un coste de oportunidad62 : ¿qué oportunidades estás
perdiendo al elegir la opción A en lugar de la opción B?
Yael Niv y sus colegas Nathaniel Daw y Peter Dayan sugirieron recientemente que el nivel promedio (tónico)
de dopamina es una buena medida de la recompensa total disponible en el entorno. 63;M Esto sugiere que la
dopamina tónica está relacionada con el costo de oportunidad en el entorno. Un animal que sea inteligente en
el uso de su energía debería cambiar el vigor con el que trabaja en función de este costo de oportunidad. (Si
hay muchas otras recompensas en el entorno, uno debería trabajar más rápido, para poder llegar a esas otras
recompensas más rápido. Por otro lado, si no hay muchas otras recompensas, entonces no desperdicie la
energía haciendo este trabajo rápidamente.)
Curiosamente, esta hipótesis de la dopamina tónica como vigor unifica el papel de la dopamina en el
aprendizaje (las ráfagas fásicas impulsan el aprendizaje), la relevancia del incentivo (la dopamina implica una
señal que conduce a la recompensa) y los efectos motores de la dopamina en la enfermedad de Parkinson, la
66
enfermedad de Huntington y otras disfunciones de los ganglios basales.
La enfermedad de Parkinson ocurre cuando las células dopaminérgicas mueren, dejando a la
del Capítulo 10 que los ganglios basales usan la dopamina para persona con una 67 (Recuerde
aprender e impulsar el aprendizaje procedimental). Durante años, se pensó que la dopamina
impulsaba el movimiento porque los excesos de dopamina en los ganglios basales producían
movimientos inapropiados (llamados discinesias , del griego δυσ [ dis , malo] + κινησία [ kinesia ,
movimiento]), mientras que las deficiencias de dopamina en los ganglios basales producían una
dificultad para iniciar movimientos y una desaceleración general del tiempo de reacción (llamada
acinesia o bradicinesia , del griego α [ a , sin] y el griego βραδύ [ brady , lento]). 68
La otra cosa que impulsa la motivación y la voluntad de trabajar es, por supuesto, la necesidad.
Como ya hemos comentado en este capítulo ( Funciones intrínsecas de los objetivos , más arriba), un papel
importante de la motivación es identificar tus necesidades: un estado de deshidratación significa que necesitas
agua. Esto es casi demasiado obvio para decirlo, pero es importante recordar que no se trata de opciones
binarias: no se trata de “¿Tengo hambre?”, sino de “¿Cuánta hambre tengo?”. Cuanto más hambre tengas, más
dispuesto estarás a probar nuevos alimentos, más dispuesto estarás a trabajar para conseguir comida y mejor
69
sabrá esa comida. El vigor también depende de lo mucho que necesites ese resultado.
Varios autores han sugerido que los niveles de dopamina impulsan el vigor, tanto desde
El costo de oportunidad y las perspectivas de necesidad.70 Básicamente, estos autores sugieren que el tónico
Los niveles de dopamina permiten que un animal supere el esfuerzo: cuanto más dopamina esté disponible,
más dispuesto estará el animal a trabajar para obtener un resultado. Curiosamente, esto tiene similitudes
evolutivas con el papel de la dopamina en vertebrados muy simples, donde la dopamina vigoriza
movimiento de tasas.71
M Recuerde que las ráfagas fásicas de la señal de dopamina hacen que las transiciones en valor sean mejores que lo esperado, 64 Estas
las pausas de la señal de dopamina hacen que las transiciones en valor sean peores que lo esperado, son como ráfagas fásicas, mientras que
tomar una derivada de la señal de valor esperada. La dopamina tónica tomaría entonces la integral de esta señal de valor, que es la recompensa
65
promedio en el entorno.
Machine Translated by Google
Las manipulaciones de la dopamina pueden llevar a un animal a trabajar más para obtener una
recompensa específica, estimulada por la presencia de señales visuales o auditivas cuando aumenta esa dopamina. 72
Las interacciones específicas entre la dopamina, el aprendizaje, la estimulación y la recompensa son un
área de investigación activa en muchos laboratorios alrededor del mundo y una fuente de mucha
controversia en la literatura científica. 73 Lo más probable es que la dopamina esté cumpliendo múltiples
funciones, dependiendo de su fuente, momento y objetivos neuronales.
En cualquier caso, la disposición de un animal a trabajar por una recompensa o a evitar un castigo es
74
Este es un tema motivacional un factor que está muy relacionado con el problema del PIT general.
importante, del que hablamos antes en este capítulo. La presencia de señales que indican la presencia
de recompensas probablemente implica que el mundo que te rodea es más rico de lo que pensabas. Si
hay más recompensas por conseguir, trabajar despacio significa gastar más de ese costo de oportunidad,
y un agente inteligente debería hacer el trabajo más rápido para poder volver a esas otras recompensas.
Resumen
En capítulos anteriores hablamos de la selección de acciones, pero no de lo que motiva esas
acciones. La motivación puede verse como la fuerza que impulsa las acciones. La motivación para
recompensas específicas depende de las necesidades específicas del animal (funciones intrínsecas
de meta), que pueden variar de una especie a otra. Curiosamente, los humanos parecen tener
funciones intrínsecas de meta para las recompensas sociales. Además de las funciones intrínsecas
de meta, también se pueden aprender señales que pueden impulsar la motivación, ya sea para
resultados específicos (Transferencia Pavloviana a Instrumental específica) o para vigorizar al
animal en general (Transferencia Pavloviana a Instrumental general). Estos componentes
motivacionales son una parte importante del sistema de toma de decisiones, porque definen los
objetivos y cuánto estás dispuesto a trabajar para alcanzarlos, incluso si no seleccionan
directamente las acciones a tomar para lograrlos.
Stephens y John R. Krebs (1987). Foraging Th eory . Princeton, NJ: Princeton University Press . • Robert
Wright (1995). The Moral Animal:
Why We Are the Way We Are: The New Science of Evolutionary Psychology . Nueva York: Vintage . •
Kent C. Berridge (2012). From prediction error to incentive
salience: Mesolimbic computation of prize motivation . European Journal of Neuroscience, 35 1124–1143 .
,
• Yael Niv, Nathaniel D. Daw, Daphna Joel y Peter Dayan (2006). Dopamina tónica: costos de oportunidad
y control del vigor de la respuesta. Psicofarmacología, 191 507–520. ,
Machine Translated by Google
14
mar. . . .
Para tomar las acciones correctas dentro de un entorno, uno debe conocer la estructura
de un entorno familiar. Existe una disyuntiva entre estos dos procesos: la exploración
puede ser peligrosa, pero no saber si hay mejores opciones disponibles puede resultar
costoso.
Un tema que surge a menudo en los debates teóricos sobre la toma de decisiones es que existe una disyuntiva entre
aprender más sobre el mundo y utilizar lo que se ha aprendido para tomar las mejores decisiones. Imagine que está en un
casino con muchas máquinas tragamonedas diferentes disponibles para jugar. No sabe cuáles son las probabilidades de
pago de ninguna de ellas; para averiguarlo, tiene que jugar con ellas. A medida que juega con una máquina, aprende sobre
sus parámetros (qué probabilidad hay de que pague cuánto dados sus costos). Pero no sabe si una de las otras máquinas
sería una mejor opción. Uno puede imaginar dónde se ubicaría en este continuo de exploración para ver cuáles son los
pagos de las diversas máquinas y explotar el conocimiento que ya tiene para elegir la mejor opción que conoce. A Esta es
una tarea llamada la tarea 1 de la máquina tragamonedas de n brazos (como una extensión de la tarea original de la
máquina tragamonedas ).
de.
A El uso de “explotar” aquí tiene connotaciones desafortunadas en términos de “explotar a otros”. Lo que se quiere decir
aquí con “explotar” es simplemente usar el conocimiento que uno ha aprendido al explorar para tomar las mejores decisiones.
125
Machine Translated by Google
y la literatura de aprendizaje automático B es darse la oportunidad de probar una máquina aleatoria en cada ronda.
Este nivel aleatorio se llama є (épsilon) y la estrategia se llama "estrategia épsilon". La pregunta, entonces, es ¿qué
debería ser épsilon en cada ronda? Las estrategias simples con un épsilon bajo y constante se llaman "épsilon
codicioso". Por ejemplo, puede intentar una acción aleatoria una ronda en cien y usar su conocimiento para elegir la
mejor opción en los otros noventa y nueve intentos de los cien. C En un mundo estable, debe explorar temprano y
luego establecerse en la mejor opción más tarde. En la literatura de aprendizaje automático, una estrategia común para
un mundo estable es usar una probabilidad exponencialmente decreciente de intentar una acción aleatoria. Esto es
explorar temprano y explotar después de haber aprendido la estructura del mundo en el que vive, pero nunca dejar de
explorar por completo.
Por supuesto, el mundo real no suele ser estable y no sería seguro tener una fase pura de exploración seguida de
una fase pura de explotación. Los algoritmos de aprendizaje automático más recientes se han basado en el seguimiento
explícito de la incertidumbre en cada opción.
6 Cuando la incertidumbre se vuelve demasiado grande en relación con lo que espera ganar con la
opción que está jugando actualmente, es hora de intentar explorar de nuevo. Esto requiere llevar un registro tanto de
la incertidumbre como del valor esperado de una opción. Como veremos a continuación, ahora hay evidencia conductual
de que las personas llevan un registro de la incertidumbre, que la incertidumbre está representada dentro del cerebro
y que las diferencias genéticas afectan la sensibilidad de los individuos a la incertidumbre (su disposición a cambiar del
modo de explotación al de exploración). 7
El valor esperado de una opción es cuánto espera ganar en promedio si continúa jugando con la opción; la
incertidumbre es qué tan inseguro está acerca de ese valor esperado.
A esto a menudo se le llama “riesgo” en los mercados financieros. 8 Imagina que sabes que una vez de cada veinte,
cuando pones un dólar en el juego, obtienes veintiún dólares. Ese juego tiene un pago positivo de $21/$20 o 1,05, lo
que significa que ganas el 5 % jugando. Por otro lado, otra máquina podría pagar $105 una vez de cada 100, lo que
D
juego.
B El aprendizaje automático es una rama de la informática en la que se desarrollan algoritmos para aprender del
mundo. 3 Aunque el aprendizaje automático suele vivir en las divisiones de inteligencia artificial de los
departamentos de informática, en realidad el aprendizaje automático es distinto de la inteligencia artificial. La
"inteligencia artificial" trata de intentar igualar (ya sea mecánica o computacionalmente) las habilidades humanas.
El "aprendizaje automático" trata de intentar construir el mejor algoritmo que pueda resolver el problema. Los
científicos que trabajan en el aprendizaje automático creen que una máquina que puede aprender del mundo
puede ser más eficiente y funcionar mejor que una máquina preprogramada. (Por ejemplo, imagina si tu termostato
pudiera aprender cuándo llegas a casa normalmente o cuándo te despiertas normalmente por la mañana. Podría
aprender a configurarse para calentar la casa antes de que llegues o justo antes de que te despiertes. Por
supuesto, podría programarse para hacer eso, pero entonces tendría que programarse por separado para cada
persona. Un solo algoritmo de aprendizaje 4 ) podría programarse una vez para aprender el momento adecuado para cada pers
C Esto se puede implementar más fácilmente seleccionando un número aleatorio entre 1 y 100 en cada intento. Si el
número aleatorio es 100, entonces realizas una acción aleatoria. Si es cualquier otra, eliges la mejor opción que puedas.
También se podría simplemente elegir la acción aleatoria cada 100 intentos, pero el peligro es que si las probabilidades de
ganar tienen alguna oscilación, entonces cada 100 intentos podría coincidir con la oscilación y no te darías cuenta. La
aleatoriedad es mejor. Por supuesto, los humanos somos terribles en lo que respecta a la aleatoriedad. 5
D
Sí, sé que las máquinas tragamonedas siempre tienen un pago menor al 100% porque el objetivo de los casinos es
obtener ganancias. Si lo desea, puede pensar en estos juegos como si estuviera depositando dinero en cuentas de ahorro. Una
cuenta de ahorro en un banco puede estar asegurada por la FDIC y, por lo tanto, ser muy segura (porque la única forma de
perder dinero es que Estados Unidos se hunda), pero solo obtendría un interés del 1% cada año. Por otro lado, una cuenta de
También tiene un pago positivo de $105/$100 o 1,05 o 5%, pero es mucho más variable. Si jugaras a cualquiera
de los dos juegos durante mucho tiempo, el valor esperado de jugar sería el mismo. Pero si juegas a cada
juego solo unas pocas veces, podrías perder más (o ganar más) en el segundo juego. El segundo es más
riesgoso.
Incertidumbre
Es útil pensar en tres tipos diferentes de incertidumbre: incertidumbre esperada , incertidumbre inex
10
esperada y ambigüedad .
En el primer tipo (incertidumbre esperada), se reconoce que existe una imprevisibilidad conocida en el
mundo. Vemos esto cuando un meteorólogo dice que hay un “60% de probabilidad de lluvia”. Si el meteorólogo
está en lo cierto, entonces 6 de cada 10 veces que el meteorólogo dice “60%”, debería llover y 4 de cada 10
veces, debería estar seco.
El segundo tipo (incertidumbre inesperada) implica el reconocimiento de que las probabilidades han
cambiado. Esto es lo que se prueba en las tareas de aprendizaje de inversión , en las que las probabilidades
de entrega de recompensa se modifican de repente sin una señal explícita que indique al sujeto que las
probabilidades han cambiado. Las ratas, los monos y los humanos pueden rastrear de manera confiable tales
11
Los cambios. Dado que la inversión no tiene ninguna señal, el reconocimiento del cambio en las
12 probabilidades. Los humanos y otros animales pueden cambiar com
cambios se convierten en un problema de teoría de la
información, tan rápido como dice la teoría de la información. Cuando se enfrentan a un cambio repentino en
la probabilidad de entrega de recompensas (como en la extinción, cuando las recompensas de repente ya no
se entregan, véase el Capítulo 4), los animales muestran frustración y aumentan su exploración de opciones
13
alternativas.
La diferencia entre incertidumbre esperada e inesperada fue expuesta de manera más famosa (infame) por
el Secretario de Defensa Donald Rumsfeld en su conferencia de prensa defendiendo los fracasos de la invasión
estadounidense de Irak, en la que afirmó que había “incógnitas conocidas” (incertidumbre esperada) y
“incógnitas desconocidas” (incertidumbre inesperada) y que no se le debía culpar por juzgar mal las “incógnitas
desconocidas”. 14 Por supuesto, la queja no era que hubiera una incertidumbre inesperada, sino que Rumsfeld
y su equipo no habían planificado la incertidumbre inesperada (lo que cualquier planificador militar debería
hacer 15 ) y que Rumsfeld y su equipo deberían haber esperado que hubiera una incertidumbre inesperada.
16
El tercer tipo de incertidumbre es la ambigüedad , a veces llamada incertidumbre de estimación ,
incertidumbre debida a una falta conocida de exploración. Esto es lo que a menudo se denomina en la literatura
sobre aprendizaje animal como la transformación de algo nuevo en algo familiar y es el objetivo principal de la
17
exploración. En este caso, la incertidumbre se debe a que solo se dispone de un número
limitado de muestras. Cuantas más muestras se tomen, mejor será la estimación que se puede obtener. La
exploración implica tomar más muestras, con lo que se obtiene una mejor estimación de la incertidumbre esperada.
Los humanos encontramos la ambigüedad muy desagradable. El ejemplo clásico de ambigüedad es
imaginar dos frascos que contienen canicas y tener que decidir de cuál frasco escoger. 18 Cada frasco contiene
una mezcla de canicas rojas y azules. Ganarás $5 si escoges una canica roja y
Es posible que la cuenta de fondos no esté asegurada por la FDIC (y, por lo tanto, puede perder dinero), pero podría obtener
un interés promedio del 5 % cada año. Comprar acciones puede ser muy variable: ganar un 10 % un año y perder un 10 %
el siguiente. Por eso, una buena planificación financiera requiere una cartera diversificada para equilibrar el riesgo. 9
Machine Translated by Google
1 si sacas una canica azul. Imagina que ves que se llena el primer frasco, de modo que sabes que la mitad de las
canicas son rojas y la otra mitad son azules. (Aún tendrás que escoger con los ojos cerrados y el frasco sobre tu
cabeza, de modo que la canica que escojas será aleatoria, pero conoces la distribución de canicas en el primer
frasco). Sin embargo, imagina que el segundo frasco se llenó mientras no estabas allí y todo lo que sabes es que
hay una mezcla de canicas rojas y azules. ¿De qué frasco escogerás? En el primero, sabes que tienes una
probabilidad del 50:50 de que te salga roja o azul. En el segundo, podrías tener una probabilidad del 90:10 o una
probabilidad del 10:90. Sumando todas las probabilidades posibles, resulta que también tienes una probabilidad del
50:50 de que te salga roja o azul. (La probabilidad de ver una mezcla 90:10 de canicas rojas y azules es la misma
probabilidad de ver una mezcla 10:90. Como 90:10 es lo opuesto a 10:90, en promedio son equivalentes a una
mezcla 50:50 tanto en el promedio de primer orden [valor esperado] como en la variabilidad de segundo orden
[riesgo].) Sin embargo, las personas prefieren confiablemente el primer frasco, incluso cuando se les señala el
hecho de que el segundo frasco suma la misma probabilidad. El primer frasco contiene riesgo (incertidumbre
esperada; podría obtener rojo o azul). El segundo frasco, sin embargo, también contiene ambigüedad ( ¿Cuál es la
mezcla? ) así como riesgo ( ¿Cuál es la variabilidad? ). Esto se conoce como aversión a la ambigüedad .
mi
y es técnicamente un ejemplo de la paradoja de Ellsberg.
Se han sugerido varias explicaciones para la paradoja de Ellsberg que son reacias a la ambigüedad debido a
F
incluyendo que los humanos una consecuencia de ser más sensibles.
son más propensos a las pérdidas que a las ganancias o a la incapacidad de hacer el cálculo completo de
probabilidades necesario para el caso de ambigüedad. Alternativamente, la paradoja de Ellsberg podría surgir
21
porque los humanos tienen heurísticas inherentes destinadas a evitarComo el sujeto no conoce la mezcla del
el engaño.
segundo frasco, es posible que se haya elegido que sea particularmente malo, solo para que el experimentador no
tenga que pagarle mucho al sujeto. (Las reglas sobre los estudios con sujetos humanos generalmente no permiten
que un experimentador mienta a un sujeto, por lo que cuando el experimentador le dice al sujeto que hay una
mezcla 50:50, tiene que ser verdad, pero cuando el experimentador le dice al sujeto que solo hay una "mezcla",
podría haber sido elegido para que sea particularmente malo. Por supuesto, no está claro que los sujetos
GRAMO
Pero,
La paradoja fue introducida por Daniel Ellsberg (de los famosos Papeles del Pentágono 19 ) en su tesis doctoral en economía
20
de 1962. Se llama paradoja porque las simples ecuaciones de los economistas no
pueden explicar por qué los humanos son reacios a la ambigüedad.
F
Hasta donde yo sé, aunque la paradoja ha sido demostrada sólidamente en humanos, no ha sido probada en
animales no lingüísticos, probablemente porque depende de que el experimentador le diga al sujeto las dos
probabilidades.
Estas reglas se establecieron debido a experimentos atroces como el experimento de sífilis de Tuskegee, donde se mintió
a los sujetos sobre los objetivos y las consecuencias de los experimentos. Hoy en día, estas reglas
se siguen de forma muy estricta y resulta excepcionalmente difícil obtener aprobación para mentirle a un sujeto experimental.
Machine Translated by Google
en monos y encontraron que la información que reduce la incertidumbre, incluso si no tiene efecto sobre
la cantidad final de recompensa que el animal obtiene, ha obtenido o espera obtener, produce 24 (que,
neuronas de dopamina “mejor si recuerdan, vimos que representaba cosas que se activaban en las
de lo esperado”, Capítulo 4).
Recopilación de información
Las teorías computacionales han propuesto que una buena manera de alentar a un agente computacional
o robot a explorar es proporcionar “bonificaciones de exploración”, donde el sistema proporciona una
señal “mejor de lo esperado” cuando el agente ingresa a una nueva parte del mundo. 25
Desde el punto de vista computacional, si esto se corresponde con una señal “peor de lo esperado”
cuando el agente regresa a su zona familiar, entonces la función de valor total se aprenderá correctamente.
Pero no está claro si la señal contrarrestante de que “es peor de lo esperado” aparece al regresar.
Las personas y los animales que regresan a una zona segura y familiar tienden a mostrar alivio más
26
que una señal de decepción del tipo “oh, bueno, eso ya Aunque es posible demostrar estabilidad,
pasó”. Simulaciones han demostrado que, en muchos mundos simulados simples, el hecho de no tener
una señal de novedad “peor de lo esperado” al regresar no altera demasiado la función de valor, ya
que, si bien el agente solo tiene una señal de novedad positiva “mejor de lo esperado”, lo hace tan bien
o mejor que los agentes sin señales de novedad.
En el mundo real (fuera del laboratorio), por supuesto, esta exploración también puede ser peligrosa.
Una ventaja que tienen los humanos es que pueden imaginar futuros ( pensamiento futuro episódico ,
capítulo 9) y pueden explorar posibilidades imaginando esas posibles opciones futuras, incluso sin
probarlas necesariamente. Una forma en que esto puede ocurrir es con el aprendizaje ficticio , en el
que uno aprende observando a otros. Uno puede observar el comportamiento de otra persona.
Machine Translated by Google
Por supuesto, este es uno de los aspectos más poderosos del lenguaje humano, porque el lenguaje
puede utilizarse para informar y enseñar. Varios autores han observado que la cultura humana es
fundamentalmente lamarckiana; los padres realmente transmiten las lecciones que aprenden en sus vidas a
sus hijos. 32 (Aunque esas lecciones no siempre perduran...) Sin embargo, esta naturaleza lamarckiana de
la cultura es una de las razones por las que los humanos se han extendido tan rápidamente a todos los
rincones del planeta, desde las selvas más cálidas hasta las tundras más frías, incluso enviando hombres a
la Luna y robots a los demás planetas del sistema solar.
Ahora sabemos que cuando un mono observa a otro mono realizando una tarea con la que está
familiarizado, el conjunto de neuronas corticales que normalmente se activan cuando el observador está
realizando una tarea también se activan cuando el observador simplemente está mirando al otro mono
realizar la tarea. 33 Estas neuronas se denominan "neuronas espejo" porque reflejan el comportamiento que
está realizando el otro mono. Un conjunto similar de circuitos corticales humanos está activo (como se
determina mediante fMRI) ya sea que uno esté realizando la acción uno mismo 34 Aunque la conclusión
o mirándola. Las opiniones sobre algunos de estos resultados son controvertidas (¿ Son las neuronas espejo
realmente fundamentales para la imitación, o solo reconocen señales relacionadas? ¿Simplemente reflejan
interacciones sociales? ), ciertamente, todos sabemos que aprendemos mucho observando a otros. 35
De manera similar, también sabemos que aprendemos indirectamente sobre la recompensa y el fracaso
al observar a los demás. Parece existir un sistema de espejo similar para las emociones, donde reconocemos
e interpretamos las emociones de los demás. 36;H Este reconocimiento está relacionado con las emociones
de empatía, envidia y arrepentimiento. 39 Estas emociones dependen de una interacción entre las
capacidades hipocampales para imaginarse a uno mismo en otra situación y las capacidades
orbitofrontales para conectar la emoción con esas situaciones. 40
En la empatía,
reconocemos el éxito o la pérdida de otro y sentimos una emoción similar. En la envidia, reconocemos
la ganancia de otro y deseamos haberla logrado. Hay una contraparte interesante de la envidia, el
regodeo o schadenfr eude , que significaalegrarse de la adversidad de otro (de , alegría), que también
que la envidia, que reflejan las emociones de las depende de las mismas estructuras cerebrales
palabras alemanas schaden , daño y fr eude . Y, en el arrepentimiento, reconocemos un camino que
podríamos haber elegido pero no lo hicimos.
En gran medida, esta es la clave del poder de la narrativa y la literatura. Identificamos las grandes
historias como aquellas que colocan a personajes realistas en situaciones, observando cómo reaccionan. La
gran literatura nos permite experimentar indirectamente opciones y situaciones que tal vez nunca
experimentaríamos. Si observamos las grandes obras de la literatura, ya sean clásicas o populares,
I
encontramos Se encuentra que describen consistentemente la toma de decisiones humanas desde
perspectivas notablemente realistas y complejas. Esto es cierto tanto si hablamos de
Hay cierta evidencia de que parte del problema con los psicópatas puede deberse a una disfunción en este sistema
de espejo y su capacidad para reconocer las emociones de los demás, 37 pero otros han argumentado que esta disfunción
38
se debe principalmente a una incapacidad para representar correctamente las emociones internas derivadas socialmente.
I
Probablemente no se debería hacer una distinción entre “clásico” y “popular”. La mayor parte de la literatura
que hoy llamamos “clásica” fue inmensamente popular en su época. Shakespeare, por ejemplo, fue con diferencia el
dramaturgo más popular de su época, y sus obras están llenas de chistes groseros para el público popular. (Véase,
(Por ejemplo, la escena de la muerte de Mercutio en Romeo y Julieta , la mayor parte de El sueño de una noche de verano, , por ejemplo,
Porter en Macbeth, por nombrar solo tres). A menudo he pensado que Shakespeare en su época probablemente estaba cerca de...
es como Steven Spielberg en nuestros días, con aventuras taquilleras como Indiana Jones y críticamente
(continúa)
Machine Translated by Google
Dramas realistas, mundos mágicos o ciencia ficción; incluso la ciencia ficción y el realismo mágico dependen de personajes
que se comporten de manera realista en situaciones extrañas. Aunque los lectores generalmente están dispuestos a
aceptar situaciones extrañas en otras galaxias o personajes con poderes mágicos, los lectores generalmente no están
Al leer o ver estas narraciones, nos colocamos en esos mundos e imaginamos qué haríamos en esas situaciones, y
empatizamos con los personajes y sentimos envidia y arrepentimiento por las decisiones que toman.
El trabajo computacional de la literatura de aprendizaje automático ha demostrado que, en un mundo inmutable, la solución
óptima para el equilibrio entre exploración y explotación es explorar temprano y explotar tarde. 42 Por supuesto, “temprano”
y “tarde” deben definirse según la vida útil esperada del agente. Esto predeciría que uno vería a los jóvenes explorando y a
los adultos explotando. Si bien esto es cierto, en general, hay otras diferencias importantes que cambian la forma en que
En primer lugar, como hemos comentado en otras ocasiones, no vivimos en un mundo inmutable. Por lo tanto, no se
puede explorar al principio y ya está. En cambio, hay que medir la exploración en función de lo bien que se está haciendo
en general. 43 Cuando las recompensas que se reciben empiezan a disminuir, hay que aumentar la exploración. Cuando se
enfrentan a una disminución de las recompensas entregadas, los animales se estresan y se frustran y muestran un aumento
de una serie de comportamientos, tanto el comportamiento que solía impulsar las recompensas como otros comportamientos
exploratorios, empezando por comportamientos similares al que solía impulsar la entrega de la recompensa. Todos nos
hemos visto hacer esto, empezando por probar el comportamiento de nuevo ( ¡Esto solía funcionar! ), pasando a cambios
menores ( ¿Por qué no funciona esto? ) y luego a nuevos comportamientos ( Quizás esto funcione en su lugar ).
En segundo lugar, la exploración es peligrosa. Esto significa que la evolución preferirá a las criaturas que desarrollen
habilidades básicas antes de salir a explorar. En los seres humanos, los niños pequeños exploran dentro de límites muy
estrictos establecidos por los padres, y esos límites se expanden a medida que crecen. Como todo padre sabe, los niños
quieren saber que hay límites. Quieren poner a prueba esos límites, pero también quieren que esos límites existan. Esto
sugiere que el período exploratorio primario en los seres humanos debería ocurrir después de que la persona desarrolle
Los años de la adolescencia, la juventud y los primeros años de la universidad son conocidos por sus altos niveles de
Películas tan aclamadas como La lista de Schindler . De manera similar, toda la ciudad de Atenas acudía a las funciones
anuales de Esquilo, Sófocles y Eurípides, cada uno de los cuales ganaba regularmente el premio a la mejor obra.
Las comedias de Aristófanes contienen lo que hoy llamamos humor de “chicos de fraternidad”, con mucho sexo
( Lisístrata ), personajes exagerados ( Las nubes ) y chistes sobre pedos ( Las ranas ).
J Surge una pregunta interesante cuando los personajes son explícitamente no humanos, ya sean extraterrestres,
criaturas mágicas o robots. En estas historias, las criaturas no humanas tienden a estar basadas en culturas humanas
41
específicas o a tener rasgos exagerados pero notablemente humanos. Se puede decir que la ficción Escribir ciencia
sobre extraterrestres trata de encontrar el equilibrio entre hacer que los extraterrestres sean demasiado humanos y
hacerlos demasiado extraños.
Machine Translated by Google
Estructura familiar. En general, la mayoría de los seres humanos superan estos vicios con la edad y se asientan a
medida que pasan de una estrategia de exploración a una de explotación.
En el próximo capítulo veremos cómo la corteza prefrontal desempeña un papel en la medición del
riesgo y el control de la exploración peligrosa. Uno de los resultados más interesantes descubiertos
en las últimas décadas es que la corteza prefrontal en los humanos no se desarrolla completamente
hasta mediados de los veinte años. 45 Esto significa que los adolescentes no tienen la misma
evaluación prefrontal del riesgo y la misma inhibición conductual de hacer cosas estúpidas que los
adultos. Como hemos visto a lo largo del resto de este libro, las conductas son generadas por el
cerebro físico, y los cambios en la conducta a menudo son causados por cambios físicos en el cerebro .
Sharot (2011). El sesgo del optimismo: un recorrido por el cerebro irracionalmente positivo .
Nueva York: Pantheon .
• Abram Amsel (1992). Teoría de la frustración . Cambridge, Reino Unido: Universidad de Cambridge.
Prensa .
K
Como he dicho en otras partes de este libro (ver Capítulo 24 para una discusión detallada), el reconocimiento de que
existen causas físicas y evolutivas para una mayor asunción de riesgos en los adolescentes no exime al adolescente de la
responsabilidad por sus acciones. Es importante reconocer que las tendencias sociobiológicas no son el destino y no
eximen a uno de la responsabilidad. Aunque la mayoría de los consumidores de drogas comienzan a consumirlas en sus
años de adolescencia y muchos de ellos dejan de consumir drogas y se asientan en una vida normal (no
46
La gran mayoría de los adolescentes, que llevan una vida basada en las drogas, no sucumben a la presión de Uno
grupo ni al consumo de drogas. Se espera que antes de enviarlos a la universidad o al mundo para que exploren, se les
haya enseñado a los adolescentes cuáles son sus límites y tengan una idea precisa de los riesgos y peligros.
Machine Translated by Google
15
Autocontrol
Como hemos visto en los capítulos anteriores, el sistema de toma de decisiones humano contiene
múltiples componentes de selección de acciones. Los reflejos son impulsados en gran medida por el
control espinal, pero pueden ser anulados por otros sistemas en el cerebro (como vimos con Lawrence de
Arabia sosteniendo la cerilla). Los sistemas de respuesta emocional (pavlovianos) liberan conductas
aprendidas a lo largo de escalas de tiempo evolutivas, pero, nuevamente, pueden ser anulados por otros
sistemas (controlando el miedo). Los sistemas de aprendizaje procedimental son hábitos que se
desarrollan en respuesta a contingencias de recompensa consistentes, pero nuevamente, estos pueden
ser anulados por otros sistemas (como en el caso de recordar tomar la ruta alternativa para ir al trabajo).
Y finalmente, está el sistema deliberativo, que busca entre las posibilidades futuras pero no tiene (en
general) que elegir la opción más deseada. (Tomemos, por ejemplo, la capacidad de seleccionar una
pequeña recompensa en lugar de una droga muy deseada; el deseo por una opción de alto valor puede
ser anulado para tomar lo que a primera vista parece ser una opción de menor valor).
La palabra “anular” proviene de la capacidad de la nobleza de dominar las decisiones (ya que la
nobleza servía como caballería y podía literalmente anular la oposición si llegaba el caso) y se hace eco
del concepto platónico de dos caballos que conducen un carro: un caballo salvaje e incontrolable
(dionisíaco) y un caballo intelectual, racional y razonado (apolíneo), así como de los conceptos
agustinianos y freudianos de la razón humana que controla un pasado animal salvaje.
1 Estos conceptos se hacen eco del concepto popularizado de caballo y jinete, donde el
2
caballo impulsa las respuestas emocionales y el jinete las respuestas razonadas.
133
Machine Translated by Google
Como sabe cualquiera que haya montado a caballo, montar a caballo es muy diferente a conducir un
coche. El caballo tiene sensores internos y hará algunas de las tareas básicas por ti (como no chocar
contra las paredes), mientras que un coche hará lo que le digas. Por supuesto, esto significa que a veces
tienes que luchar contra el caballo (por ejemplo, si necesitas conducirlo a la batalla) de una manera en la
que no tienes que convencer a un coche. (Sin embargo, me recuerda la escena de la película Dark Star de
John Carpenter, de humor negro , en la que el teniente Doolittle tiene que convencer a la “inteligente”
Bomba Nº 20 de que realmente “quiere” lanzarse y hacer estallar el planeta).
Será interesante ver cómo cambia la conducción de un automóvil a medida que introducimos en ellos
sistemas de decisión cada vez más autónomos (como el control de velocidad basado en sensores, la
dirección automática y los sistemas de navegación GPS). 3Haidt ha popularizado esta analogía como un
Jonathan
elefante y un jinete en lugar del tradicional caballo y jinete, porque el elefante es una criatura más poderosa
4
y ningún jinete puede controlar completamente al elefante.
(Por supuesto, esto pasa por alto la posibilidad de que el jinete y el caballo puedan entenderse tan bien y
estar tan sincronizados como para ser un equipo aún más capaz que cualquiera de ellos individualmente).
En todas estas analogías, existe la creencia de que el “yo” tiene que trabajar para ejercer control sobre
el “otro”. Como señalamos al principio del libro (capítulo 1), usted es tanto el caballo como el jinete (o el
elefante y el jinete). Robert Kurzban, en su nuevo libro, rechaza el concepto del yo individual y sugiere que
el “autocontrol” se entiende mejor como un conflicto entre múltiples módulos. 5 En el lenguaje de este libro,
el sistema de toma de decisiones que es usted incluye los reflejos que heredó, el aprendizaje pavloviano
que lo impulsa, los hábitos que ha aprendido, las historias que cuenta y la deliberación que lleva a cabo.
Sin embargo, el autocontrol es algo que nos parece muy real como humanos.
De manera consciente, sabemos cuándo ejercemos con éxito nuestro autocontrol y (posteriormente)
sabemos cuándo no lo hacemos. Por lo tanto, es importante comprender en qué consiste este proceso.
Antes de poder desmantelar los mecanismos del autocontrol, necesitamos encontrar una manera de hacer
que un sujeto demuestre autocontrol en el laboratorio y medirlo. En primer lugar, queremos ser cuantitativos
en cuanto a cuándo las personas muestran autocontrol y cuándo no. Esto nos permitirá examinar los
mecanismos de las fallas del autocontrol. En segundo lugar, nos gustaría poder acceder al autocontrol
directamente y no tener que esperar a que una persona se salga del camino.
En tercer lugar, nos gustaría poder examinar los fallos de autocontrol en situaciones no peligrosas.
En cuarto lugar, nos gustaría poder utilizar nuestras grandes máquinas de medición (fMRI, EEG, registros
neuronales) para ver los correlatos físicos del autocontrol. Y en quinto lugar, nos gustaría poder
Examinar el autocontrol en animales no humanos.
Autocontrol 135
Quizás el experimento más simple para abordar la cuestión del autocontrol es el experimento de Stroop.
Tarea de Stroop, una tarea notablemente simple pero sutil en la que se le muestra a una persona una palabra en
un color y se supone que debe nombrar el color del texto. Esto normalmente es muy fácil. Pero si la palabra en sí
es un color (como la palabra "rojo" escrita en azul), entonces aparece una interferencia entre la lectura de la
palabra en sí y el reconocimiento del color en el que está impresa. Esta interferencia produce una ralentización
del tiempo que se tarda en decir la palabra (el tiempo de reacción) y aumenta la probabilidad de cometer un error.
Ambas medidas producen medidas cuantitativas de disonancia cognitiva y rastrean otras medidas de autocontrol.
9 El aumento y la disminución de los tiempos de reacción en la tarea de Stroop es tan confiable que ahora se
utiliza para probar la disonancia cognitiva y la atención a otros conceptos, por ejemplo, para palabras relacionadas
con alimentos en personas obesas y palabras relacionadas con drogas en adictos. 10
La tarea Stroop no se puede utilizar con animales (que no saben leer), y en este caso la tarea de la señal de
stop ha sido muy útil. En la tarea de la señal de stop, se entrena al sujeto para que reaccione lo más rápido
posible a una señal de avanzar (como “cuando se encienda la luz, presiona el botón”), pero a veces aparece una
señal diferente (una señal de ¡Alto! ) entre la señal de avanzar y la reacción del sujeto. Si el sujeto ve la señal de
stop, se le recompensa por no reaccionar y se le castiga por reaccionar: el sujeto tiene que detener la secuencia
de acción motora ya iniciada. La tarea de la señal de stop se ha utilizado con éxito en ratas, monos y humanos, y
el rendimiento es similar en las diferentes especies.
11
En general, la descripción más acertada de la tarea es que hay procesos separados, cada uno de los cuales
corre hacia un umbral (un proceso de ¡adelante! y un proceso de ¡Alto! ). Se supone que la señal de ¡Alto! se
ejecuta más rápido que la señal de ¡adelante !, pero también que comienza más tarde. Si la señal de ¡Alto!
alcanza el umbral antes que la señal de ¡adelante !, el sujeto puede cancelar la acción y detenerse 12 Los registros
o ella misma. neuronales han encontrado una actividad creciente en ciertas áreas (estructuras de control motor
cortical y el núcleo subtalámico [una parte de los ganglios basales]) que rastrean los dos componentes de la
13
carrera y su interacción.
Tanto la tarea de Stroop como la de la señal de stop son tareas controladas por computadora y cronometradas.
Las otras tareas mencionadas anteriormente dependen de objetos físicos reales que se ofrecen a los sujetos;
esto produce resultados diferentes a los de los símbolos o imágenes de objetos. 14 En los primeros
capítulos del libro nos encontramos con un experimento (la Parábola de las Gominolas, Capítulo 1)
en el que los chimpancés tenían que elegir entre dos juegos de gominolas.
La clave de esta tarea fue que el sujeto obtuvo la bandeja que no eligió: para obtener la bandeja con más
caramelos, tuvo que alcanzar la otra. 15 Sarah Boysen y Gary Berntson
descubrieron que sus sujetos elegían mucho mejor la “porción humilde” si utilizaban símbolos en lugar de
caramelos de verdad. Los seres humanos también muestran preferencia por los objetos reales, en particular los
objetos sensorialmente positivos, cuando se enfrentan a tareas de decisión experimentales.
16
Esta preferencia por los objetos reales nos deja con una inconsistencia importante (e interesante) en los
sistemas de toma de decisiones y subyace a algunos de los problemas con la valoración que vimos en nuestro
análisis inicial del “valor” (Capítulo 3). La idea de una cosa y la cosa física pueden tener valores muy diferentes.
Esto ocurre porque hay múltiples sistemas de toma de decisiones que compiten por esa valoración. Si se utiliza
el sistema pavloviano (Capítulo 8) (cuando el objeto está físicamente frente a nosotros), hacemos una valoración,
pero si no lo está (si estamos utilizando el sistema deliberativo, Capítulo 9), hacemos otra.
17
Esto crea una inconsistencia interesante en la toma de decisiones. Aunque un alcohólico puede
negar el deseo de beber cuando está sentado en su casa, ese mismo alcohólico sentado en su casa puede sentir el impulso de beber.
Machine Translated by Google
El bar una hora más tarde aceptará esa bebida. Algunos autores han sostenido que la forma de
pensar en esto es que hay dos yoes: que tu yo actual está en conflicto con tu yo futuro. Otros
autores han sugerido que hay dos módulos, uno que piensa a largo plazo y otro que responde de
manera más inmediata. Creo que es más sencillo reconocer que somos inconsistentes e
irracionales y averiguar cómo manejar nuestras vidas en torno a esa inconsistencia e
irracionalidad. Una forma de ejercer autocontrol es reconocer esta inconsistencia y comprometerse
de antemano con una condición que no te permita alcanzar esa difícil elección futura. 18 Por
ejemplo, el alcohólico puede darse cuenta de que será muy difícil no beber en el bar y puede
decidir no ir al bar en primer lugar. Un jugador con un problema conocido puede tomar una ruta
diferente a casa para no pasar por el casino.
19
Los adultos generalmente pueden rechazar un solo malvavisco en esta situación, pero rechazan...
23
Comer malvavisco requiere un esfuerzo cognitivo. Esto nos lleva a la tarea de rechazar el dulce .
En esta tarea, se pide a mujeres jóvenes que han expresado interés en hacer dieta que vean una película
con un plato de bocadillos con alto contenido de azúcar colocado al lado de ellas. Al medir cuantitativamente
cuántos de los bocadillos se comen, se puede medir cuantitativamente su falta de autocontrol. A algunas de
las mujeres se les pide que no respondan a la película, mientras que a otras se les dice que simplemente la
vean. Cuanto más tienen que controlar sus emociones mientras ven la película, más comen. Se pueden
utilizar una serie de pruebas similares de autocontrol y fatiga como prueba cuantitativa, incluida la disposición
a beber un medicamento de sabor amargo, la disposición a sostener la mano en un baño de hielo frío y la
resistencia física en una tarea de tirar de una palanca o apretar una manija. Todas estas requieren algún
aspecto de autocontrol, y se deterioran (disminuyen) si se las precede con tareas que involucran un exceso
de actividad emocional y/o física.
o componentes cognitivos.
Machine Translated by Google
Autocontrol 137
Esto nos lleva al concepto de carga cognitiva . Muchas de estas tareas, como la de rechazar
caramelos e incluso la de Stroop, dependen de la capacidad de asignar algún tipo de recurso cognitivo
24
limitado al componente de autocontrol. Esto se ve claramente en la tarea Podemos ver esto más
Las personas distraídas recurren a otros sistemas. Hace poco cambié la ruta por la que voy al
trabajo. Si me distraigo (por ejemplo, pensando en cómo voy a solucionar un problema en el trabajo
o en casa, o incluso simplemente pensando en escribir este libro en lugar de conducir), me paso de la
curva y sigo directamente por la ruta anterior. Estoy segura de que si contara de siete en siete desde
1000 mientras conducía por esa esquina, me la perdería todas las veces.
A
Se entrenó a ratas para que encontraran comida. Incluso con pistas muy destacadas en cada esquina
(diferentes olores, cantidad de luces de colores, etc.), las ratas que se desorientaron cada vez antes de ser colocadas
29 Las ratas que no estaban desorientadas pudieron
en la caja no pudieron romper esa simetría rotacional de 180 grados.
romper la simetría con facilidad. Véase mi libro anterior Beyond the Cognitive Map para una discusión detallada del
experimento con ratas y lo que se sabe sobre sus correlatos y mecanismos neurofisiológicos.
Machine Translated by Google
El uso de estos recursos limitados requiere energía. Una de las cosas más interesantes del autocontrol es que no sólo depende
de prestar atención, y no sólo de ser consciente de ello. Hablamos de “fuerza de voluntad” como si fuera un recurso limitado
conservar para cuando lo necesitemos. De hecho, si se les dice a los sujetos que necesitarán utilizar su que debemos
autocontrol más adelante, pueden conservarlo, mostrando menos autocontrol en tareas anteriores pero luego siendo más
capaces de expresar autocontrol en tareas posteriores.) Incluso algo tan simple como resistir la tentación (como no comer el
chocolate que nos ofrecen) puede tener un efecto sobre la capacidad de uno para realizar alguna tarea física que requiera
resistencia.
31
Muchos científicos sostienen que ésta es una de las razones por las que el estrés a menudo conduce a volver a caer en
hábitos que se habían abandonado, como fumar o consumir drogas. Afrontar el estrés agota el autocontrol y deja a la persona
vulnerable a tareas que dependen de ese recurso de autocontrol, como la prevención de recaídas. De hecho, se ha sostenido
que una de las razones por las que las reuniones periódicas (como las de Gestión de Contingencias o los programas de 12
pasos como Alcohólicos Anónimos y sus primos más regulados) funcionan tan bien es que proporcionan recompensas diarias
por lograr el autocontrol, lo que ayuda a fortalecer esos "músculos" del autocontrol. 32 En una línea similar, Walter Mischel ha
sostenido que gran parte de lo que llamamos buena crianza implica un entrenamiento explícito del autocontrol 33 (como decirles
a los niños que "está bien esperar a que les den dos malvaviscos").
Estos recursos de autocontrol se pueden reponer a través del sueño, el descanso o la relajación. 34
Roy Baumeister y sus colegas han sugerido que este recurso limitado depende de los niveles de glucosa en el torrente
sanguíneo; versial. 36 La glucosa (azúcar) es un recurso35 Sin embargo, esta sugerencia es extremadamente controvertida.
Los niveles de glucosa en sangre en sujetos que realizaron una tarea de autocontrol fueron mucho más bajos que en sujetos
que realizaron una tarea de control similar que no requirió autocontrol, y los sujetos que bebieron una bebida azucarada
mostraron un mejor autocontrol en relación con los que bebieron una bebida igualmente dulce pero con sabor artificial. 38
Aparentemente, comer azúcar realmente ayuda con el autocontrol, lo que puede ser la razón por la que las personas estresadas
correcta, entonces el autocontrol puede ser en realidad como un músculo, en el sentido de que se cansa porque se queda sin
recursos. Sin embargo, otros científicos han sugerido que el sabor de la glucosa puede estar preparando expectativas de
objetivos y cambiando la distribución de los sistemas que impulsan la toma de decisiones. El simple hecho de probar (pero no
Tampoco está claro por qué el autocontrol requiere glucosa adicional en comparación con otros fenómenos que requieren
un uso intensivo del cerebro, como una mayor atención (escuchar un sonido muy pequeño), una mayor percepción (encontrar
una imagen oculta en una imagen), un control motor fino (tocar el piano o el violín) o incluso resolver un problema cognitivamente
Hasta donde yo sé, la teoría de la glucosa no se ha probado en estos otros estudios que requieren un uso intensivo del cerebro.
B
Sé que cuando estoy escribiendo una solicitud de subvención o trabajando muy duro en un artículo, a menudo descubro
que necesito una dosis regular de azúcar fuerte para mantener mi resistencia para escribir. Se nota que estoy trabajando
duro cuando como un donut como refrigerio a media mañana.
Machine Translated by Google
Autocontrol 139
do
fenómenos. Ir Puede ser que el autocontrol simplemente involucre más sistemas neuronales que solo
con la corriente lo hace, y esos sistemas neuronales requieren recursos.
También hay evidencia de que el autocontrol se puede entrenar, 42 pero aún no está claro si esto es
más parecido a un efecto de la práctica (a través del cual los sistemas neuronales aprenden a realizar
mejor las tareas) o a un cambio homeostático (como los músculos que aumentan sus reservas de recursos
a partir del ejercicio).
Entonces, ¿por qué el autocontrol involucra partes adicionales del cerebro y requiere más recursos
neuronales?
Dos estructuras del cerebro humano aparecen una y otra vez en las tareas de autocontrol: la corteza
prefrontal dorsolateral (dlPFC) y la corteza cingulada anterior (ACC). 43 A menudo se habla de estas
estructuras como involucradas en el "control de arriba hacia abajo" porque están involucradas en las
habilidades para reconocer y cambiar objetivos y tareas. 44 Estas dos estructuras parecen estar
involucradas en el monitoreo de la información y los deseos conflictivos, el establecimiento de tareas y la
frontal del cerebro humano, y a anulación de planes. 45 Ambas estructuras están ubicadas en la parte
D
menudo se las menciona como parte de la corteza "prefrontal".
do
Como se analiza en el Apéndice B, las mediciones de resonancia magnética dependen del aumento del flujo
sanguíneo porque las neuronas “altamente activas” requieren recursos adicionales (pero no oxígeno adicional) de la sangre.
40
Aunque no se sabe cuáles son todos esos recursos adicionales, un candidato probable es la glucosa.
Así, cuando una estructura neuronal aumenta su actividad (lo que sea que eso signifique en realidad 41 ), el cerebro se
adapta a esas necesidades aumentando el flujo sanguíneo. Sin embargo, el aumento del flujo es mucho mayor que el
aumento de las necesidades de oxígeno, por lo que con un aumento del flujo sanguíneo y las mismas necesidades de
oxígeno, queda más oxígeno en el torrente sanguíneo, que es lo que se detecta mediante la resonancia magnética y
sistemas de imágenes similares. El aumento de la actividad también se puede rastrear utilizando una molécula de glucosa
radiactiva, la 2desoxiglucosa. La 2desoxiglucosa radiactiva se inyecta en el torrente sanguíneo de un animal y luego es
absorbida por neuronas particularmente activas. La presencia de la 2desoxiglucosa marcada se puede detectar post
mortem en ciertos tejidos, que han sido "muy activos". La 2desoxiglucosa tiende a marcar las mismas estructuras que la resonancia mag
El hecho de que la resonancia magnética identifique ciertas estructuras como “involucradas” en ciertas tareas sugiere que
diferentes habilidades requieren diferentes partes del cerebro y que la hipótesis de la glucosa puede afectar a más
sistemas que sólo los sistemas de autocontrol.
D El término “prefrontal” proviene de la idea de que se encuentra en la “parte delantera de la corteza frontal”. Debido a que esta parte de la
corteza es una de las más diferenciadas entre los primates y otros mamíferos y se la identificó históricamente como el lugar de las capacidades
46
entre humanos y otros primates, consideradas exclusivamente humanas (como el “superyó”).
47 ). Sin embargo, a medida que los estudios anatómicos se han vuelto más
detallados y más desarrollados, se ha hecho posible identificar áreas homólogas en las regiones cerebrales frontales de otros animales también. 48
(Una estructura homóloga es una que cumple el mismo propósito entre dos especies y comparte una historia evolutiva. Por ejemplo, nadie negaría que
el corazón de la rata, el corazón del mono y el corazón humano son estructuras homólogas. Como hemos visto a lo largo de este libro, muchas
estructuras cerebrales también se conservan entre estas especies). De manera similar, a medida que hemos comenzado a desarrollar tareas de
autocontrol que se pueden usar en animales (como la tarea de la señal de stop), hemos comenzado a identificar vías, estructuras y mecanismos de
procesamiento de información específicos a través de los cuales funciona el autocontrol. 49 Los detalles exactos de la homología entre especies y los
detalles exactos de sus respectivos roles en la toma de decisiones son un área de investigación activa. 50
Machine Translated by Google
Autocontrol 141
El cerebro examina las entradas a los reflejos y puede modularlos si es necesario. El ACC modula los sistemas
de selección de acciones emocionales. 61 Las áreas motoras frontales (como la AMS)
modulan el aprendizaje procedimental. 62 Y la corteza prefrontal dorsolateral modula los sistemas de
63
evaluación para seleccionar opciones a largo plazo en los sistemas deliberativos.
Para ver cómo funciona esto, podemos tomar un ejemplo específico. En un estudio reciente de fMRI,
Yadin Dudai y sus colegas en Israel estudiaron a humanos que superaban su miedo a las serpientes. 64
Encontraron personas que tenían fobias específicas a las serpientes y les dieron la oportunidad de tirar de una
cuerda que acercaba una serpiente hacia ellos. La visión de la serpiente produjo actividad en la amígdala y
en las áreas emocionales límbicas, que desde hace mucho tiempo se han asociado con el miedo tanto en
animales como en humanos. (Podemos reconocerlos como circuitos de selección de acción pavlovianos
[emocionales], Capítulo 8.) Las personas que pudieron superar su miedo (tirando de la cuerda) tuvieron una
actividad reducida en la amígdala, pero una actividad aumentada en la corteza cingulada anterior subgenual
(sgACC), un área de la corteza prefrontal que se proyecta hacia la amígdala. De alguna manera, la actividad
en la sgACC ha inhibido la actividad en la amígdala y ha permitido a estas personas superar su miedo y tirar
de la cuerda hacia ellos.
Baumeister, Todd F. Heatherton y Dianne M. Tice (1994). Losing Control: How and Why People Fail at SelfRegulation
[Perder el control: cómo y por qué la gente fracasa en la autorregulación ]. San Diego, CA: Academic
Press. • George Ainslie (2001). Breakdown of Will [El colapso de la voluntad] . Cambridge, Reino Unido: Cambridge University.
Prensa .
• Robert Kurzban (2010). Por qué todos los demás son hipócritas . Princeton, NJ: Princeton
Prensa Universitaria .
• Uri Nili, Hagar Goldberg, Abraham Weizman y Yadin Dudai (2010). No temas: Actividad de los circuitos
frontales y temporales en momentos de valentía en la vida real. Neuron, 66
, 949–962 .
Machine Translated by Google
TERCERA PARTE
16
La mente física
Entre dos espejos la luz
llega al infinito, ver requiere
una
interrupción encarnada.
Históricamente, los debates sobre la relación entre la mente y el cerebro han sido entre aquellos que
sostenían que eran cosas fundamentalmente diferentes ( dualismo ) y aquellos que sostenían que la mente
estaba instanciada en el cerebro. 1 Hay pruebas sólidas contra el
dualismo porque las manipulaciones del cerebro afectan a la mente. No hay pruebas de
que exista una entidad no física y pocos científicos aún la consideran una posibilidad. Sin
embargo, más recientemente, los debates sobre el dualismo se han centrado en si la
mente depende del cerebro físico o si es un software que funciona en un hardware neuronal. 2
Ahora tenemos ejemplos de cosas que pueden ser traducidas físicamente de una instancia a otra sin
ninguna pérdida. Cuando descargamos una canción de Internet, la música ha sido traducida de ondas
sonoras en el aire a través de un micrófono a una representación digital en el disco duro de una computadora,
traducida de ahí a una serie de pulsos eléctricos a través de un cable, a menudo a través de un paso
intermedio de pulsos de luz a través de un cable de fibra óptica, luego nuevamente a pulsos eléctricos,
nuevamente a una representación digital en su disco duro local, y luego nuevamente a ondas sonoras en el
aire a través de parlantes conectados a su computadora. Aunque hay algún cambio de las ondas sonoras a
la representación digital y viceversa, no hay cambio alguno de una representación digital a otra. La naturaleza
física de la mente no es así. Para entender
145
Machine Translated by Google
Dentro de una computadora, la información puede transferirse de un lugar de la memoria a otro (como
cuando se copia un archivo del disco a la memoria) o, dentro de una red, de una computadora a otra. La
información puede almacenarse en mecanismos físicos diferentes, pero la información en sí es la misma.
Por ejemplo, la información digital almacenada en forma de orientaciones magnéticas en un disco duro
puede escribirse en un disco compacto (CD) en forma de puntos oscuros en un disco óptico.
Esto ha llevado a los científicos informáticos a separar
el concepto de hardware (la entidad física) del concepto de software (la información digital).
Existen casos en biología en los que la información se almacena digitalmente. Por ejemplo, el
ADN almacena la secuencia genética como una serie de cuatro aminoácidos (guanina, citosina,
timina y adenina, generalmente etiquetados como GCTA). Se puede argumentar que la información
contenida en el ADN es un software y que los complejos mecanismos de la célula que convierten
esa información en proteínas y otros cambios físicos en la célula son el hardware que lee y opera
B
sobre el software.
En las décadas de 1970 y 1980, la analogía hardware/software se hizo popular, tanto entre los
científicos como entre el público, como explicación del problema mente/cerebro, con la idea de que
el cerebro era el hardware y la mente el software. 4 Este es software/
El dualismo de hardware era particularmente atractivo porque significaba que la mente se encontraba en
un nivel diferente al del cerebro y podía estudiarse por separado. También ofrecía la esperanza de que
A
Un disco duro (HD) almacena información como una serie de pequeñas piezas de materiales magnetizables llamados
ferromagnéticos. Bajo la influencia de un campo magnético, estos pequeños puntos (llamados dominios) pueden orientarse en
una de dos direcciones (arriba o abajo). El disco duro almacena una serie de ceros y unos como una secuencia de dominios arriba
y abajo. Un disco compacto (CD) almacena información como una serie de pequeños hoyos en un plástico de color, formando una
serie de puntos oscuros y claros. Los discos duros y los CD pueden almacenar exactamente la misma serie de ceros y unos.
Aunque se instancian en el ámbito físico (dominios magnéticos, hoyos oscuros/claros), la información real es la secuencia de
ceros y unos.
B El mecanismo real por el cual una célula lee la información almacenada en el ADN es extremadamente complejo,
con nuevos mecanismos descubiertos en las últimas décadas donde el ambiente físico dentro y alrededor de la célula
cambia qué componentes del ADN son leídos. 3 Por ejemplo, unas proteínas
especializadas llamadas histonas pueden impedir que se lea parte del ADN, mientras que otras proteínas llamadas factores de
transcripción pueden estimular la lectura de parte del ADN. En este punto, los genetistas han creado estructuras de control lógicas
completas (si esta proteína está presente pero aquella proteína no, entonces se lee esta parte del ADN para crear una tercera
proteína). El entorno físico de la célula puede cambiar qué parte del programa se lee. Pero esto no es tan diferente de los
programas informáticos actuales, que tienen mecanismos para verificar los aspectos físicos del ordenador para decidir qué partes
del programa deben ejecutarse. Por ejemplo, cuando el ordenador se inicia, comprueba si tiene instalado un lector de DVD o una
tarjeta de red.
(Hoy en día, los programas no suelen decirle a los usuarios lo que están haciendo, por lo que es posible que solo le muestren una
pequeña barra azul circulando o un logotipo corporativo para mirar, pero lo que realmente está haciendo es verificar el hardware).
Si encuentra ese hardware, instala los controladores apropiados (pequeños fragmentos de software) para él.
Machine Translated by Google
que se podría construir un programa de computadora usando un hardware completamente diferente y aún así crear una
inteligencia artificial.
En ese momento, el software estudiado era generalmente simbólico: conjuntos de símbolos arbitrarios que se manipulaban
y Herb Simon demostraron que un algoritmo de búsqueda que examinaba las posibilidades de los pasos matemáticos podía
De hecho, su programa encontró una prueba más elegante de uno de los teoremas de los Principia de Russell que la que
Con computadoras más rápidas y más grandes, el proceso de búsqueda que fue desarrollado por estos primeros —es
8
Los investigadores de inteligencia artificial han sido capaces de hacer cosas notables tanto tan bueno como lo
do
como los médicos humanos o incluso mejores que ellos en la identificación usan las empresas de exploración petrolera—
de enfermedades, las industrias han sido capaces de encontrar yacimientos de petróleo en las profundidades del
suelo y, como es bien sabido, han vencido al mejor jugador de ajedrez del mundo. Recientemente, la combinación
de procesos de búsqueda con una base de conocimiento profunda de relaciones semánticas venció a los mejores
jugadores humanos en el programa de televisión Jeopardy . Sin embargo, es importante recordar que esta teoría de
búsqueda a través de posibilidades es una hipótesis sobre cómo los humanos toman decisiones. Extensas pruebas
psicológicas han demostrado que los humanos no buscan tantos pasos en el futuro como lo hacen estos programas.
10 Los mejores jugadores de ajedrez no miran más allá que los jugadores de ajedrez más débiles. Los médicos
tienen que ser entrenados explícitamente para utilizar paradigmas de diagnóstico diferencial , e incluso los médicos
bien entrenados tienden a utilizar el reconocimiento de patrones basado en la experiencia en lugar del razonamiento
explícito en la práctica.
La teoría de la búsqueda a través de posibilidades requiere una manipulación de símbolos. La razón por la que los
investigadores de inteligencia artificial comenzaron con la manipulación de símbolos (como lo cuenta 11 ) fue que Allen Newell,
últimas conferencias públicas dadas en los científicos de Carnegie Mellon, pensó que "la percepción iba a en una de sus
ser fácil", por lo que comenzarían con la parte difícil de la cognición. Al final de su carrera, Allen Newell llegó a la conclusión
de que, de hecho, habían estado yendo al revés, que la percepción estaba lejos de ser fácil y que la cognición era en realidad
percepciones aplicadas a los mecanismos de percepción. Pero en ese momento (desde la década de 1950 hasta la de 1980),
la inteligencia artificial implicaba manipulaciones de símbolos y condujo a lo que Newell y Simon llamaron "la hipótesis de los
sistemas de símbolos físicos", que proponía que la cognición consistía enteramente en la manipulación de símbolos
abstractos.
12
una máquina? Como hemos visto a lo largo de este libro, para poder ser científicos al respecto, necesitamos operacionalizar
do
Aunque los primeros programas de inteligencia artificial (1979) superaron a los de la facultad de medicina en
comparaciones controladas, estos programas fueron abandonados debido a preocupaciones sobre cuestiones legales:
¿quién sería responsable de los errores en el diagnóstico? Una preocupación similar puede limitar el éxito de los
9
programas de conducción automática.
Machine Translated by Google
D
En la época en que Turing propuso su prueba, obtener información y resultados de las computadoras era muy
complicado, y Turing dedicó gran parte de su propuesta original a asegurarse de que la prueba no pudiera ser
engañada al ver u oír a la persona o la computadora. Ahora estamos muy familiarizados con el concepto de
comunicarse con entidades invisibles a través de redes informáticas y, de hecho, la prueba de Turing se realiza
regularmente en el contexto de interacciones de videojuegos, donde algunos de los personajes están controlados por
la computadora y otros por humanos.
mi
Al parecer, así fue como se implementó la primera versión del Solucionador de problemas generales de Newell
y Simon. En esa época (en 1956) las computadoras eran demasiado difíciles de programar, por lo que lo codificaron
en fichas de 3 × 5 e hicieron que sus familias manipularan las fichas simbólicamente siguiendo reglas específicas,
15
produciendo así, literalmente, la habitación china.
Machine Translated by Google
La segunda hipótesis es que el nivel de información es independiente de la descripción física 18 (es decir, la
secuencia de ceros y unos almacenada en el disco duro es la misma que la secuencia de ceros y unos
almacenada en el DVD). Ambas afirmaciones son incorrectas cuando se aplican al cerebro físico. Si bien
encontraremos útiles tanto los niveles físico como computacional o informativo para comprender la función
cerebral, la evidencia experimental sugiere que la hipótesis de que se trata de descripciones distintas y
separables no se aplica al cerebro.
F
La analogía hardware/software surgió de dos literaturas científicas (una incapacidad para explicar la
conciencia a partir de efectos físicos20 y observaciones de pacientes recuperándose de estudios de lesiones21 )
y ganó fuerza a medida que los investigadores de inteligencia artificial intentaron Los experimentos de psicología
22
Demuestran que la manipulación de símbolos podría explicar la inteligencia. han encontrado que la
manipulación de símbolos es particularmente difícil para los humanos, y que cuanto más experiencia se tiene
con un tema, menos manipulación de símbolos parece hacerse. 23 Esto sugiere que hay algo más sucediendo
más allá de la manipulación de símbolos.
Resulta tentador darse por vencido y decir que, como todavía no podemos explicar cómo surge la conciencia
en el cerebro, no puede ser un objeto físico. Sin embargo, las manipulaciones físicas afectan al pensamiento
consciente, 24 y la operacionalización de la conciencia ha sido difícil de alcanzar. 25 Cada vez que los científicos
operacionalizan una parte de la conciencia para poder estudiarla experimentalmente (por ejemplo, concentrándose
en un aspecto como la atención, la percepción, la emoción o el control motor voluntario), estos estudios han
producido explicaciones físicas (y computacionales) detalladas de cómo funciona el proceso en el tejido cerebral.
26
De manera similar, cuando realmente probamos el momento en que ocurre la conciencia, gran parte de ella
parece ocurrir después y no antes de la conducta. 27 No tener una explicación para la conciencia parece ser un
punto de partida bastante débil para la teoría principal de que la conciencia es el software que se ejecuta en el
hardware del cerebro.
Sin embargo, históricamente, lo que realmente parecía impulsar la analogía del software era el observador.
28 Pacientes
Los animales y los pacientes a veces podían recuperarse de una lesión cerebral. Los animales con
afasia (problemas del lenguaje) debido a daños en una parte del cerebro a veces (con suficiente entrenamiento)
recuperaban algunas habilidades del lenguaje. 29 Los animales con lesiones cerebrales a veces podían aprender
a hacer tareas que no podían hacer poco después de la lesión. 30 Y, lo más importante, los recuerdos a largo
plazo parecían almacenarse en una parte del cerebro diferente de los recuerdos almacenados recientemente.
31
La idea de que el cerebro es un contenedor amorfo y que todas sus partes son equivalentes se remonta a un
famoso experimento de Karl Lashley en la década de 1920 en el que observó ratas que corrían por laberintos a
los que se les habían extirpado grandes franjas de tejido cerebral. 32 Lashley ciertamente reconoció que había
una diferencia entre las partes de la corteza (por ejemplo, visual 33 ), pero Lashley descubrió que la corteza
la visión, incluso en la rata. La capacidad de las ratas para resolver un estaba obviamente especializada para
laberinto dependía de la cantidad de tejido cerebral extirpado: la
Cuanto más tejido extraía, peor le iba al animal. En general, Lashley no vio mucha diferencia entre
lesiones de tamaño similar pero que afectaban a distintas partes de la corteza, pero tampoco estaba
observando a las ratas hacer mucho en primer lugar. Cuando realmente observamos no sólo si un animal
realiza una tarea, sino cómo la realiza, lo que encontramos es que los animales (incluidos los humanos)
evitan las lesiones cerebrales no moviendo información sino resolviendo tareas utilizando otros sistemas.
Ya hemos visto una diferencia entre la toma de decisiones deliberativa (Capítulo 9) y la toma de
decisiones procedimental (Capítulo 10). Esta distinción coincide muy de cerca con una distinción observada
en la literatura psicológica humana entre la memoria declarativa y procedimental . La distinción específica
34
entre la memoria Aunque la idea de que existían memorias múltiples y disociables
declarativa y procedimental en el aprendizaje humano se remonta a la década de 1970, la distinción
específica entre la memoria declarativa y procedimental en el aprendizaje humano, y la idea específica de
35
que eran disociables, se remonta a un artículo de 1980 de Neal Cohen y Larry Squire y el famoso paciente HM
HM (ahora conocido como Henry Molaison G ) era un joven que sufría terribles ataques
epilépticos debilitantes e intratables que le impedían trabajar. 37 La epilepsia es una falla en los
sistemas de retroalimentación negativa del cerebro que normalmente impiden que las conexiones
positivas (excitatorias) altamente interconectadas entre las neuronas se descontrolen. Como una
avalancha o un incendio forestal, un evento sobreexcitado puede propagarse por todo el cerebro.
yo
Tradicionalmente, se hace referencia a los pacientes por sus iniciales para preservar su privacidad. Cuando HM murió en 2008, se
GRAMO
reveló su nombre completo. 36 Pero incluso antes, conocido solo como HM, era posiblemente el paciente con lesión cerebral más conocido
en neurociencia, rivalizado solo por Phineas Gage, a quien conocimos en nuestro análisis de la corteza frontal y la emoción (Capítulo 8).
yo
En los tejidos altamente interconectados (como el hipocampo y el neocórtex), las conexiones recurrentes excitatorias (que estimulan
la activación de las neuronas) se equilibran con conexiones recurrentes negativas locales (que desalientan la activación de las neuronas). Si
En general, el sistema nervioso central se encuentra en equilibrio dinámico, lo que facilita la respuesta rápida y hace que el cerebro sea más
flexible en sus respuestas, pero también significa que un evento transitorio tarda un tiempo en volver a la normalidad. El evento epiléptico
es un fenómeno conocido en los campos de la física y la ingeniería eléctrica como "rebote": el sistema se empuja demasiado hacia un lado
y, cuando regresa a su punto de base, rebota demasiado hacia el otro lado, como un resorte que oscila cuando se lo tira o se lo empuja.
Por lo tanto, la epilepsia es incorrecta, una activación extraña de las neuronas. Dado que la activación de las neuronas es memoria,
percepción y cognición, esta activación adicional de las neuronas será percibida por otras partes del cerebro como real. Las convulsiones
epilépticas en la corteza auditiva suelen estar precedidas por la audición de música por parte de los pacientes, los eventos en las estructuras
del lóbulo temporal pueden desencadenar la memoria y las convulsiones en las partes emocionales del cerebro (como la corteza frontal ventral)
39
Puede desencadenar Dostoievski (un conocido epiléptico) describió las convulsiones en su novela El idiota como algo premonitorio.
sentimientos cedidos por un momento emocional de excepcional claridad de alegría, esperanza y vitalidad.
40 Este sentimiento emocional de profunda conexión
religiosa también se ha observado en algunos pacientes modernos con epilepsia del lóbulo temporal. 41
Machine Translated by Google
Este procedimiento fue introducido por Wilder Penfield y Herbert Jasper en el Montreal
43
Instituto Neurológico a principios de los años 40. Todavía hoy se hace como último recurso para casos intra
44
epilepsia de mesa. Pero hoy, antes de extraer cualquier tejido, los médicos dedican tiempo a localizar el
sitio focal (el punto de inicio) de la epilepsia mediante el registro durante largos períodos de tiempo (incluso hasta
semanas) para asegurarse de que localizan el foco lo más exactamente posible, y luego dedican tiempo a
determinar, lo mejor que pueden, lo que hace esa parte del cerebro. En 1957, ninguna de estas técnicas estaba
disponible; todo lo que Scoville y sus colegas tenían disponible era el electroencefalograma (EEG), que no tiene
suficiente resolución para descomponer la información que se está procesando, y que solo era lo suficientemente
bueno para mostrarle que el foco epiléptico estaba en algún lugar de la región temporal medial. Entonces,
desesperado por detener las convulsiones epilépticas, HM aceptó que el cirujano le extirpara una gran parte de
su hipocampo y su lóbulo temporal medial de forma bilateral.
El cerebro (y la mente) son cosas físicas: si se elimina una parte del cerebro, se elimina una parte del
cálculo. (A veces, otras partes pueden intervenir para realizar una tarea de una manera diferente, pero a veces
no. Este es el error fundamental en la analogía software/hardware). En ese momento, en 1957, el papel
computacional del hipocampo todavía no estaba claro.
desconocido.
(ver “El marinero perdido” y “Una cuestión de identidad”), en El hombre con una y de AR Luria (convertida en
Mundo destrozado , una compleja historia de misterio) en Christopher Nolan
Recuerdo .
HM era un paciente normal (salvo por su epilepsia), con una inteligencia superior a la media, que había
perdido de repente esa capacidad tan específica de aprender cosas nuevas. En esa terrible tragedia había una
oportunidad de aprender qué había salido mal y de entender cómo no cometer el mismo error en el futuro. 48
Scoville llamó a Brenda Milner, una neuropsicóloga que había estudiado con Donald Hebb y Wilder Penfield en
la Universidad McGill.
Aunque Milner descubrió que la incapacidad de HM para aprender nuevos recuerdos era generalizada y afectaba
a todos los sujetos y dominios (visual, auditivo, lingüístico, etc.), también descubrió que HM podía aprender una
tarea de trazado en espejo que tanto a HM como a los sujetos de control les llevaba varios días aprender. 49
Junto con su alumna Suzanne Corkin, descubrieron que HM podía, de hecho, aprender nuevas tareas, pero no
recordaba haberlas hecho. Estas tareas eran todas del tipo que requieren mucha práctica y se aprenden
lentamente, como escribir en espejo o trazar caminos intrincados. Corkin y Milner describieron cómo HM se
quedaba incrédulo de poder hacer una tarea porque no podía recordar que la hubiera intentado antes, pero la
velocidad a la que aprendía estas tareas de aprendizaje lento que requerían práctica era aproximadamente
normal.
Esto llevó a la sugerencia de que había dos sistemas de memoria: uno que aprendía hechos enunciables
(“Mi auto está estacionado en el aeropuerto”) y otro que aprendía habilidades (conducir).
Machine Translated by Google
Una bicicleta, lanzar una pelota de béisbol). Los hechos se pueden declarar: puedo decirte dónde está
mi coche (“en el aeropuerto”) y lo sabrás de inmediato. Pero las habilidades son procedimientos que
solo se pueden aprender con la práctica. No importa cuánto te diga cómo lanzar una pelota de béisbol,
no podrás hacerlo hasta que lo intentes durante un tiempo. El primer tipo de memoria se denominó
memoria declarativa . tipo de procedimiento .50
, el segundo
Trabajos posteriores han sugerido que la memoria declarativa tiene dos componentes, un componente
episódico que incluye recuerdos de lugares y momentos específicos (la vez que olvidé el cumpleaños de mi
esposa) y un componente semántico que consiste en hechos (la fecha real del cumpleaños de mi esposa). 51
Ahora sabemos que la memoria episódica es una imaginación construida del pasado; probablemente
corresponde al mismo sistema utilizado para imaginar el futuro. 52 Este es el sistema deliberativo que
describimos anteriormente (Capítulo 9). La memoria semántica aún no tiene una correspondencia aceptada
en nuestra taxonomía de toma de decisiones, pero puede ser similar a los componentes de reconocimiento
de situaciones y narración (Capítulo 12).
Lo que importa aquí, y lo que condena la analogía hardware/software, es que los pacientes como HM no
están trasladando el software de una parte del ordenador a otra, sino que cada componente es capaz de
realizar determinados cálculos con la información entrante. Cuando el marinero perdido del caso de estudio
de Oliver Sacks aprende a familiarizarse con su vida entre las monjas y encuentra la paz en su jardín, no ha
encontrado una manera de recuperar su capacidad de aprender nuevos recuerdos, sino que ha encontrado
la paz en la forma en que utiliza otros sistemas para realizar sus tareas. Cuando HM aprendió a escribir en
espejo, lo hizo utilizando el sistema de memoria procedimental.
a la corteza auditiva?
sus hipocampos y otras estructuras subcorticales especializadas. El procesamiento cortical es bastante diferente: 53 Subcortical y HM perdieron
mientras que las estructuras subcorticales tienden a estar especializadas, la corteza es una gran lámina bidimensional de unidades de
Las teorías actuales sugieren que cada parte repetida de la corteza realiza un cálculo similar sobre un
conjunto único de entradas. (Exactamente en qué consiste ese cálculo sigue siendo controvertido, pero
parece ser algún tipo de proceso de categorización que ocurre a través de un mecanismo de memoria
direccionable por contenido. 55 Véase el Apéndice C para una discusión de lo que se sabe sobre los cálculos
que ocurren en la corteza). Sin embargo, ese cálculo depende fundamentalmente de las entradas y, a
diferencia de las computadoras digitales, esas entradas son incompletas.
56 Es decir, no se puede enviar ninguna información a ninguna parte de la corteza. Cada
columna cortical recibe un conjunto limitado de entradas, y la información transportada por esas entradas es
todo lo que tiene disponible.
Podemos ver las limitaciones de esto al observar cómo las representaciones corticales pueden cambiar
con los cambios en las entradas sensoriales. Esto se ha estudiado con más detalle en el contexto de los
sistemas sensoriales primarios (en particular, los sistemas somatosensoriales [del tacto]). 57 Las células en
estas áreas sensoriales reciben entradas de una amplia gama de células de entrada, con entradas más
58
fuertes generalmente en el centro y la fuerza de la entrada disminuye a medida que Hablamos de “tuning”
la entrada cambia. curvas”, que generalmente tienen una sensibilidad máxima pero un rango amplio (ver Apéndice B).
Machine Translated by Google
Las células compiten entre sí para determinar qué señales formarán el pico de cada curva de ajuste. Tomemos
como ejemplo la palma de la mano: en cada punto de la palma, una serie de mecanorreceptores tienen
mecanismos moleculares que detectan el tacto. Estos detectores hacen que la célula dispare picos, que se
transmiten a la médula espinal y luego, a través de múltiples pasos, a las cortezas sensoriales, donde se interpretan
como sensaciones táctiles. Aunque estos mecanorreceptores individuales cubren áreas muy grandes de la palma,
se puede localizar un toque de pinchazo en un punto pequeño porque la corteza somatosensorial implementa una
especie de proceso de ganador se lleva todo utilizando un mecanismo llamado inhibición lateral: las células
nerviosas inhiben a sus vecinas. Esto significa que, aunque muchas células reciben , en el que corti
información, solo las que representan la ubicación tocada permanecen activas. Este sistema integra información
de un área muy grande, pero proporciona una interpretación muy precisa de la sensación.
Hay más áreas de la corteza somatosensorial que son sensibles a la palma y las puntas de los dedos
que al brazo, lo que hace que la palma y los dedos sean sensores más sensibles que el brazo. Un
experimento clásico de secundaria consiste en cerrar los ojos y pedirle a un compañero de laboratorio que
toque dos lápices en la mano, el brazo o la espalda. ¿Puedes decir que son dos puntos o sientes que son
uno solo? (Como control, el experimento se realiza generalmente con el compañero de laboratorio a veces
usando un lápiz y a veces usando dos y luego preguntando al sujeto "¿uno o dos?") La sensibilidad de la
palma es mucho más precisa que la del brazo o la espalda. Esta distribución no uniforme ocurre en todos
los sistemas sensoriales. La corteza auditiva dedica más área cortical a interpretar las frecuencias en las
que se produce el habla humana que otras frecuencias, mientras que la corteza visual dedica más área
cortical a interpretar el centro de la visión (llamada fóvea) que la periferia.
59
Pero ¿qué sucede cuando se pierde parte de la información? Como las células en realidad
reciben información de grandes áreas del campo sensorial, pero las entradas lejanas suelen
quedar fuera de competencia, si se pierde la parte central de la información, las entradas lejanas
ganarán la competencia y la célula cambiará el área que escucha y mostrará respuestas a las áreas
que quedan. 60 Obsérvese que, si bien la compensación es un cambio en la información que procesa la
corteza, no se debe a un cambio en el software de la corteza que ya no se utiliza, sino a un cambio en el
cual se escuchan las entradas que ya están conectadas.
Este efecto produce consecuencias interesantes, sobre todo en las sensaciones en los miembros
fantasmas. Los pacientes que han perdido un miembro suelen sentir sensaciones en ese miembro desaparecido.
VS Ramachandran ha demostrado que estas sensaciones se deben a estímulos sensoriales que llegan a
61 estructuras primarias
representadas cerca de la corteza somatosensorial. La corteza somatosensorial
62
mate se conoce desde fines del siglo XIX. discontinuidades; por ejemplo, las Tiene algunas cosas extrañas
puntas de los dedos están representadas cerca de la cara. Los pacientes a los que les falta una mano a
veces sienten sensibilidad en la mano cuando se les toca la cara.
Los pacientes con amputaciones suelen quejarse de dolor o picor en el miembro fantasma; estas
sensaciones son extremadamente incómodas porque no pueden rascarse un miembro que no está allí. Sin
embargo, rascarse la zona adyacente representada a veces puede aliviar el dolor del miembro fantasma.
que significa “con” o “juntos”, y astesia o estética ]), es , que significa “sentir” o “percibir” [como en anestesia ]
una interacción fascinante entre los sistemas sensoriales. Curiosamente, estas relaciones no son aleatorias; tienden
a ser constantes dentro de una persona determinada. Los sabores saben a formas. Los números tienen colores
asociados. 64
Hay algunas evidencias de que durante el desarrollo, las representaciones corticales pueden cambiar más que
durante la edad adulta. 65 En parte, esto parece deberse a que la conectividad cortical en los jóvenes y los niños es
más amplia y se reduce a medida que se desarrollan los sistemas corticales. Esto ha sido estudiado más
cuantitativamente por Eric Knudsen, observando cómo las representaciones en los colículos de los búhos cambian en
respuesta a los cambios sensoriales. Los colículos superior e inferior son estructuras cerebrales subcorticales en aves
y mamíferos que realizan una función de atención o de orientación: las células están organizadas de manera
topográfica que representa la posición alrededor de la cabeza del animal, horizontal y verticalmente. lleva a que el
atención a esa posición horizontal y vertical. Las células del colículo inferior responden animal preste
principalmente a la información auditiva (pero también más débilmente a la visual), utilizando señales auditivas
(volumen y diferencia de tiempo entre los dos oídos) para localizar un objetivo en el espacio, mientras que las células
del colículo superior responden principalmente a la información visual (pero también más débilmente a la auditiva y
táctil). Cuando escuchas un paso detrás de ti y te das vuelta para ver qué es, eso es el colículo en acción. El colículo
inferior deriva del tectum auditivo de los reptiles, mientras que el colículo superior deriva del tectum óptico en los
reptiles, que son sus sistemas sensoriales primarios. En las aves y los mamíferos, tanto el colículo inferior como el
superior se encuentran debajo de estructuras evolutivamente más nuevas, las cortezas auditiva y visual.
67
Como estos colículos están organizados topográficamente en términos de
una salida, los múltiples sistemas sensoriales tienen que estar alineados. Probablemente porque es más fácil calcular
una orientación a partir de señales visuales que auditivas, la alineación de ambos (incluso del colículo inferior) resulta
68
estar basada en señales visuales.
Eric Knudsen y sus estudiantes utilizaron este fenómeno para estudiar cómo el cúmulo inferior de las lechuzas
las entradas visuales. 69 Los búhos son particularmente buenos para localizar sonidos cambia cuando se modifican
en el espacio tridimensional (ya que generalmente cazan de noche).
Un búho puede seguir las pisadas de un ratón a metros de distancia, apuntarle y golpearlo con precisión.
70
A medida que el búho se desarrolla, necesita aprender a alinear la información espacial que obtiene
de las señales auditivas con la información espacial que obtiene de las señales visuales.
Knudsen y sus colegas equiparon a los búhos con gafas prismáticas que desplazaban las señales visuales hacia la
I
izquierda o hacia la derecha en un ángulo determinado.En el búho, el sistema auditivo se desplaza para
alinearse con el visual, por lo que las entradas auditivas al colículo inferior tenían que llegar a
lugares ligeramente diferentes.
Lo que Knudsen y sus colegas descubrieron fue que, inicialmente, las entradas auditivas al colículo inferior eran
muy amplias, pero que se reducían a medida que los animales progresaban.
I Estos prismas pueden resultar familiares a algunas personas que visitan museos de ciencias. Un juego típico de
neurociencia que se muestra en los museos de ciencias y durante las presentaciones a los estudiantes de la escuela es
pedirle a un voluntario que lance una bolsa de frijoles a una canasta con prismas puestos. Debido a que el prisma desplaza el
mundo visual hacia la izquierda en un ángulo determinado (digamos 20 grados), la persona normalmente falla la canasta por
20 grados en la dirección opuesta. Con intentos continuos, la persona puede aprender a compensar en el transcurso de unos pocos minutos.
Y luego, cuando se quitan los prismas, se produce un efecto posterior en el que la persona falla el tiro por 20 grados en la
dirección desviada, lo que lleva unos minutos corregir. Con más experiencia con y sin prismas, el tiempo que lleva cambiar
disminuye. 71
Machine Translated by Google
a través del desarrollo. En particular, los búhos pasaron por una edad específica, llamada período
sensible , después del cual las entradas auditivas se cristalizaron en su lugar y ya no se volvieron
maleables. 72 Las manipulaciones de los prismas antes de la cristalización fueron mucho más efectivas
que las manipulaciones posteriores.
Este tipo de período sensible se observa en muchos sistemas, incluidos el sistema visual, el sistema
auditivo y otros. Se observan períodos sensibles similares en los gatos y los monos que aprenden a ver,
en los pájaros que aprenden a cantar y en los niños humanos que aprenden el lenguaje. 73 Por
eso los niños aprenden mucho mejor que los adultos lenguas extranjeras. La aparición de los períodos
sensibles se debe a un cambio fisiológico en el cerebro, que termina cuando la plasticidad se cristaliza en
74
diferentes estructuras cerebrales a distintas edades.
Pero, de nuevo, tal como se vio en los resultados del miembro fantasma, arriba, los cambios que los
búhos podían acomodar conductualmente coincidían completamente con el grado de cambios físicos .
es. 75 Los cambios disponibles dependían de los cambios de conectividad. Dependencias similares
76
Se han observado cambios en los sistemas somatosensoriales y auditivos que Cambios sensoriales
reflejan cambios reales en la conectividad física dentro del cerebro. Pero ¿qué pasa con los recuerdos?
¿No se puede traducir la información de la memoria de corto plazo a la de largo plazo?
¿Cómo puede surgir esta diferencia entre la memoria semántica y la episódica? A lo largo de este
libro, he intentado explicar el mecanismo con teorías que puedan explicar realmente cómo surge el nivel
de información a partir del físico. En este caso, necesitamos las respuestas a cuatro preguntas: (1)
¿Cómo se almacenan las memorias episódicas? (2) ¿Cómo se almacenan las memorias semánticas? (3)
¿Cómo se transfiere la información de una a otra? Además, sería bueno entender (4) ¿Por qué es útil
evolutivamente un mecanismo de este tipo?
Hemos encontrado recuerdos episódicos en otras partes de este libro (en el Capítulo 9). Observamos
que no se almacenaron de manera impecable, sino que se reconstruyeron a partir de componentes
almacenados en diferentes áreas corticales.
Machine Translated by Google
hipocampo, que recibe información (a través de la corteza entorinal) de prácticamente todo el neocórtex, y
que envía información (de nuevo a través de la corteza entorinal) a prácticamente todo el neocórtex. en otra
82 También nos hemos encontrado con memorias semánticas.
parte de este libro (en el Capítulo 12).
¿Por qué necesitaríamos estos dos sistemas diferentes? Es de suponer que, como en los otros ejemplos
de sistemas de toma de decisiones múltiples que hemos encontrado hasta ahora, cada mecanismo tiene
ventajas y desventajas. Si utilizamos el adecuado en el momento adecuado, podemos aprovechar las
ventajas de cada uno y reducir las desventajas. Una teoría, propuesta por Jay McClelland, Randy O'Reilly y
Bruce McNaughton en la década de 1990, era que necesitamos dos sistemas de aprendizaje: un sistema
que pudiera almacenar unos pocos recuerdos rápidamente asegurándose de que las representaciones fueran
realmente separables, y otro sistema que pudiera almacenar muchos recuerdos, pero que se tomara el
tiempo de almacenarlos lentamente para que no interfirieran entre sí. 83 La teoría surgió del trabajo sobre los
aspectos computacionales de las memorias direccionables por contenido (véase el Apéndice C), en el que
se observó que almacenar recuerdos secuencialmente en un sistema neuronal donde los recuerdos estaban
distribuidos entre muchas neuronas producía una interferencia catastrófica : a medida que se almacenaba un
recuerdo, se perdían los recuerdos más antiguos. 84
Como estos sistemas almacenaban la información de manera distribuida, a través de pequeños cambios
en las conexiones individuales, cada conexión entre neuronas (cada sinapsis) participaba en muchos
recuerdos. Esto significa que si se almacenaba un recuerdo, los cambios en las sinapsis necesarios para
almacenar el nuevo recuerdo podrían deshacer algunos de los cambios necesarios para los recuerdos
anteriores. Este es un proceso llamado interferencia .
para que interfieran con los antiguos, es decir, si 85 Por otro lado, si intercalas los nuevos recuerdos
cambias las sinapsis un poco hacia lo que tendrían que ser para almacenar el primer recuerdo, y luego un
poco hacia lo que tendrían que ser para almacenar el segundo, las sinapsis podrían encontrar una manera
de almacenar ambos recuerdos simultáneamente.
En efecto, existe un equilibrio entre ser lo suficientemente maleable para aprender cosas nuevas
rápidamente y lo suficientemente estable para mantener recuerdos durante mucho tiempo. McClelland,
O'Reilly y McNaughton propusieron que si se tuviera un sistema que pudiera almacenar recuerdos
rápidamente, sin interferencias, se podría utilizar ese sistema de almacenamiento rápido para intercalar los
recuerdos en el almacenamiento más lento y de más largo plazo. Propusieron que el hipocampo, que
contiene mecanismos para reducir la interferencia entre los recuerdos almacenados (y por lo tanto puede
almacenar recuerdos rápidamente), servía como almacenamiento rápido y la corteza (que aprendía más
86
lentamente y contenía muchas más sinapsis) servía como almacenamiento lento. Aunque Aunque esto
esta teoría parece ser principalmente correcta, como hemos discutido en este capítulo, la transferencia es
una transferencia, no solo de información sino también de tipo, de una representación episódica a una
87
representación semántica.
Esto significa que el cerebro necesita transferir una memoria desde un sistema aprendido rápidamente,
que la reconstruye a partir de partes, a un sistema de almacenamiento aprendido lentamente, en el que se
88 Antes de analizar cómo se
almacena gracias a la fuerza de las conexiones entre las estructuras neuronales.
produce esta transferencia, es importante señalar que existen pruebas muy sólidas de que se trata de dos
sistemas separados, cada uno de los cuales puede aprender recuerdos por separado. Aunque el aprendizaje
generalmente procede de los recuerdos episódicos aprendidos rápidamente a los recuerdos semánticos
aprendidos más lentamente, si se dañan las estructuras críticas para los sistemas de memoria episódica, el
sistema de memoria semántica aún puede aprender. 89 Por ejemplo, los pacientes con hipocampo
Machine Translated by Google
Los niños con daño cerebral tienen problemas para pensar en el futuro episódico, pero aún pueden aprender
a reconocer escenas familiares que experimentan varias veces y aún pueden construir narrativas.
90 activos. Un ejemplo de ello lo encontramos en el marinero perdido de Oliver Sacks, que encontró la manera
de sentirse cómodo en su nuevo jardín pero siguió siendo incapaz de aprender recuerdos explícitos
(episódicos). 91 Suzanne Corkin dice que a través de su larga interacción con él, HM comenzó
a reconocerla y pensó que la conocía de la escuela secundaria. 92 Esta construcción de una explicación a
veces se llama confabulación93 y es una consecuencia de la construcción de narrativas (Capítulo 12) a
través de procesos de memoria direccionable por contenido (Apéndice C).
Aunque es posible construir recuerdos semánticos a través de una experiencia prolongada, también es
posible tomar una experiencia única (codificada en la memoria episódica) y, a través de la repetición interna,
transferirla a una memoria semántica. Esta transferencia parece ocurrir principalmente durante el sueño.
94 Los científicos saben desde hace mucho tiempo que el sueño es
una parte fundamental del proceso de aprendizaje. Los animales y los seres humanos privados de sueño no
sólo no aprenden bien, sino que además no recuerdan fácilmente las tareas que aprendieron antes de quedar
95
privados de sueño.
Uno de los fenómenos más interesantes descubiertos en las últimas dos décadas es un fenómeno
llamado “reproducción”, en el que los patrones de activación neuronal observados durante la conducta se
reproducen durante el sueño después. 96 El fenómeno se observó originalmente en registros neuronales del
hipocampo, pero ahora se sabe que ocurre en todo el hipocampo, el neocórtex y algunas estructuras
subcorticales. Debido a que es tan difícil registrar señales neuronales de los humanos, el fenómeno de la
repetición se ha estudiado generalmente en ratas y monos, pero el momento de los eventos de repetición
se corresponde muy bien con el momento en que los estudios de privación del sueño han descubierto que el
sueño es fundamental para consolidar la memoria.
97 recuerdos.
La reactivación de patrones neuronales conductuales durante el sueño fue observada por primera vez en
1989 por Constantine Pavlides y Jonathan Winson, quienes registraron a partir de pares de células
98
células pal de ratas. hipocampales en ratas (células de lugar) que tienen la función de ajuste muy
conveniente de que responden solo cuando la rata está en una posición específica en un entorno (el campo
de lugar de la célula). Cada célula tiene un campo de lugar diferente. 99 Pavlides y Winson eligieron células
de lugar con campos de lugar no superpuestos; por lo tanto, pudieron exponer a la rata al campo de lugar de
una célula sin exponerla al campo de lugar de la otra. Luego descubrieron que durante el sueño después de
la conducta, la célula con el campo de lugar al que el animal había estado expuesto se activaba mucho más
que la célula con el otro campo de lugar, incluso aunque el animal no estuviera en ninguno de los campos de
lugar cuando se le permitió dormir.
Nuestra capacidad para observar la reactivación y la repetición dio un paso gigantesco con el desarrollo
en 1993 de la tecnología de grabación multitetrodo por Matt Hew Wilson y Bruce McNaughton, quienes
combinaron varias tecnologías y pudieron grabar de casi 150 células simultáneamente de sus ratas en
100 Porque cada uno
comportamiento. Como cada célula de lugar tiene un campo de lugar diferente, a partir
de la actividad en todo el conjunto de células, Wilson y McNaughton pudieron decodificar la posición de la
rata durante el comportamiento a partir de su conjunto neuronal. (Véase el Apéndice B para una descripción
de cómo funciona este proceso de decodificación). A partir de un gran conjunto neuronal, también se puede
determinar si los patrones observados durante el comportamiento se repiten (reactivan) posteriormente
101
durante el sueño. A partir de un
gran conjunto neuronal, se puede incluso determinar si las secuencias observadas durante el comportamiento
Machine Translated by Google
repetir (replay) después durante el sueño. Una serie de estudios realizados en los años posteriores, a partir
del artículo de seguimiento de Wilson y McNaughton en 1994 y que culminó en docenas de artículos en la
última década, han demostrado que lo que se reactiva es en realidad el patrón neuronal completo: las células
que fueron coactivas durante la conducta siguen siendo coactivas durante la reactivación, mientras que las
células que no fueron coactivas no lo son, y que lo que se reproduce son las secuencias reales observadas
por la rata: las células se reactivan en el mismo orden durante el sueño que durante la conducta. 102 Los
estudios de control han demostrado que esta reactivación es una consecuencia de la conducta: no ocurre
durante el sueño antes de la conducta, solo después.
La reactivación y la repetición también se observan en los sistemas neocorticales durante el sueño. Al
igual que con la reactivación y la repetición del hipocampo, los mismos patrones neuronales observados
durante la conducta aparecen después durante el sueño. La reactivación y la repetición se han observado
en una serie de sistemas corticales, incluidos la corteza prefrontal, parietal e incluso la corteza visual
primaria. 103;J
En este punto, se desconoce la función computacional y neurofisiológica de la repetición. 106 ¿Es para
ayudar al almacenamiento de información dentro de la estructura misma (hipocampo o corteza)? 107 ¿Es para
transferir información desde el sistema episódico basado en el hipocampo? ¿Es para borrar viejos recuerdos
108
¿Tem al sistema semántico de base cortical? ¿pocampus de la cadera?
mientras mejora otros nuevos? 109 Aunque los investigadores todavía están abordando estas
cuestiones hoy en día, tenemos pistas intrigantes de que todas estas funciones pueden ser importantes. Lo
que se sabe es que el bloqueo de la repetición, ya sea farmacológicamente (a través de medios químicos) o
eléctricamente (estimulando el hipocampo cada vez que un evento de repetición está a punto de suceder ),
111
También se sabe quealtera
los eventos
la retención
de repetición
de la memoria.
en el hipocampo tienden a corresponder a eventos de
reactivación en las estructuras corticales, y que después de los eventos de repetición, los patrones neuronales
en las estructuras corticales se acoplan más estrechamente, incluso entre estructuras corticales, exactamente
como se predeciría por la transferencia e integración
112
hipótesis de gración.
A lo largo de esta discusión, he evitado llamar a estos eventos de repetición "sueños", porque no sabemos
si estos eventos de repetición vistos en animales corresponden a lo que experimentamos como sueños. (No
podemos preguntarle al animal si está soñando, y es muy difícil registrarlo en humanos durante los sueños).
Pero, por supuesto, es muy probable que este fenómeno de reactivación/reproducción que se está estudiando
en animales sea la instanciación física del fenómeno al que nos referimos como sueños. Los sueños a
menudo son secuencias desordenadas Aunque los experimentos con animales informan de la repetición real
113
de experiencias pasadas. de
La repetición en estructuras subcorticales no hipocampales, como el sistema dorsal en los ganglios basales (Capítulo 10), aún no ha sido reportada, pero no ha
habido el mismo nivel de estudio extenso realizado en estas estructuras durante el sueño. La única excepción es que el cuerpo estriado ventral (el núcleo accumbens,
que vimos que estaba involucrado en la representación de resultados potenciales durante la deliberación; ver Capítulo 9), repite la actividad relacionada con la
recompensa junto con la repetición hipocampal de lo experimentado. El sueño también es crítico para el aprendizaje procedimental, pero aún se desconoce si esto se
K
Los eventos de repetición en el hipocampo tienden a ocurrir durante un evento de potencial de campo local (LFP)
identificable llamado ondulación u onda aguda (a veces llamado "complejo de onda agudaondulación") que se puede observar
en el hipocampo. Debido a que estos eventos de LFP se pueden detectar rápidamente, se pueden interrumpir tan pronto como se detecten.
110
tan pronto como comienzan a través de una breve estimulación eléctrica del hipocampo.
Machine Translated by Google
En parte, esto puede deberse a que esas secuencias son las más fáciles de reconocer. Algunos
experimentos han encontrado representaciones intercaladas de experiencias antiguas y nuevas en ratas
114
durante el sueño REM. Durante el comportamiento despierto y en reposo, experimentos recientes
han encontrado “repeticiones” de secuencias que el animal nunca ha experimentado realmente, como la
secuencia experimentada por el animal pero al revés, o cadenas de secuencias experimentadas que
comparten puntos en común pero que en realidad no se han experimentado juntas.
115
En un experimento muy intrigante, Robert Stickgold y sus colegas entrenaron a una población...
116
ción de pacientes con amnesia hipocampal (como HM) para jugar al videojuego Tetris.
Estos pacientes pueden aprender tareas utilizando su memoria no hipocampal, pero no recuerdan que ya
han jugado al juego antes. Cuando Stickgold y sus colegas despertaron a estas personas y les preguntaron
sobre sus sueños, dijeron que vieron formas extrañas cayendo del cielo, pero estaban aterrorizados porque
no tenían idea de dónde provenían esas formas. Parece probable que la corteza estuviera reproduciendo
los estímulos sensoriales que había visto (formas que caían), pero que, sin un hipocampo, estos pacientes
no podían integrar estos eventos en sus recuerdos episódicos ni recordar de dónde provenían esas
imágenes.
Resumen
De modo que, incluso después de sufrir lesiones, los animales (incluidos los humanos) pueden aprender
nuevas tareas, pero estas nuevas tareas se aprenden de maneras diferentes, utilizando sistemas de toma
de decisiones diferentes. De modo similar, las estructuras corticales intactas pueden reemplazar a las
estructuras corticales dañadas, pero sólo en la medida en que estén disponibles las conexiones de entrada.
Y los recuerdos pueden transferirse de las estructuras episódicas dependientes del hipocampo a los
procesos semánticos dependientes de la corteza, pero se modifican en esa transición. El cerebro es una
máquina física. La mente no es un software que se implementa por casualidad en el hardware del cerebro,
sino que depende directamente de los procesos del cerebro físico.
Antes se pensaba que la mente era como un excursionista en un bosque, o un surfista en una ola, o tal
vez como la ola misma fluyendo a través de un océano físico, o como algo afectado por el cerebro mismo
pero separado de él. 117 Históricamente, esta separación se basaba en En la cognición moderna
El dualismo de Descartes entre las entidades físicas y cognitivas. En la 118
ciencia creativa del siglo pasado, esta separación se basó en las nuevas teorías de la información
digital. 119
Sin embargo, como hemos visto en este capítulo, la teoría de que la mente y el cerebro son separables
es insostenible y los datos disponibles sugieren, en cambio, que son la misma cosa.
La evidencia de que la actividad mental es el procesamiento de información es abrumadora, pero los
diferentes componentes del cerebro procesan esa información de manera diferente. No es una ola que
fluye a través de un océano abierto, capaz de viajar en cualquier dirección, sino más bien una ola que viaja
a través de una serie de cañones altamente restrictivos. Esto tiene implicaciones para todos los aspectos
de nuestra vida mental, desde procesos mentales como la imaginación hasta enfermedades y trastornos
mentales como la enfermedad de Parkinson, la enfermedad de Alzheimer, el trastorno de estrés
postraumático y la adicción, pasando por construcciones mentales de comportamiento como el ansia, la
impulsividad, el libre albedrío y la moralidad.
Machine Translated by Google
17
Imaginación
de las neuronas.
Es decir, tal como sabemos que el disparo de las neuronas sensoriales responde a
señales sensoriales, y el disparo de las neuronas motoras controla los músculos, esta
teoría predice que los eventos mentales (cognitivos) no sensoriales no sólo se reflejan
en el disparo de las neuronas, sino que en realidad son el disparo de las mismas.
El hecho de que la corteza se pueda entender mejor como una lámina bidimensional de columnas repetidas en lugar de
como una estructura tridimensional sugiere que podemos pensar en la corteza como una serie de mapas interconectados.
Las estructuras visuales mapean el campo visual que tienes frente a ti, las estructuras auditivas mapean los tonos y sonidos,
En los mamíferos (incluido el ser humano), la corteza visual primaria se encuentra en la parte posterior del cerebro. Los
axones que conectan los ojos con la corteza visual tienen que recorrer todo el cerebro (pasan por debajo), por lo que una
conmoción cerebral (en la que el cerebro se golpea contra el cráneo como un objeto sin restricciones en un coche que se
detiene de repente) suele provocar problemas visuales. Descubrieron que, en su mayor parte, las células de cada columna
2
cortical visual están sintonizadas con el mismo Registros de neuronas de la corteza visual primaria
punto de la retina. Algunas de estas células están sintonizadas con puntos de la retina, mientras que otras están sintonizadas
con líneas orientadas y otras están sintonizadas con líneas orientadas en movimiento. Algunas se excitan con la luz en el
lugar, mientras que otras se inhiben. Pero cada columna de la corteza visual primaria está sintonizada con la luz que llega
a un punto de la retina.
3
La conectividad en la corteza se basa en una arquitectura de centroenvolvente, en la que las células que representan
ubicaciones similares en la retina están acopladas de manera más estrecha que las células que representan ubicaciones
161
Machine Translated by Google
conexiones más espaciadas que tienen efectos sutiles (serán particularmente importantes cuando
discutamos las migrañas y la alucinación de fortificación), pero la conectividad primaria parece
ser entre columnas adyacentes que representan información similar. 4 En el
nivel más simple, la corteza puede considerarse como una capa de excitación local e inhibición
más amplia. Esta conectividad produce lo que se conoce matemáticamente como un núcleo de ,
acoplamiento local , una conectividad que se repite en cada ubicación. 5 Estos núcleos de
acoplamiento también se observan en objetos físicos, como la relación entre las espiras de un
resorte o la conectividad física de una cuerda de guitarra (en una dimensión), la conectividad física
de una sábana (en dos dimensiones) o la relación entre moléculas de agua (en tres dimensiones).
Estos son tres ejemplos particularmente interesantes porque todos muestran efectos de ondas.
Todos hemos visto ondas en el agua y todos hemos aplastado una sábana para enviar una onda a
través de ella; un experimento clásico de física de secundaria consiste en tomar un resorte y enviar
una onda viajera a través de él. Y, por supuesto, el sonido generado por una cuerda de guitarra se
basa en una onda estacionaria, ya que vibra en las condiciones restringidas (denominadas
matemáticamente condiciones límite ) en las que los dos extremos se mantienen fijos y no se pueden
mover. Así como las ondas pueden viajar a través de los objetos físicos, también las ondas de actividad
neuronal pueden viajar a través de la capa cortical. 6
La razón de esto es que la corteza visual primaria en los primates (incluidos los humanos) no
representa la información retiniana con una transformación uno a uno. En cambio, hay más
representación del centro de la retina (un área llamada fóvea) y menos representación de la
periferia. La descripción matemática específica de esta
transformación se llama transformación logpolar . Piense en su corteza visual como dos
rectángulos pegados en la parte posterior de su cerebro, uno al lado del otro. Cada lado de su
corteza visual representa la mitad de su campo visual. Las células de la fóvea se proyectan (a
través de una estructura talámica intermedia que realiza un procesamiento adicional , llamada
núcleo geniculado lateral) a las células de la corteza visual cerca de la línea media, mientras que
las células de la periferia se proyectan (de nuevo a través de estructuras intermedias) a las células
de la corteza visual más lateralmente. Moverse a lo largo del eje horizontal de la corteza visual
equivale a moverse fuera de la fóvea. Así como hay más células en la fóvea que en la periferia,
hay más corteza visual dedicada a la fóvea que a la periferia. De manera similar, moverse a lo
largo del eje vertical equivale a moverse en un círculo alrededor de la fóvea, con la parte superior
de su corteza visual correspondiente a la parte superior de su campo visual.
Esto significa que una onda que estaba perfectamente alineada con el eje vertical de la corteza
visual, que comenzaba en la línea media y se alejaba de ella, aparecería como un anillo en
expansión. Debido a que cada vez más campo visual está representado por la
A
En la retina también se lleva a cabo una gran parte del procesamiento. Sin embargo, este libro no trata de
cómo procesa el cerebro la información sensorial, por lo que no entraré en detalles, pero un buen recurso para
quien esté interesado es el reciente libro de texto de Chaudhuri.
Machine Translated by Google
Imaginación 163
área del mismo tamaño de la corteza a medida que uno se mueve hacia la periferia, una onda viajera que
se mueve a una velocidad constante en la superficie cortical parecería acelerarse a medida que viaja hacia
la periferia.
Las alucinaciones visuales simples se observan a menudo al quedarse dormido y al despertarse, bajo
ciertas luces parpadeantes y en habitaciones oscuras y selladas. También se observan bajo la influencia
de ciertas sustancias químicas recreativas (drogas). Estas alucinaciones visuales simples son muy similares
a las que se pintan y se graban en piedras sagradas y paredes de cuevas. La gente ha estado reportando
sus alucinaciones inducidas por sustancias químicas durante miles de años. También son los mismos
9
patrones que se observan a menudo en las experiencias "cercanas a la muerte".
Estas imágenes tienden a estar formadas por líneas radiales, espirales y formas de telaraña. A menudo
aparecen como tableros de ajedrez en espiral, panales o puntos. Y a veces son tan simples como una luz
blanca en el centro de la visión. A veces las imágenes son estables y otras veces se mueven en un patrón
espiral hacia adentro o hacia afuera. Las imágenes se mueven con la retina (y por lo tanto se ven en el
"espacio retiniano", lo que es particularmente extraño de experimentar porque estamos acostumbrados a
ver cosas en el espacio "alocéntrico" o del mundo real, que se mueve en nuestra retina cuando movemos
nuestros ojos). Estas imágenes son la interpretación visual de
ondas en la corteza.
Una onda vertical que fluye de arriba hacia abajo a lo largo de la corteza visual aparecerá como líneas
radiales rotatorias. Una onda que colapsa y fluye desde los aspectos lateral a medial aparecerá como una
luz que colapsa y puede interpretarse fácilmente como un túnel. Una onda que está orientada diagonalmente
a lo largo de la corteza visual aparecerá como una espiral. A medida que la onda se mueve, la espiral
puede parecer que se mueve hacia adentro o hacia afuera. Véase la Figura 17.1.
La corteza visual primaria del primate está en realidad conectada de una manera más compleja que
un simple núcleo centroentorno. 10 Las columnas corticales están organizadas en hipercolumnas locales,
que representan una única ubicación en el campo visual, pero contienen células selectivas de orientación,
que responden a líneas orientadas de diferentes maneras.
Una hipercolumna contiene columnas de celdas que representan cada orientación potencial. Cada columna
está acoplada a celdas dentro de su propia hipercolumna (porque representan la misma ubicación en el
campo visual) y a columnas cercanas en otras hipercolumnas que comparten su orientación preferida
(porque representan líneas de la misma orientación).
Las conexiones entre hipercolumnas parecen estar dispuestas en una cuadrícula aproximadamente
hexagonal. Es la cuadrícula hexagonal a través de las hipercolumnas la que produce los componentes de
tablero de ajedrez o panal de abeja de algunas alucinaciones visuales.
El sistema visual de los primates (incluido el ser humano) es muy complejo e incluye una serie de áreas
corticales separadas, cada una de las cuales está dedicada a una característica útil diferente, como colores,
ubicaciones espaciales en el mundo visual e incluso caras, habitaciones y otros objetos dedicados. conjunto
11
de detectores de Las teorías actuales sugieren que esta compleja red de campos visuales es una
características separados y dedicados, ajustados al conjunto de imágenes naturales que experimentamos
en nuestras vidas.
Es probable que las alucinaciones de eventos y objetos más complejos dependan de la activación de
otras cortezas, como las que representan objetos, rostros, lugares y otras sensaciones. Sin embargo, como
no sabemos cómo se codifican estas representaciones de orden superior, no sabemos cómo aparecerían
las ondas en ellas. La activación aleatoria de la corteza visual también se observa en condiciones de
alucinación, que aparecen como pequeños puntos de color en el campo visual (de nuevo, que siguen a la
retina a medida que se mueve). 12 Así como la activación de la corteza visual primariase percibe como
visión, la activación aleatoria de las neuronas en la corteza visual primaria se percibe como visión.
Machine Translated by Google
Patrón en Visual
corteza visual percepción
Figura 17.1 Transformación logpolar en la corteza visual de los primates. Los patrones de la corteza visual
(líneas horizontales, líneas verticales, líneas diagonales) se transforman en percepciones retinianas (líneas
radiales, círculos concéntricos, una espiral) debido a la transformación logpolar de la retina a la corteza visual. Se
observan patrones similares durante la privación sensorial, las alucinaciones inducidas por drogas y las
experiencias cercanas a la muerte. También aparecen patrones similares dibujados en petroglifos antiguos.
área de representación facial (una pequeña parte dedicada de la corteza llamada surco temporal superior o STS)
13 se percibiría como si estuviera viendo a una persona específica.
Una de las alucinaciones visuales mejor descritas ocurre durante las migrañas y se describe como la alucinación
de “fortificación” o “aura visual”. 14 Generalmente, estas se experimentan como bordes dentados extremadamente
brillantes, que progresan lentamente a través del campo visual, seguidos por un escotoma visual o negrura, que
oscurece la visión. Curiosamente, la línea de bordes dentados se acelera a medida que avanza desde el centro de
la visión hasta el borde, en el transcurso de 10 a 20 minutos. En este punto, es posible que pueda adivinar por qué
el borde dentado se acelera a medida que avanza desde el centro hacia la periferia de la visión.
Estas auras de “fortificación” se pueden explicar directamente como la activación de las células en la corteza
15 corteza. visual. Como se señaló anteriormente, las células de la corteza visual representan la información visual
al estar sintonizadas con líneas cortas y orientadas. Las diferentes orientaciones dentro de una hipercolumna
están conectadas entre sí. Por lo tanto, si gran parte de una hipercolumna estuviera activa, aparecería como un conjunto
Machine Translated by Google
Imaginación 165
de líneas angulares, en orientaciones agudas entre sí. Debido a que las columnas están conectadas
a través de hipercolumnas, se ve una pared hexagonal continua. A medida que la onda progresa
desde el borde medial (el centro de la visión) hasta el borde lateral (la periferia de la visión), la pared
parece moverse. Es excepcionalmente brillante porque todas las células están disparando a medida
que la onda avanza a través de ellas. El disparo consume recursos celulares y las células se vuelven
incapaces de disparar (se vuelven refractarias ) después. 16 La incapacidad de las células para
disparar detrás de la onda aparece como una oscuridad en blanco o un escotoma. La onda parece
acelerarse porque nuestra corteza representa el centro de nuestro campo visual con más área cortical
que la periferia. Por lo tanto, una onda de velocidad constante en la corteza visual cubre cada vez más
nuestro campo visual a medida que progresa lateralmente y parece acelerarse a medida que se mueve.
El término “fortificación” es una alusión a Santa Hildegarda von Bingen, una monja del siglo XII
que vivía en Alemania y que dejó descripciones de visiones de luces más brillantes que el sol que
avanzaban a través de su visión y que se convertían en carbones negros, de visiones de un fuego de
Dios que se extendía, seguido de una oscuridad lúgubre, que dejaba estrellas etéreas detrás, y de
visiones de una cabeza de fuego que azotaba la oscuridad. 17 Varios autores del siglo XX han
18 Los bordes dentados de la ilusión
sugerido que las visiones de Santa Hildegarda eran auras de migraña.
de la fortificación, de hecho, parecen almenas y murallas que podrían verse en lo alto de un castillo
medieval. A menudo son muy brillantes (al ser el disparo de muchas células simultáneamente) y
seguidas de una oscuridad (cuando las células se apagan y se vuelven refractarias, se cansan y se
vuelven incapaces de disparar), lo que oscurece la visión (porque la visión es el disparo de células
específicas; qué subconjunto de células dispara es la información sobre lo que se ve: si todas las
células están en silencio, uno ve solo oscuridad). La figura 17.2 muestra una representación moderna
de la ilusión de la fortificación. Hildegard describió explícitamente que las visiones ocurrieron durante
la vigilia normal, no durante el sueño o los trances, y que no podía ver la longitud o la anchura de
estas visiones (presumiblemente porque las imágenes estaban en su corteza visual, por lo que se
movían con su visión cuando movía los ojos). Uno puede imaginar fácilmente la
(a)
(b)
Figura 17.2 Ilusiones de fortificación en migrañas. (a) Los pacientes con migraña ven zigzags
centelleantes seguidos de oscuridad. Un paciente con migraña observó una pantalla parpadeante
y dibujó lo que vio. (b) Se le pidió al sujeto que se concentrara en un solo punto y dibujara los
bordes de estas fortificaciones en una hoja de papel a intervalos de 2 minutos. Los resultados
revelan que las fortificaciones se expanden hacia afuera a velocidades cada vez mayores. De
Grüsser (1995), reimpreso con permiso del editor.
Machine Translated by Google
efecto sobre una mujer joven en el siglo XII de una inexplicable línea irregular y brillante que conducía a un
área de oscuridad que se expandía a través de su visión, especialmente una que continuaba ya sea que sus
ojos estuvieran abiertos o cerrados, de la que no podía apartar la mirada, y que estaba acompañada por un
dolor de cabeza ardiente e ineludible.
Imaginación
Si las ondas en la corteza y el funcionamiento aleatorio de las células producen alucinaciones y la ilusión de
ver cosas que no existen, ¿qué sucede en la otra dirección? Cuando imaginamos algo, ¿es también un
proceso físico? Esto se ha estudiado más a fondo a través de la imaginería visual, en la que se pide a las
19
personas que imaginen una imagen visual.
El primer estudio que abordó directamente esta cuestión fue un examen de la capacidad de rotar
mentalmente imágenes en la mente. En un experimento que ahora es clásico, Roger Shepherd y Jacqueline
Metzler pidieron a los sujetos que determinaran si dos imágenes de objetos tridimensionales eran imágenes
del mismo objeto rotado en el espacio o si eran objetos diferentes.
20 Lo que descubrieron fue que el tiempo que tardaba una
persona en determinar si los dos objetos estaban relacionados era una función lineal del ángulo de rotación
entre los dos objetos. De esto concluyeron que las personas estaban rotando mentalmente los objetos (a una
velocidad de unos 60 grados por segundo). Por supuesto, cuando miramos los dos objetos e intentamos
compararlos, tenemos la sensación subjetiva de que los estamos rotando mentalmente (¡al menos yo la
tengo!). Estas rotaciones parecen activar las estructuras visuales y motoras, como si las personas estuvieran
imaginando rotar los objetos manualmente.
Siguiendo este trabajo, Stephen Kosslyn y sus colegas comenzaron a probar la psicofísica B de las
imágenes mentales. 21 Si le pido que imagine un barco pirata y luego hable sobre la proa
del barco (¿Qué es la figura de proa del barco?), responderá más rápido a las preguntas sobre la proa que
sobre la popa (¿Cuántos cañones apuntan hacia atrás?). De alguna manera, las distancias importan en la
imaginería mental. Estas representaciones visuales han sido validadas por los resultados de fMRI que han
demostrado que la imaginería mental activa las áreas sensoriales apropiadas del cerebro: la imaginería mental
visual implica actividad en las cortezas visuales y la imaginería mental auditiva implica actividad en las cortezas
auditivas, etc.
Por supuesto, el cerebro no se compone únicamente de cortezas sensoriales primarias. La gente normal
sabe distinguir entre imaginar un barco y verlo. Esto significa que en algún lugar del cerebro (probablemente
en la corteza frontal) se activan otras neuronas que los diferencian. Una teoría sobre las alucinaciones es que
éstas implican la creación de imágenes mentales sin que esas otras neuronas digan: “Esto es solo tu
imaginación, no es real”. 22
Un ejemplo particularmente interesante de este tipo de imágenes mentales ha capturado la imaginación
de la neurociencia y la psicología recientemente: las neuronas de control motor en las cortezas premotoras de
los monos (las cortezas de planificación relacionadas con el motor 23 ) muestranuna actividad similar ya sea
que el animal esté realizando el movimiento por sí mismo o esté viendo a otro primate realizar el movimiento.
24 Estas neuronas han sido llamadas neuronas “espejo”; sin
embargo, no está claro en este momento si son un tipo especial de representación en la corteza
de los primates o si simplemente reflejan la imaginación del animal de la
las acciones del otro en sus propias neuronas de control motor.25
B
La psicofísica es el estudio de la sincronización de las respuestas perceptivas.
Machine Translated by Google
Imaginación 167
neuronas ya las analizamos en el Capítulo 14, donde las analizamos en términos de nuestra capacidad de
empatizar y simpatizar con los demás.
La imaginería mental es la activación de neuronas en el cerebro. Esto significa que podríamos ser capaces
de identificar un proceso cognitivo encubierto si registramos suficientes neuronas e identificamos
26
manipulaciones de una variable encubierta.
El primer estudio que hizo esto fue realizado en la década de 1980 por Apostolos Georgopoulos y su
27
Georgopoulos y sus colegas entrenaron a un mono para que alcanzara Inicialmente, los monos eran
un objetivo. Lo entrenaron para tocar una luz central y sostenerla hasta que la luz, En ese momento uno de
se apagara, y ocho luces circundantes se encendían. El mono simplemente tenía que alcanzar una de las
luces circundantes para obtener un jugo como recompensa. Lo que Georgopoulos y sus colegas descubrieron
fue que las neuronas en la corteza motora primaria estaban sintonizadas con la dirección en la que el animal
alcanzaba el objetivo y que, a partir de un gran conjunto de neuronas (miles de C ), podían decodificar la
dirección en la que el animal alcanzaba el objetivo (o estaba a punto de alcanzarlo). 29 Luego entrenaron al
mono para que alcanzara el objetivo no hacia la luz encendida en el círculo exterior, sino en un giro de 90
grados en sentido contrario a las agujas del reloj. Cuando decodificaron las neuronas, descubrieron que el
conjunto originalmente se decodificó para representar la dirección de la luz encendida y rotó (a través de
las direcciones intermedias) hacia la dirección en la que el animal iba a alcanzar el objetivo antes de que el
30 El animal rotaba mentalmente la dirección de alcance desde el
animal realmente comenzara su movimiento.
D
objetivo hasta la señal. De hecho, la velocidad de esa rotación mental en la corteza
motora del mono coincidió con la velocidad de rotación mental encontrada en el estudio clásico de
Shepherd y Metzler en humanos dos décadas antes, en el que los humanos hacían coincidir
imágenes de bloques tridimensionales.
Si es posible decodificar información cognitiva e imaginaria encubierta de conjuntos neuronales, entonces
debería ser posible registrar la actividad neuronal del cerebro, pedir a los sujetos que imaginen mover sus
brazos, decodificar la actividad neuronal de cómo quieren que se muevan sus brazos y mover brazos
robóticos para que coincidan. Esta es la promesa del cerebro...
Las interfaces de las máquinas parecen ciencia ficción, pero ya son una realidad en condiciones
limitadas. 32
Usando las mismas áreas motoras sintonizadas que Apostolos Georgopoulos registró dos décadas
antes, Andy Schwartz (entonces en la Universidad Estatal de Arizona, ahora en la Universidad de Pittsburgh)
entrenó a un mono para rastrear una pelota en una realidad virtual tridimensional. Usando gafas
33
espacio. especialmente diseñadas, el mono vio dos pelotas: una pelota amarilla
do
En aquella época, sólo se podía registrar una neurona a la vez. Georgopoulos y sus colegas entrenaron
al mono tan bien que cada movimiento desde el centro hacia afuera era casi exactamente el mismo.
Registraron una o dos neuronas por día y luego combinaron todos los recorridos que el mono hizo a lo largo
de varios años para crear un “pseudoconjunto” de miles de neuronas. Sus experimentos se han replicado
más recientemente utilizando conjuntos más pequeños (docenas) de neuronas registradas simultáneamente,
28
pero las conclusiones no han cambiado.
D Esta rotación mental del mono entre la reacción inmediata de alcanzar la señal y la corrección posterior
para alcanzar el objeto 90 grados fuera de ella es un caso especial del problema que analizamos en el
31
Capítulo 10: que el cerebro primero planifica la reacción rápida y obvia pero puede corregirla si se le da tiempo.
Machine Translated by Google
que aparecía en un punto aleatorio en el espacio tridimensional, y una bola azul que controlaba. Si podía
hacer que la bola azul atrapara a la amarilla, obtendría una recompensa de jugo. El secreto (para el que
el mono nunca fue entrenado explícitamente) era que el movimiento de la bola azul no se basaba en el
movimiento de la mano del mono, sino en la información decodificada del cerebro del mono. Cuando
presentaba sus datos, Andy Schwartz solía mostrar un video en el que el mono inicialmente seguía la
bola virtual con sus manos, pero luego, cuando se dio cuenta de que el seguimiento se movía más rápido
que sus manos, bajó las manos a los lados y continuó siguiendo la bola usando solo su mente. Por
razones obvias, este video fue referido cariñosamente en la comunidad de neurociencia como el "video
del mono Jedi".
Más recientemente, se ha hecho posible decodificar esta información imaginaria para mover brazos
robóticos, no sólo en monos sino también en humanos. 34 El trabajo en este sentido ha sido lento porque
requirió dos avances separados para funcionar: desde la neurociencia, requirió algoritmos de
decodificación que pudieran identificar lo que se suponía que debía hacer el brazo, y desde la robótica,
requirió brazos robóticos confiables que pudieran ser controlados con suficiente precisión y simplicidad.
Pero ambos avances se han logrado y varios laboratorios ahora han impulsado brazos robóticos a partir
de imágenes mentales. En 2008, un mono en el laboratorio de Andy Schwartz pudo alimentarse usando
35
un brazo robótico. El laboratorio de John
Donoghue ha demostrado que los pacientes tetrapléjicos (que están paralizados del cuello hacia abajo)
pueden guiar manos robóticas para que se muevan y se abran y cierren. 36 En uno de los vídeos que
John Donoghue muestra en sus presentaciones, uno de los pacientes, al observar cómo el brazo robótico
agarra una lata de refresco y la levanta bajo el control de su propia imaginación mental, mira fijamente la
mano robótica, que se mueve con sus pensamientos, y dice, claramente asombrado, “Guau”.
Manipulación cerebral
El concepto de una separación entre cerebro y mente (dualismo) todavía puede sobrevivir a la observación de
que las imágenes mentales se reflejan en la activación neuronal, porque podría ser que el cerebro sólo refleje
lo que está sucediendo en la mente. La verdadera prueba de si la mente corresponde verdaderamente a la
activación neuronal en el cerebro es si las manipulaciones de esa activación cambian las experiencias. De
hecho, a nivel sensorial, esta tecnología es tan exitosa que a menudo no nos damos cuenta de que existe. El
implante coclear, una tecnología implantada en cientos de miles de pacientes, estimula las neuronas sensoriales
en el oído para traducir las señales auditivas de un micrófono directamente al cerebro. 37 Los estimuladores de
retina que traducen imágenes de vídeo en señales sensoriales en la retina están actualmente en ensayos
clínicos de fase II. 38 Sin embargo, la estimulación clínica del cerebro profundo más allá de las cortezas
sensoriales se ha limitado a formas de onda y frecuencias simples sin información. La principal estimulación
clínica de las estructuras no sensoriales ha sido un procedimiento llamado estimulación cerebral profunda, que
actualmente es un tratamiento común para la enfermedad de Parkinson. 39 Aunque todavía se desconoce el
mecanismo por el que funciona, la estimulación de los ganglios basales a frecuencias bajas (menos de unos
pocos cientos de ciclos por segundo) a menudo rehabilita el movimiento en pacientes acinéticos (pacientes que
no pueden moverse). Algunos investigadores creen que esta estimulación apaga efectivamente las estructuras
de los ganglios basales, produciendo un efecto similar a una lesión, permitiendo que otros sistemas de toma de
decisiones tomen el control. Otros investigadores creen que la estimulación de los ganglios basales a
frecuencias bajas (menos de unos pocos cientos de ciclos por segundo) permite que los pacientes acinéticos (pacientes que
Machine Translated by Google
Imaginación 169
Los ganglios necesitan trabajar a un ritmo determinado, y la estimulación les permite volver a ese ritmo.
La estimulación cerebral profunda dirigida a otras áreas se está probando ahora para otros trastornos
41 (como la epilepsia y la depresión), pero la mayoría de estos experimentos son bastante a ciegas:
nadie sabe por qué funcionan cuando lo hacen o por qué no lo hacen cuando no lo hacen.
E Hay algunas pruebas, por ejemplo, de que dar a algunos de estos pacientes un ritmo con el que trabajar (por
ejemplo, a través de la música) puede renormalizar el movimiento. A veces, la presencia de señales visuales es
suficiente para reactivar el movimiento. Por ejemplo, colocar un palo en el camino de un paciente puede obligarlo a
pasar por encima del palo y comenzar a caminar de nuevo. Esto se muestra muy bien en la película Awakenings ,
en la que el médico hace pintar el suelo con cuadrados blancos y negros, lo que permite a la paciente, "Rose",
caminar hasta la ventana. 40
F El cerebro no tiene sensores internos locales de dolor, por lo que es posible utilizar anestesia local para
silenciar los sensores en la piel y luego manipular el cerebro del paciente, mientras el paciente está despierto y en la
mesa. He visto que esto se hace durante una cirugía de estimulación cerebral profunda en la que se implantaron
electrodos de estimulación cerebral profunda. El paciente estaba tranquilo y cómodo y conversó con los médicos
mientras implantaban los electrodos en su cerebro. La mayoría de las cirugías de lesiones (por ejemplo, para la
epilepsia) se realizan en pacientes despiertos, de modo que los cirujanos puedan determinar el papel de las
estructuras que están eliminando para asegurarse de que no eliminan nada crítico (para evitar la tragedia de la HM).
Machine Translated by Google
18
Adicción
La adicción es el trastorno clásico de la toma de decisiones: un adicto continúa tomando drogas incluso ante
consecuencias negativas masivas y, a veces, incluso en el caso de un deseo declarado de dejarlas.
1
¿Cómo puede un adicto manifestar que quiere dejar de tomar drogas y, sin embargo,
seguir tomándolas? Como hemos visto, la toma de decisiones humana surge de una compleja interacción de
componentes. Lo que veremos en este capítulo es que este complejo conjunto de sistemas de toma de decisiones
que interactúan entre sí, esta maquinaria de toma de decisiones, puede fallar de muchas maneras diferentes. Si
bien cada una de estas diferentes vulnerabilidades puede producir diferencias sutiles en la forma en que actúa el
adicto ( ¿el adicto anhela la droga antes de tomarla? ¿El adicto toma sólo una droga o cualquier droga es suficiente?
¿El adicto busca el placer o evita la disforia? ), todas se reducen al mismo problema: el adicto continúa con la
conducta, aunque debería dejarla.
¿Qué es la adicción?
171
Machine Translated by Google
Imaginemos una consecuencia más negativa que esa. Más problemático aún es el caso de muchos casos en los
que celebramos la decisión de un individuo que tuvo consecuencias negativas graves, como un soldado que
defendió a su país o un bombero que arriesgó su vida en un edificio en llamas. Celebramos a Martin Luther King,
que luchó por los derechos civiles sabiendo perfectamente que era probable que acabara con su muerte. Sin
embargo, a veces esta visión conduce a perspectivas interesantes. El poeta ruso Osip Mandelstam siguió
escribiendo poesía incluso después de que lo enviaran al gulag soviético por ello.
3 El futuro mariscal de campo del
Salón de la Fama, Brett Favre, continuó jugando al fútbol mucho después de que muchos sugirieran que parara,
a pesar de las graves lesiones y un cuerpo envejecido que era mucho menos resistente al castigo de lo que
había sido. 4 ¿Deberíamos decir que Mandelstam era adicto a escribir poesía o que Favre era adicto al fútbol?
Otras definiciones de adicción se han basado en la presencia de una desconexión5 ( “Quiero dejar de
Entre los deseos declarados y las acciones hacerlo, pero no puedo”). Por supuesto, esta definición implica que
los animales (que no pueden expresar tal deseo incluso si lo sienten) no pueden ser definidos como adictos.
Dado que los animales se autoadministran de manera confiable las mismas sustancias farmacológicas que los
ante las consecuencias negativas, esta definición parece problemática. Otro problema con humanos, incluso
la definición de adicción como una desconexión verbal es que muchos de nosotros conocemos adictos que no
expresan un deseo de dejar su adicción, que se niegan a admitir su “problema”. Muchas camarillas de la escuela
secundaria han tenido que intervenir por un amigo con un problema de drogas o alcohol, y hay muchas personas
vivas hoy en día porque sus amigos intervinieron con esa misma intervención.
Algunos economistas han sugerido que la adicción se debe definir por la elasticidad de la decisión. Como
se analizó en el Capítulo 3, la elasticidad se define por cuánto cambia la decisión de comprar algo en respuesta
a los cambios en el precio. A medida que la economía empeora, la gente tiende a ir al cine o a cenar con menos
frecuencia. Estos artículos de lujo son muy elásticos. Por otro lado, la gente sigue comprando alimentos, incluso
a precios altos, por lo que las compras de alimentos son muy inelásticas. La adicción puede definirse entonces
como una inelasticidad “irracional”.
7
Como se señala en el Capítulo 3, esto permite a los economistas decir que los estadounidenses
“Adicto al petróleo” 8 seguimos utilizándolo y usándolo imprudentemente (conduciendo automóviles individuales
en lugar de tomar el transporte público más eficiente; dependiendo de él para la electricidad y la calefacción en
lugar de usar sistemas que no utilicen combustibles fósiles o tomándonos el tiempo para asegurar que nuestras
casas sean energéticamente eficientes), incluso frente a graves consecuencias negativas (grandes derrames de
petróleo, precios altos y guerras innecesarias).
A como el
Es importante señalar que las drogas (como el petróleo) son, de hecho, objetos económicos; el
precio de las drogas aumenta, su uso disminuye, incluso entre los adictos más dedicados y fisiológicamente
dependientes. 10 El número de personas que dejan de fumar, por ejemplo, es directamente proporcional al costo
de los cigarrillos. De manera similar, los estudios sobre los cambios en los precios de la heroína o la cocaína
(recordemos que el mercado negro sigue siendo un mercado) concluyen que los aumentos en los precios
conducen a cambios directos en el número de usuarios y la cantidad de uso. Esta elasticidad es la razón por la
que una de las mejores maneras de disminuir el uso de drogas legales (nicotina, alcohol y, en el futuro cercano,
marihuana) es tener “impuestos al pecado”, que aumentan el precio de la droga.
Esta elasticidad es también uno de los mejores argumentos contra la legalización de drogas más duras
(heroína, cocaína, metanfetamina). El argumento a favor o en contra de la legalización es
A El término técnico es “bien económico” 9 porque uno compra “bienes y servicios”, pero eso llevaría
a la desafortunada frase “Las drogas son, de hecho, un bien económico…”
Machine Translated by Google
Adicción 173
Es muy complicado. Por un lado, las consecuencias negativas de ser descubierto con drogas son un costo
que disminuye el consumo. Por ejemplo, los estudios sobre la cantidad de opio consumido en Taiwán durante
las medidas represivas chinas en la década de 1920 encuentran una relación elástica directa. Por otro lado,
11
entre la severidad del castigo y el uso inicial. encarcelar a los usuarios puede interferir
con el tratamiento porque puede reducir las opciones positivas y las interacciones positivas que a menudo
12
están estrechamente relacionadas con la recuperación. El encarcelamiento sin tratamiento
puede hacer que los usuarios que aún no han cometido actos delictivos violentos se vean envueltos en
delincuentes peligrosos que, de hecho, son un peligro para la sociedad. El otro problema de la criminalización
del consumo de drogas es que traslada las drogas del mercado abierto al mercado delictivo y tiende a
conducir a interacciones comerciales violentas, que tienen fuertes consecuencias negativas para los
transeúntes que no están realmente involucrados en el mercado delictivo. 13 (Véase Prohibición, Estados
Unidos, 19201933; Colombia y el Cártel de Medellín, 19761993; y Violencia de pandillas y drogas en algunas
ciudades estadounidenses en la actualidad).
En parte debido a esta complejidad de definir la adicción (y en un intento de eliminar el estigma que se
había asociado a la palabra “adicto”), los psiquiatras en el DSMIV y el ICD10 (libros publicados regularmente
que detallan las definiciones actualmente acordadas en psiquiatría) abandonaron la palabra “adicción” y se
refirieron a los consumidores de drogas como “dependientes” y al uso excesivo de drogas como “dependencia”.
14
Creo que esta definición enfatiza demasiado los efectos
farmacológicos de los medicamentos más que las interacciones con la toma de decisiones.
También dificulta la formulación de preguntas sobre la “adicción” a sustancias no farmacológicas. Seguiré
utilizando los términos “adicto” y “adicción” para referirme a las personas que toman estas decisiones
desadaptativas de seguir consumiendo drogas, aunque reconozco que la cuestión de cuándo uno es adicto
es más una cuestión de política que científica.
La pregunta científica es ¿por qué la persona sigue tomando ese medicamento? ¿Cómo podemos cambiarlo?
Si queremos intervenir y hasta qué punto debemos estar dispuestos a intervenir es una cuestión personal
para las personas afectadas y sus familiares y una cuestión política para la sociedad.
Si observamos el sistema de toma de decisiones que hemos explorado hasta ahora en este libro, lo que
tenemos es una maquinaria de toma de decisiones. Como cualquier máquina, hay múltiples lugares donde
puede fallar. Si observamos el sistema en detalle, hay varias docenas de formas diferentes en las que esta
maquinaria puede tomar la decisión equivocada 15 —el sistema pavloviano puede asignar una mayor
motivación emocional a una droga, 16 el sistema deliberativo puede juzgar mal los resultados esperados de
sobrevalorar 18 , el sistema de una elección, 17 el sistema procedimental (hábito) puede o auto
entre estos modos de falla o vulnerabilidades implican diferencias en cómo el adicto toma esas decisiones, y
cada una probablemente requerirá tratamientos diferentes.
No pretendo sugerir que la conducta de cada adicto se deba a un solo modo de fallo en su sistema de
toma de decisiones. La biología tiende a tener muchos mecanismos de respaldo. Bien puede ser que la
adicción en toda regla surja solo cuando fallan varios sistemas. Las drogas en sí mismas también tienden a
crear modos de fallo adicionales. Por ejemplo, un
Machine Translated by Google
El efecto masivamente placentero (el subidón de la cocaína 22 ) conduce a una mayor motivación
para la cocaína (un "deseo"de ella 23 ), así como a la tolerancia (requerir más cocaína para producirla
24 ), y a una mayor probabilidad de realizar acciones que conduzcan a la cocaína (el subidón
procedimental 25 ). El26
decisiones irreflexiva alcohol conduce a
), la tolerancia (louna
quereducción de la ansiedad (lo que impulsa la toma de
requiere cada vez más alcohol para producir el mismo efecto 27 ), y reducciones en la eficacia del
autocontrol y los sistemas deliberativos. la adicción. Por otro lado, a veces se puede encontrar una
28
clave que permita al Abordar sólo una vulnerabilidad puede no ser suficiente para detener
paciente encontrar otro camino para prevenir la recaída.
29
Adicción 175
conduciría a la adicción, no que todos los adictos tuvieran un problema determinado. Vista de esta
manera, la adicción es un síntoma que puede surgir de múltiples “enfermedades” subyacentes.
Nuestra hipótesis de vulnerabilidades múltiples decía que todos tenían razón: todos estos problemas
podían conducir a la adicción, porque todos estos problemas eran modos de falla potenciales del
sistema de toma de decisiones. La figura 18.1 muestra una lista de algunos de los modos de falla
conocidos actualmente de la maquinaria de toma de decisiones.
Es importante señalar que la adicción, por definición, es una interacción entre la naturaleza y la
crianza. Si uno nunca toma cocaína, nunca se vuelve adicto a ella y la cocaína nunca se apodera de
su vida. De manera similar, hay muchas reacciones diferentes al tomar cocaína y hay muchas
39
reacciones diferentes al fumar cigarrillos. Algunas personas
siguen siendo capaces de controlar su consumo, mientras que otras lo pierden después de una
experiencia con ella, y otras lo pierden sólo después de una experiencia prolongada. Todavía no
sabemos si esto es una función de las situaciones en las que se encuentran estos usuarios, o una
función de la formulación específica de la droga en sí, o de la genética del usuario, o de los
antecedentes y experiencias de vida del usuario. (Lo más probable es que sea una combinación
compleja de todo esto.) Lo que sí sabemos es que la adicción a las drogas se presenta de muchas
formas diferentes, incluso entre la población de personas que no pueden controlar su consumo de drogas.
Los cambios en las tasas de aprendizaje son deliberativos, Exceso de asociaciones de señales relacionadas con las drogas
hábito
(Franken et al., 2005; Gutkin et al., 2006; Piray et al., 2010; Redish et al., 2008)
Inhibición selectiva de la selección Desarrollo rápido del aprendizaje de hábitos.
sistema deliberativo del sistema
(Bernheim y Rangel, 2004; Bechara, 2005; Bickel y Yi, 2008; Baumeister y Tierney, 2011; Bickel et al., 2012)
Excitación selectiva de la sistema Desarrollo rápido del aprendizaje de hábitos.
sistema de hábitos selección
(Everitt y Robbins, 2005; Bickel y Yi, 2008)
Clasificación errónea de situaciones: situación ilusión de control, sesgo de retrospección
sobrecategorización reconocimiento
(Redish y otros, 2007)
Clasificación errónea de situaciones: situación Perseverancia ante las pérdidas
generalización excesiva reconocimiento
(Redish y otros, 2007)
Figura 18.1 Algunos modos de fallo del sistema de toma de decisiones que pueden llevar a
la adicción. Evidentemente incompleta.
Machine Translated by Google
Adicción 177
Sólo algunos de ellos son conscientes. Es probable que si una persona recayera a través del
sistema procedimental (capítulo 10), esta recaída no implicaría ningún deseo previo (o tal vez ni
siquiera ningún reconocimiento previo). Es posible que simplemente se encontrara "en el casino".
43
Un aspecto importante del anhelo es que anhelamos cosas . No anhelamos simplemente el placer; no
Anhelamos sexo, anhelamos un cigarrillo, anhelamos una bebida. Tal vez incluso podamos anhelar el amor.
Pero incluso entonces, lo que anhelamos es una sensación, un momento, una cena romántica, un paseo por la playa. Si bien
ese anhelo puede satisfacerse con algo diferente de su objetivo original, no hay duda de que el anhelo incluye un objetivo o
meta identificable.
Cuando alguien anhela algo, se producen efectos extensos en el propio cuerpo. 44 Parte del anhelo es que
aumenta la excitación: el corazón late más rápido y más fuerte, la atención aumenta, uno se pone nervioso.
Estas son acciones pavlovianas que vimos en el capítulo 8: acciones no entrenadas que ocurren en respuesta
a la entrega del objeto deseado y que ahora ocurren en respuesta a la entrega de la expectativa de ese
objeto.
Algunas personas han identificado explícitamente el ansia con el sistema pavloviano: algo nos recuerda la existencia de
un resultado (a través de una asociación estímuloresultado) y recordamos que el resultado era muy deseable. 45 Tal como lo
discutimos cuando presentamos los sistemas de toma de decisiones múltiples (Capítulo 6), el entrenamiento pavloviano tiene
efectos de selección de acción (Capítulo 8) y efectos motivacionales (Capítulo 13). No está claro en este momento si los
efectos motivacionales del ansia son idénticos a los cambios fisiológicos del ansia o si simplemente tienden a ocurrir
simultáneamente.
46
Otras personas han identificado el anhelo con el sistema Deliberativo, en el sentido de que un
47
El sistema deliberativo implica la búsqueda de un resultado y la búsqueda de caminos que permitan alcanzarlo.
Esto significa que parte del sistema deliberativo debe mantener una representación del objetivo para que pueda ser reconocido
cuando uno lo encuentra. Los primeros estudios sobre el ansia descubrieron que el ansia no tiende a ocurrir por objetivos
fáciles de alcanzar; en cambio, tiende a ocurrir por objetivos bloqueados. Consideremos a un alcohólico que va al bar todos
los días a una hora determinada y no muestra ansia hasta que un día llega y encuentra el bar cerrado. Entonces el ansia 48
Este camino bloqueado obliga al alcohólico a pasar de un sistema de toma de decisiones bien entrenado, regular y basado en
se pone en marcha.
hábitos (procedimental) a un sistema de planificación más flexible y consciente (deliberativo).
49
Cuando analizamos el sistema de motivación (Capítulo 13), hablamos de un fenómeno particular llamado transferencia
pavloviana a instrumental (PIT), en el que las asociaciones pavlovianas nos recordaban un resultado, lo que conducía a un
aumento de las acciones adoptadas para alcanzar una meta específica. Esto sugiere que el ansia puede ser una interacción
entre los sistemas motivacional y deliberativo. Los experimentos dirigidos directamente a la PIT sugieren un papel importante
para la capa del núcleo accumbens, que está fuertemente implicada en el ansia. La relación entre la PIT y el ansia implicaría
50 Una rela
que el ansia es una interacción entre la motivación pavloviana (Capítulo 13) y los componentes de toma de
Es importante disociar el ansia de los sentimientos negativos asociados con dejar de tomar drogas. Como le dijo un
paciente a Anna Rose Childress y sus colegas: “No, doctor, el ansia es cuando lo deseas, lo deseas tanto que casi puedes
saborearlo... pero no estás enfermo... enfermo es, bueno, enfermo”. 51 Dejar de tomar drogas produce síntomas de abstinencia
dramáticos, tanto físicos como mentales. Los síntomas de abstinencia físicos aparecen porque el
Machine Translated by Google
Las drogas afectan a más que solo el sistema nervioso central. Los sistemas biológicos son
fundamentalmente sistemas químicos, y la química de la droga va a tener efectos profundos en el cuerpo.
Por supuesto, uno de los puntos de este libro es que los cambios mentales también son físicos, y esos
cambios químicos van a tener efectos profundos tanto en el cerebro como en la mente.
¿Y qué tiene que ver esto con los síntomas de abstinencia? La clave es que los sistemas
homeostáticos reaccionan lentamente. Imaginemos que nuestro cuerpo está intentando mantener un
determinado flujo de oxígeno a través del torrente sanguíneo. Si nos mudamos a una gran altitud (por
ejemplo, a Katmandú, en el Himalaya nepalí), para que los tejidos reciban suficiente oxígeno, el cuerpo
debe dedicar más recursos a la hemoglobina y a la transferencia de oxígeno. Esto sucede en el transcurso
de días o más. De manera similar, si luego volvemos a una altitud menor, el flujo de oxígeno adicional se
mantiene durante un par de semanas mientras nuestro sistema se reajusta. Los atletas que requieren un
alto flujo de oxígeno (como los corredores olímpicos de larga distancia) a menudo viven o entrenan a
grandes altitudes para que su cuerpo se adapte y sea mejor en la entrega de oxígeno a sus tejidos
cuando corren la carrera real (aunque la eficacia de esto todavía es controvertida). 57
Un fumador de cigarrillos ha estado inundando sus tejidos con nicotina, que es un análogo de una
sustancia química cerebral muy común llamada acetilcolina. 58 La música que estoy
escuchando ahora mismo en mi computadora tiene tres perillas de volumen en secuencia. El reproductor
multimedia tiene un control de volumen, que cambia el volumen de la música que se envía a la
computadora, que tiene un control de volumen del sistema, que cambia el volumen de la música que se envía a los pa
Machine Translated by Google
Adicción 179
que tienen su propio volumen. Si el volumen del reproductor multimedia aumenta, puedo obtener el mismo
nivel de música bajando el volumen de los altavoces (que es más fácil de alcanzar que el volumen del
sistema interno). Pero si el volumen del reproductor multimedia disminuye de repente, la música sonará
demasiado baja. , y no podré escucharlo.
En respuesta a la inundación química de nicotina, el cerebro ha aprendido a bajar el volumen de los
receptores de acetilcolina. Por eso, cuando una persona deja de fumar, el cuerpo y el cerebro reaccionan
como si no estuvieran recibiendo suficiente acetilcolina, porque el ex fumador no está recibiendo suficiente
acetilcolina, porque el volumen de los receptores de acetilcolina se ha reducido demasiado. Estos cambios
ocurren en todo el cerebro y los sistemas periféricos. Los síntomas de abstinencia suelen aparecer durante
un tiempo después de dejar de consumir la droga (días, semanas, meses). Estos síntomas de abstinencia
se deben a que el ajuste del cuerpo no está alineado con las expectativas de la droga.
59 Por supuesto, como hemos comentado
anteriormente, es posible cambiar el objetivo homeostático (alostático) del cuerpo en función de señales y situaciones.
Esto significa que las señales pueden recordarle al adicto una expectativa de la droga, lo que lleva a un cambio
60
en el objetivo alostático, lo que lleva a lo que efectivamente son síntomas de abstinencia inducidos por señales.
61
Pero el ansia también puede ocurrir en ausencia de síntomas de abstinencia explícitos. El antojo
es un proceso mental que se debe a cambios más permanentes en los sistemas de aprendizaje y memoria
y puede surgir mucho después de que hayan desaparecido los síntomas de abstinencia. Aunque el antojo
se produce a través de un proceso físico (todo en el cerebro es un proceso físico), comprender qué es el
antojo físicamente ha sido mucho más difícil de alcanzar y probablemente dependerá de comprender cómo
interactúa el antojo con los múltiples sistemas de toma de decisiones.
El experimento clave sería medir el ansia de forma continua a lo largo de la vida de las personas y luego
comparar a quienes informan niveles altos de ansia con quienes no, y comparar a quienes recayeron con
quienes no. Por supuesto, se trata de un experimento muy difícil de realizar. Se han hecho algunos intentos
utilizando teléfonos móviles y PDA para pedir a las personas que informen sobre el ansia a intervalos
regulares. 62 Estos experimentos generalmente encuentran que el ansia a menudo ocurre antes de la
recaída, pero que a veces el ansia ocurre sin recaída y a veces la recaída ocurre sin ansia. Muchos lectores
pueden estar preguntándose por qué no utilizamos experimentos retrospectivos que encuentren a personas
que recayeron y les pregunten si mostraron ansia de antemano. El problema vuelve a la reconstrucción de
la memoria que vimos en los últimos capítulos. En realidad, no recordamos los episodios de nuestro
pasado; En lugar de eso, los reconstruimos a partir de nuestros recuerdos de lo que fue, lo que debería
haber sido y lo que probablemente sucedió. De hecho, experimentos cuidadosos han descubierto que las
personas que recaen sin ansias a menudo recuerdan (incorrectamente) que mostraron ansias antes de la
recaída.
63
64
El ansia puede ocurrir en un intento por aliviar los síntomas de abstinencia. El ansia puede
ocurrir porque el sistema emocional (pavloviano, capítulo 8) espera una recompensa fuerte (o necesita
evitar un castigo fuerte), 65 o porque el sistema de planificación (deliberativo, capítulo 9) reconoce un
camino hacia una recompensa fuerte. 66 Todavía no se sabe si estos diferentes impulsos serán disociables
experimentalmente o no, pero todos implican mecanismos por los cuales una persona expresaría un fuerte
deseo por la droga.
Curiosamente, estos tres mecanismos pueden provocar ansia, pero no necesariamente conducen a
una recaída. La separación entre ansia y recaída nos lleva de nuevo a los múltiples sistemas de toma de
decisiones que hemos visto a lo largo de este libro. La ansia es una función de la expectativa del resultado;
no puedes ansiar algo que no sabes que vas a conseguir. Esto significa que la ansia no se producirá cuando
las acciones sean seleccionadas por
Machine Translated by Google
El sistema procedimental (capítulo 10), que no incluye una representación del resultado. Dado que el
sistema deliberativo implica el reconocimiento de un camino hacia una meta, pero conocer ese camino
no significa que uno lo tome (recuerde, el sistema deliberativo es flexible), uno puede tener ansia sin
recaer. Dado que tanto los reflejos como el sistema pavloviano pueden ser anulados por los sistemas
de autocontrol (capítulo 15), tampoco conducen necesariamente a una recaída. Si bien el ansia y la
recaída están relacionados, no son idénticos.
Aunque a los consumidores de drogas, a los científicos y a la sociedad les encantaría tener una única
bala mágica que “curara” a un consumidor de drogas de su predilección por las drogas, la teoría de
las múltiples vulnerabilidades de la adicción a las drogas sugiere que no va a haber un único camino
para salir de la adicción. 67 Dicho esto, la práctica actual es probar múltiples opciones, y algún
subconjunto de estas opciones a menudo funciona para individuos específicos. 68 Mi sospecha es
que debemos ver la adicción a las drogas no como el problema en sí mismo, sino más bien como un
B
síntoma de un problema subyacente o un conjunto de problemas.
Aunque este libro no es explícitamente un libro de autoayuda, y no voy a intentar decirle a un
consumidor de drogas cómo escapar de su situación, la historia de toma de decisiones múltiples que
hemos estado contando a lo largo de este libro tiene algunas implicaciones interesantes para identificar
posibles caminos para salir del ciclo de consumo de drogas.
La implicación de la visión de este ingeniero sobre la adicción y el concepto de que existen
múltiples sistemas de toma de decisiones con múltiples vulnerabilidades proporcionan dos perspectivas
importantes sobre el tratamiento que pueden abordarse. En primer lugar, el efecto de los tratamientos
debería ser el de normalizar las vulnerabilidades. Debería ser posible predecir el éxito del tratamiento
a partir de la identificación de los resultados de los intentos de tratamiento exitosos y fallidos. En
segundo lugar, es probable que diferentes vulnerabilidades requieran diferentes tratamientos. Si
pudiéramos identificar de qué vulnerabilidades ha sido víctima un adicto, podríamos proporcionar el
tratamiento adecuado para esas vulnerabilidades. 73
B Esta visión, de que las categorizaciones psiquiátricas (dependencia de drogas, esquizofrenia, depresión, etc.) son
en realidad categorías de síntomas más que reflejos de una enfermedad subyacente, está relacionada con el concepto
de endofenotipos . El término “endofenotipo” proviene de la idea de que diferentes genes pueden tener los mismos
efectos (fenotipos), pero el concepto aquí va más allá de simples declaraciones de variación genética.
69
El concepto es más cercano al de constructos hipotéticos o procesos transenfermedad . Construcciones hipotéticas
son variables intervinientes que permiten buscar conceptos subyacentes en la actividad neuronal (como el sub 70 que
que producen discutimos en el Capítulo 3), mientras que los procesos transenfermedad son vulnerabilidades tratables
71
diferentes disfunciones en diferentes contextos (como la impulsividad, Capítulo 5).
Es cierto que las categorías psiquiátricas se han vuelto confiables en las últimas décadas, de modo que se pueden
aplicar de manera uniforme (por lo general, varios psiquiatras asignan las mismas categorías a las mismas personas).
Sin embargo, el éxito de los tratamientos ha quedado rezagado. Lamentablemente, la confiabilidad de las categorías no
implica necesariamente una validez mecanicista unificada.
72 Existe un movimiento actual denominado psiquiatría
computacional que intenta redefinir las enfermedades psiquiátricas en términos de sus mecanismos subyacentes,
conectando los síntomas psiquiátricos con la disfunción subyacente basándose en modelos computacionales de toma
de decisiones. Volveremos a este concepto en el Capítulo 21.
do
Como se indica en el prefacio, el tratamiento debe adaptarse a cada individuo. Por lo tanto, se debe comprobar
con sus propios profesionales médicos antes de embarcarse en cualquier régimen de tratamiento.
Machine Translated by Google
Adicción 181
Existen algunas evidencias que sugieren que estas perspectivas son correctas: los distintos adictos se
benefician más con distintos tratamientos. Por ejemplo, las medidas de impulsividad conductual predicen
el éxito en el abandono del hábito de fumar. Se pueden identificar estructuras neuronales y pruebas
cognitivas que predicen el éxito del resultado del tratamiento en la adicción a la cocaína. 74
Algunas vulnerabilidades serán fáciles de tratar. Un desequilibrio homeostático puede aliviarse
mediante la sustitución por alternativas menos nocivas, como la terapia de reemplazo de nicotina para el
tabaquismo o la terapia de reemplazo de metadona para la heroína. 75 Sin embargo, las tasas de recaída
a largo plazo después de dejar estos tratamientos son notoriamente 76 Esto es probablemente una
altas.
consecuencia del hecho de que estas terapias no abordan las otras vulnerabilidades de las que puede
haber sido víctima el adicto.
77
84
Esto nos lleva al concepto de precompromiso y agrupamiento . Imaginemos a un alcohólico
que sabe que beberá si va a una fiesta esa noche, pero que preferiría permanecer sobrio si se lo pidieran a la luz del
día. Este alcohólico es, en cierto sentido, dos personas: a la luz del día, sobrio y cuerdo, y en el contexto pavloviano
de la fiesta, un alcohólico salvaje. (Esta dicotomía de elección es, por supuesto, el tema central de El doctor Jekyll y
Mr. Hyde de Robert Louis Stevenson .) Estas dos personas separadas temporalmente están en conflicto entre sí. 85
Si la persona sobria y cuerdo a la luz del día (llamémosle el doctor Jekyll) desea permanecer sobrio durante la
noche, sólo tiene que evitar la fiesta. El problema es que por la noche, el doctor Jekyll habrá cambiado de opinión y
querrá ir a la fiesta. Una opción es encontrar una manera de comprometerse con la opción sin drogas durante la luz
del día (por ejemplo, haciendo otros planes para esa noche). Esto se llama precompromiso porque el Dr. Jekyll se
ha comprometido previamente con una opción, de modo que la opción posterior no está disponible.
El agrupamiento es un proceso similar a través del cual uno cambia el conjunto de opciones disponibles. Por
La solución consiste en repensar cuáles son los resultados potenciales.86 ejemplo, el concepto “no existe tal cosa
como una bebida para un alcohólico” implica que uno no tiene la opción de ir al bar y tomar “solo una bebida”. 87 En
cambio, las opciones son no beber y ser el aburrido Dr. Jekyll o beber y convertirse en el diablo Mr. Hyde. Ser el
genial Mr. Suave bebiendo una bebida y encantando a las mujeres no es una opción para nuestro protagonista, el
Dr. Jekyll. Reconocer que solo hay dos opciones (el aburrido Dr. Jekyll y el peligroso Mr. Hyde) lleva a nuestro
protagonista a un proceso de decisión muy diferente (entre las dos opciones de Jekyll y Hyde en lugar de entre las
tres opciones de Jekyll, Hyde y tratar de ser Mr. Suave). El agrupamiento y el compromiso previo son dos ejemplos
de formas en que cambiar la perspectiva de uno puede cambiar la toma de decisiones.
Una cuestión interesante es que muchos adictos a la D (aunque desafortunadamente no todos) envejecen .
88 Si esto se debe a cambios en la función cerebral con la edad (la adicción suele comenzar en
adolescencia, cuando las funciones de autocontrol prefrontal están deterioradas, o si se debe la
a cambios en la vida (como formar una familia), todavía no se sabe (y probablemente difiere de
persona a persona). Sin embargo, es interesante que los estudios de casos de adictos que
superan la edad suelen hablar de cambios en la perspectiva que conducen a un rechazo de las
opciones adictivas. 90
Existen demasiadas opciones de tratamiento disponibles y sus éxitos y fracasos son demasiado complejos para
enumerarlos aquí o para identificar cómo interactúa cada uno con los múltiples sistemas de toma de decisiones.
Como se señaló anteriormente, diferentes opciones de tratamiento parecen funcionar para diferentes pacientes.
Los tratamientos actuales sugieren que los pacientes sigan un diagrama de flujo de opciones:
si el paciente tiene problemas de impulsividad, esto se puede tratar con terapia de función ejecutiva (que disminuye
la impulsividad); si el paciente tiene un problema homeostático, esto se puede tratar con reemplazo farmacológico.
92 Otros problemas
requieren otros tratamientos.
Aunque existen algunos ejemplos en los que los tratamientos dirigidos a disfunciones específicas han tenido un
éxito evidente, todavía no se dispone93de un régimen de tratamiento que se adapte a cada vulnerabilidad. Cómo
identificar qué modo de falla está activo (o cuáles modos de falla están activos) en un adicto determinado y cómo
tratar esos modos de falla son un foco de investigación activa en todas las comunidades neurocientíficas y médicas
94
en la actualidad.
D
Algunos adictos mueren antes de tener la oportunidad de salir de la adicción y otros nunca la abandonan.
Machine Translated by Google
Adicción 183
Heyman (2009). Addiction: A Disorder of Choice . Cambridge, MA: Harvard . • George F. Koob y
Michel Le Moal (2006). Neurobiology of Addiction . Amsterdam: Elsevier Academic Press . • A.
David Redish, Steve Jensen
y Adam Johnson (2008). A unifi ed framework for addictive: Vulnerabilities in the decision process .
Behavioral and Brain Sciences, 31 , incluyendo discusión (pp. 437–461) y respuesta del autor ,
415–487(pp. 461–470).
Machine Translated by Google
19
Una pregunta interesante que ha surgido en los últimos años es si la adicción está fundamentalmente relacionada
con el consumo de drogas o si uno puede ser adicto a algo que no está relacionado con las drogas.
1
Según la vieja teoría de la “dependencia” de la adicción (que sostiene que las drogas
2
tu equilibrio interno de algún químico cambian), es muy difícil describir las no drogas como una
adicción. Pero según la teoría de la “maladaptación” (que sostiene que hay que soportar altos costos para obtener
la dosis) o la teoría económica similar “inelástica” (que sostiene que el consumo no disminuye tanto como se espera
cuando los costos aumentan), 3 hay muchas cosas a las que uno puede volverse adicto.
Pero también hay muchas cosas que son inelásticas y que no queremos decir que son malas (¡como la respiración!).
Sin embargo, si trabajamos a partir de la teoría de la “maquinaria de toma de decisiones que funciona mal” descrita
en este libro, podemos ver que las conductas también pueden ser sobreseleccionadas dada la valoración correcta
subyacente que deberían tener.
En el mundo clínico, la adicción no relacionada con las drogas más común es el juego problemático, que afecta
entre el 1% y el 4% de la población estadounidense, dependiendo de los criterios específicos utilizados para definirlo.
El problema del juego suele identificarse porque las consecuencias
desadaptativas (pérdida de dinero, pérdida de familia, estabilidad vital) suelen ser muy claras.
Desde la perspectiva de la toma de decisiones, el juego problemático es definitivamente una adicción. Nuestro
sistema de toma de decisiones no es óptimo; puede ser engañado para que tome malas decisiones en
185
Machine Translated by Google
las condiciones equivocadas. 5 Al igual que en nuestra descripción de las múltiples formas posibles en que las
sustancias farmacológicas (drogas) pueden acceder al sistema de toma de decisiones y pueden conducir a decisiones
incorrectas, existen múltiples formas en que las secuencias de ganancias y pérdidas (juegos de azar) pueden conducir a
una toma de decisiones incorrecta. Analizamos algunas de estas vulnerabilidades potenciales en el último capítulo, que
Además de estos efectos motivacionales, los humanos somos muy malos en reconocer secuencias aleatorias como
siempre estamos buscando causas subyacentes. 6 Esto significa que podemos ser engañados por la aleatorias y
experiencia limitada con un evento probabilístico. Como no vemos la distribución correcta de posibilidades, o la distribución
correcta de la probabilidad de que esas posibilidades ocurran, creemos que tenemos más control sobre el sistema del
que realmente tenemos. (Esto es muy probablemente una falla en el sistema de reconocimiento de situaciones que no
7 somos
está dispuesto a aceptar coincidencias y siempre está construyendo narrativas para explicar por qué las
En particular, los humanos son muy susceptibles al “casi accidente”,9 donde se nos dice que
“Casi lo logramos”, lo que nos lleva a pensar que estamos avanzando en la comprensión del complejo sistema que es el
mundo en el que vivimos. Esto es algo que los fabricantes de máquinas tragamonedas han aprendido a explotar. Las
10
máquinas tragamonedas se vuelven cada En las últimas décadas, las máquinas tragamonedas han...
vez más complejas hasta que son casi como los videojuegos de hoy en día. Por supuesto, los casinos también han
aprendido a reducir la capacidad de uno para reconocer estas complejidades proporcionando una gran cantidad de luces
y señales por todo el casino para desviar la atención y proporcionando alcohol para disminuir su capacidad de planificar
y pensar.
Imagínese tomar los 10 dígitos (del 0 al 9) y ordenarlos. ¿Qué secuencia de números le parece más aleatoria:
4037981562 o 0123456789? Apuesto a que es la primera (a menos que sea su número de la Seguridad Social). En
realidad, ambas son igualmente probables. Si está seleccionando una secuencia aleatoria de 10 dígitos (sin reemplazo),
Varios investigadores han argumentado que la razón por la que los animales desarrollaron cerebros es la predicción:
cuanto mejor puedas predecir lo que va a suceder, mejor podrás prepararte para ello, mejor podrás reaccionar ante ello,
mejor serás para sobrevivir y procrear tus genes en la siguiente generación. de la aleatoriedad verdadera. Esto tiene
11
varios efectos en nuestra capacidad de Hemos evolucionado para reconocer patrones, incluso si surgen.
toma de decisiones. Primero, significa que somos terribles para generar secuencias aleatorias.
12
En segundo lugar, significa que
Pídele a cien personas que generen una cadena de cinco dígitos aleatorios y apuesto a que ninguno de ellos dirá “00000”
A Con 10 dígitos para elegir, hay 10 posibilidades para el primer dígito, 9 para el segundo
(todos menos el que ya eligió), 8 para el tercero, etc. Esto resulta en 10 × 9 × 8 × 7 × 6 × 5 × 4 × 3 ×
2 × 1 = 10! = 3.628.800. Todas las posibilidades, incluida 9876543210, son igualmente probables.
Machine Translated by Google
(Quienes estudian estas cosas y se les ocurrirán esos números sólo para fastidiar su experimento, pero por supuesto,
esos números tampoco son aleatorios). En general, la gente comenzará con un número (digamos 7) y luego intentará
encontrar un número que sea diferente de ese, y luego volverá a otro número. Este es un proceso llamado "inhibición
del retorno" y se sugiere que es un medio para mejorar la búsqueda de alimentos. Uno está "buscando" números,
14
pero en otro lugar. En sentido,
15
y, habiendo encontrado 7, se quiere encontrar el siguiente número.
Mi demostración favorita de que la aleatoriedad es difícil de lograr es que los programas de computadora pueden
aprender a vencernos al juego de piedra, papel o tijera. 16 Este es el juego en el que tú y tu oponente contáis hasta
tres y, en tres, ponéis la mano en puño (piedra), en palma de la mano (papel) o con dos dedos haciendo un
movimiento de cortar (tijeras). En este juego, cada opción supera a una de las otras opciones y cada una pierde
contra una opción en un círculo: la piedra le gana a la tijera, que le gana al papel, que le gana a la piedra. Si puedes
predecir lo que va a hacer tu oponente, entonces siempre puedes ganar. Pero si no puedes predecirlo, entonces la
estrategia óptima es jugar al azar. Desafortunadamente, los humanos somos terribles jugando al azar. Como parte
de su trabajo de tesis de posgrado, Steve Jensen, de la Universidad de Minnesota, desarrolló un algoritmo que
básicamente recuerda secuencias que ha observado. Utiliza estas secuencias para predecir resultados futuros.
Como tiene una memoria muy grande, este programa eventualmente vencerá a un oponente humano. Si juega solo
una partida contra ti, entonces quién ganará será aleatorio.
Pero si juegas cien partidas contra él, ganará más de la mitad de las veces (¡mucho más de la mitad!). Es una
experiencia increíblemente frustrante, porque incluso si sabes que tienes que jugar al azar e intentas jugar al azar,
¡el ordenador sigue adivinando correctamente lo que vas a hacer!
Predecir lo que va a hacer el oponente es un factor clave en la mayoría de los deportes competitivos, ya sea un
bateador de béisbol que predice qué lanzamiento va a lanzar el lanzador (y hacia dónde lo va a lanzar), un entrenador
de fútbol que predice si se realizará una jugada de pase o una jugada de carrera a continuación, o un jugador de
tenis que predice hacia dónde sacará la pelota su oponente a continuación. Incluso una pequeña mejora en el
conocimiento de la siguiente opción tendrá grandes consecuencias en el transcurso de un partido o una temporada.
Y, por supuesto, la capacidad de generar aleatoriedad (o su inversa, la capacidad de predecir lo que va a hacer un
oponente) también tiene implicaciones importantes para otras actividades, incluidas las de los negocios, la política y
la guerra.
B
Reconociendo patrones
La otra implicación de nuestra predilección por la predicción es que reconocemos patrones que no existen. 17 Desde
el hombre en la luna hasta los íconos religiosos en el pan mohoso.
B Esto no significa que la aleatoriedad sea la mejor estrategia para ganar en cualquiera de estas actividades, ya
sea fútbol, negocios, política o guerra. Debido a que algunas opciones son en realidad mejores que otras y debido a
que las interacciones entre las personas rara vez son de suma cero, la aleatoriedad verdadera rara vez es una
estrategia óptima. (Piedra, papel o tijera es uno de los pocos casos en los que la aleatoriedad es la estrategia óptima).
Debido a que somos criaturas sociales, dos jugadores que cooperan van a ser mucho más fuertes que dos jugadores aleatorios.
La aleatoriedad rara vez te permite ganar la partida, pero a menudo también acaba con tus oponentes cercanos.
Volveremos a la cuestión de la cooperación en nuestro análisis de la moralidad (capítulo 23). Baste decir por
ahora que la cooperación también depende de la capacidad de predecir lo que van a hacer tus colegas.
Machine Translated by Google
Los patrones en las baldosas de mármol son una constante en el mundo de nuestros cerebros. Algunos
de estos patrones son reales. Los hongos y las flores suelen aparecer después de una gran tormenta.
Si te dan un puñetazo en la cara, es probable que te golpee si no lo bloqueas y que te haga daño si te
golpea. Otros patrones no son reales. El hombre en la luna es una ilusión causada por una interacción
entre el patrón específico de tierras bajas oscuras y tierras altas brillantes en la superficie de la luna con
los sistemas de reconocimiento facial genéticamente cableados en nuestros cerebros.
El reconocimiento de patrones que no existen se convierte en un verdadero problema cuando
18
conduce a la ilusión de control
En .un casino, cuando se juega a un juego, a veces se gana y a veces se
pierde. Supongamos, por ahora, que estos juegos son verdaderamente aleatorios. Pero imaginemos que
nos damos cuenta de que hemos roto una larga racha de pérdidas justo después de tocarnos el sombrero
y secarnos la frente. Tal vez valga la pena volver a intentarlo. Por supuesto, es probable que no
funcione la segunda vez, pero ahora estamos en un mundo probabilístico: estamos tratando de averiguar
si ganar es un poco más probable en una u otra condición.
Por supuesto, lógicamente, no tiene sentido por qué limpiarse la frente cambiaría el resultado de una
máquina tragamonedas, pero ¿qué pasa si, en cambio, pensamos en cómo empujas la culata, o cuándo
empujas la culata en el transcurso de un giro de algún efecto de video en la máquina?
Ahora, tenemos una causa lógica potencial que podría afectar el resultado de la máquina. Imaginemos
una máquina tragamonedas con un interruptor simple. El interruptor podría incluso tener un letrero que
diga “este interruptor no hace nada”. Sin embargo, alguien que juegue con la máquina probablemente
probará el interruptor, y tendrá más probabilidades de ganar con el interruptor en una posición u otra.
(Aunque al lanzar una moneda saldrá cruz la mitad de las veces en promedio, la probabilidad de que
cualquier secuencia específica de lanzamientos de moneda sea mitad cara y mitad cruz es muy baja. De
manera similar, es muy poco probable que el número de ganancias que observe con el interruptor en cada
posición sea exactamente el mismo). Por lo tanto, el jugador creerá (incorrectamente) que el interruptor
tiene un efecto. Esta es la ilusión de control.
Una gran parte de nuestra inteligencia se dedica a intentar predecir el mundo. Varios investigadores
han sostenido que el aprendizaje consiste en reconocer contingencias , es decir, si es más (o menos)
20 Como vimos en
probable que ocurra un acontecimiento en el contexto de otro acontecimiento. En
nuestro análisis del reconocimiento de situaciones y la construcción de narrativas (capítulo 12), gran
parte de nuestro esfuerzo cognitivo se dedica a reconocer la estructura causal dentro del mundo.
21 desde Giambatista Vico. do
Esta ha sido una hipótesis sobre el origen de la mitologización.
Entonces, ¿qué sucede cuando tus hipótesis causales cometen errores, cuando reconoces
diferencias entre dos situaciones que en realidad no son diferentes? Esto conduce a la ilusión de control:
si crees que hay dos situaciones (una en la que ganas y otra en la que pierdes) y puedes encontrar una
manera de llegar a la situación ganadora, entonces el juego tiene sentido. Por supuesto, aquí es donde
los errores cognitivos pueden conducir al juego problemático.
23 Piense en el jugador estereotipado de las películas: "Sé lo que es".
C. Giambatista Vico fue un científico y filósofo italiano que vivió entre 1668 y 1744 (justo después de
Newton y Descartes). Vico es más conocido por su Scienza Nuovo ( Nueva ciencia ), que es una de las
principales fuentes para la estructura de Finnegans Wake de James22Joyce .
Machine Translated by Google
diferente. Préstame el dinero, esta vez es una apuesta segura. Te lo devolveré cuando gane”.
Ese jugador no es adicto a la aleatoriedad. Ese jugador no busca jugar el juego.
Ese jugador cree que entiende la estructura causal del mundo lo suficientemente bien
como para controlarlo. Ese jugador ha sucumbido a la ilusión del control.
También podemos ver que reconocer incorrectamente cuándo una situación ha cambiado puede
llevarnos a tener problemas con el juego. Si una situación ha cambiado, pero no reconocemos el cambio,
entonces estaremos realizando las acciones equivocadas en las situaciones equivocadas. Una vez más,
los errores cognitivos conducen a una toma de decisiones incorrecta. Aquí, nuevamente, podemos ver
mejor este efecto en la literatura clásica de trágicas incapacidades para reconocer cuándo el mundo ha
cambiado: un atleta que ya no tiene las habilidades de su juventud pero no puede dejarlo, el hombre de
negocios incapaz de reconocer que los nuevos competidores están usando tácticas diferentes, los generales
que luchan24en la última guerra.
Esto es algo que los operadores de casinos y los fabricantes de máquinas tragamonedas entienden.
En las últimas décadas, las máquinas tragamonedas se han vuelto más complicadas, no menos. 25 En
su libro Addiction by Design , Natasha Dow Schüll describe a los jugadores de tragamonedas y máquinas
de video como personas que sucumben a un déficit particularmente procedimental, que se dejan llevar
por el "flujo" de un sistema procedimental, y describe cómo los diseñadores de tragamonedas y
videojuegos han enfocado las máquinas para acceder a ese sistema de aprendizaje procedimental (no
deliberativo). Las máquinas de juego de video incluyen decisiones y controles cada vez más complejos,
lo que proporciona una experiencia más "similar a un juego", y se basan cada vez menos en simplemente
poner dinero y tirar de la palanca. Las opciones más complejas brindan más opciones potenciales para
que la ilusión de control se apodere de ellas. 26
En un estudio clásico de 1975, Ellen Langer y Jane Roth entrenaron a 90 estudiantes universitarios de
27 Los estudiantes que adivinaron correctamente al
Stanford para jugar a un juego de lanzamiento de moneda.
principio tenían muchas más probabilidades de decidir que estaban prediciendo correctamente los
resultados que los estudiantes que adivinaron incorrectamente al principio. Es decir, una secuencia de
victorias seguidas de derrotas llevó a los estudiantes a imaginar que entendían la tarea y que necesitaban
tratar de averiguar qué estaba saliendo mal, mientras que una serie de derrotas intercaladas con victorias
llevó a los estudiantes a pensar que era aleatorio. Una secuencia de cuatro suposiciones tempranas
correctas fue suficiente para llevar a las personas a creer que podían adivinar correctamente la secuencia
"incluso para sujetos sofisticados". Así es como los casinos enganchan a la gente: una serie rápida de
victorias te lleva a pensar que puedes ganar el juego, aunque (como hemos visto) WWWWWLLLLL es tan aleatorio co
¡¡ ... 28
Victorias y derrotas
Otra falla potencial es que las victorias y las derrotas se representan de manera diferente en el sistema
de toma de decisiones. Ya hemos visto cómo las personas valoran las victorias y las derrotas de
D Ya hemos visto cómo las diferencias entre el castigo y la decepción implican
manera diferente.
que debe haber señales diferentes para las victorias (ganancias, recompensas) y las derrotas.
D
Tal vez recuerde los ejemplos de formulación que vimos en el Capítulo 3, donde formular exactamente
el mismo problema en términos de ganancias o pérdidas cambiaba la opción que alguien prefería. En el
ejemplo de la gripe asiática, se prefería estar seguro de salvar 200 vidas (de 600, perdiendo así 400) frente
a la apuesta de salvar o perder a todos, pero se prefería la apuesta a estar seguro de perder 400 vidas. 29
Machine Translated by Google
(castigos), porque la decepción (falta de entrega de una ganancia esperada) no es un castigo simple, y
el alivio (falta de entrega de un castigo esperado o potencial) no es una victoria simple (ver Capítulo 4).
Si estas células dopaminérgicas están implicadas en el aprendizaje, entonces los pacientes de Parkinson deberían tener
problemas para aprender cosas nuevas a partir de recompensas. Tanto Michael Frank como Mark Gluck han realizado
34
experimentos separados en los que entrenaron a pacientes para que aprendieran a partir de señales de recompensa o castigo.
Ambos concluyen que los sujetos normales pueden aprender de ejemplos positivos (obtienen recompensas
si eligen lo correcto, no obtienen nada si eligen lo incorrecto) y de ejemplos negativos (no pierden nada
si eligen lo correcto, pierden algo [normalmente dinero] si eligen lo incorrecto), pero los pacientes de
Parkinson tienen dificultades para aprender de los ejemplos positivos (recompensas). Sin embargo,
pueden aprender de los ejemplos negativos (castigos). Si la clave del aprendizaje es en realidad la
dopamina, entonces se podría esperar que esto se invirtiera con el tratamiento con levodopa: si la
levodopa aumenta los niveles generales de dopamina, se podría predecir que sería posible que los
pacientes de Parkinson aprendieran de las recompensas positivas, pero ya no de los castigos negativos.
De hecho, eso es exactamente lo que sucede.
Como se señaló anteriormente, las máquinas tragamonedas y otros juegos de casino han aumentado la cantidad de
estos fármacos consiste en aumentar la sensibilidad del paciente a las recompensas y al mismo tiempo
reducir la sensibilidad a las pérdidas, cabría esperar que los pacientes de Parkinson que toman levodopa
y otros fármacos similares que aumentan la eficacia de la dopamina se volvieran muy susceptibles a los
trastornos impulsivos, como el juego problemático, en el que aprenden de los ejemplos positivos ( ¡gané! )
36
y no de los negativos ( perdí ). Eso es exactamente lo que sucede.
También ha habido descripciones de personas “adictas” a una serie de comportamientos, como la comida,
el sexo, la pornografía, las compras, los videojuegos e incluso navegar por Internet .
Las cosas a las que la gente tiende a volverse adicta cuando navega por Internet son los juegos de azar, la
pornografía, los videojuegos y las compras, por lo que no está claro si el problema es Internet en sí o si Internet es
simplemente un nuevo medio que permite otras adicciones conductuales.
Machine Translated by Google
Se ha demostrado que algunas de estas conductas liberan dopamina, a la que a menudo se hace
referencia (por desgracia, tanto en la literatura científica como en los medios de comunicación
populares) como la clave de la adicción. (Recuerde que la dopamina es un punto de acceso, pero
no el único, a la adicción. 38 Véase el Capítulo 18.) Incluso los videojuegos provocan la liberación
de dopamina en el cerebro de los jugadores. 39 Pero, como hemos visto, esto es exactamente lo
que debería ocurrir en el sistema de aprendizaje normal (Capítulo 4), que utiliza la dopamina para
aprender la conducta adecuada. La pregunta (cuya respuesta no se conoce) es si esa señal de
dopamina se compensa correctamente a medida que aprende el juego.
Por ejemplo, ¿es la obesidad una adicción? Hay algunos datos que muestran que las personas obesas
tienen algunos de los mecanismos de compensación homeostática y otros mecanismos disfuncionales de
dopamina que se observan en los drogadictos a largo plazo. 40 Algunos de los datos sugieren que el
problema de la obesidad está relacionado con el alto contenido de grasa y azúcar de la comida basura.
41
Recuerde que el azúcar puede tener algunos de los problemas de mala distribución que hemos visto Entonces
en las drogas adictivas. No está completamente fuera del ámbito de las posibilidades que la obesidad sea un
signo de una forma de adicción a la comida, pero sigue siendo una cuestión abierta que se está discutiendo
en la literatura neurocientífica y médica.
¿Entonces, queremos decir que uno es “adicto” a estas conductas? ¿Qué pasa con otras? ¿Son estas
42 conductas en las que uno puede volverse adicto?
¿Es adicto a conductas como ir de compras o
prender fuego? ¿Es adicto a algo? Desde la perspectiva de la toma de decisiones, el término “adicto”
no es la pregunta científica importante. Desde la perspectiva de la toma de decisiones, la pregunta
científica es por qué la persona continúa con esa conducta, ya sea que esa conducta consista en
tomar drogas, jugar o ver pornografía. Fundamentalmente, si debemos o no llamar a esa persona
“adicta” es una cuestión de política, que determina si debemos alentar o desalentar esa conducta y
hasta qué punto estamos dispuestos a comprometernos con esa política. Pero si entendemos cómo
funciona el proceso de toma de decisiones para impulsar a la persona a continuar con esa conducta,
podemos entender mejor lo que uno necesita hacer para fortalecerla o debilitarla, habilitarla o
deshabilitarla, alentarla o desalentarla.
• Natasha Dow Schüll (2012). Adicción por diseño: máquinas de juego en Las Vegas .
Princeton, Nueva Jersey: Princeton University Press.
• Mark G. Dickerson y John O'Connor (2006). El juego como conducta adictiva .
Cambridge, MA: Cambridge University Press .
• Willem Albert Wagenaar (1998). Paradojas del comportamiento de juego . Hillsdale, Nueva Jersey:
Lawrence Erlbaum Asociados .
Machine Translated by Google
20
Después de la Primera Guerra Mundial, se decía que los soldados que regresaban de las trincheras de Europa
sucumbían al “shock de guerra”: nerviosos, encogidos al menor ruido, a menudo incapaces de funcionar en una sociedad
normal. En la Segunda Guerra Mundial, el término era “fatiga de batalla”. La imagen clásica es la de un padre en 1950,
sentado a la mesa de la cocina, fumando su cigarrillo, mirando fijamente a su memoria. Esta dificultad que tienen algunos
soldados no es un fenómeno nuevo.
1 En
su descripción de los soldados que regresaban de la Guerra Civil estadounidense, Jacob Mendes Da Costa
describió un fenómeno de palpitaciones cardíacas de aparición repentina, al que llamó “irriUn estudio histórico
2
corazón de mesa” y llegó a ser conocido coloquialmente como “corazón de soldado”. de 2006
encontró que el mejor predictor del corazón de soldado en los veteranos de la Guerra Civil era el porcentaje de la
compañía muerta, presumiblemente un indicador confiable para experimentar emociones devastadoras. 3 El término
trauma. usado ahora, trastorno de estrés postraumático , reconoce que este problema también puede surgir de
experiencias traumáticas no militares: las víctimas de delitos violentos, agresión sexual, ataque terrorista, accidentes
4
automovilísticos y otros desastres también son vulnerables al TEPT.
En este punto, no está claro cuál es la causa del TEPT. Los síntomas, sin embargo, son consistentes y reconocibles
(como se puede ver en las similitudes de las descripciones de la conmoción por la guerra, la fatiga de la batalla y el
corazón del soldado). 5 Estos síntomas incluyen reexperiencias incontrolables del evento. Basándonos en nuestra
separación de recuerdos episódicos y semánticos (Capítulo 16), estas reexperiencias serían incuestionablemente de
naturaleza episódica. A menudo están vívidamente presentes e intrusivas. Los pacientes con TEPT también muestran un
retraimiento de la realidad.
*
Estoy en deuda con Larry Amsel de la Universidad de Columbia por nuestras discusiones relacionadas con este tema.
193
Machine Translated by Google
La sociedad y los amigos, así como la hiperactivación, el aumento de la vigilancia y el aumento de las respuestas
de sobresalto, pueden tomarse como evidencia de la selección de acciones pavlovianas (Capítulo 8) y del
aprendizaje motivacional (Capítulo 13). Estas respuestas de sobresalto pueden ser extremadamente peligrosas
en soldados bien entrenados, que han aprendido a asociar respuestas de acción violenta con esas situaciones
(Capítulo 10).
Al igual que la adicción y el juego problemático, el TEPT parece ser una interacción entre la vulnerabilidad
inherente y una causa externa. Por ejemplo, no es cierto que todos los que se exponen a una situación difícil o
evidencia de que existe una diferencia significativa en los niveles traumática sufran TEPT. 6 Ahora hay
hormonales y en varias estructuras cerebrales entre los soldados y otros pacientes que terminan con TEPT
después de un incidente y los que no. 7 Mellizos
Los gemelos de soldados que no padecían TEPT (que comparten el mismo código genético) que padecían TEPT
reaccionaron con más fuerza a las señales sorprendentes que los gemelos de soldados que no padecían TEPT
8
hemos visto que por experiencias similares. De manera similar, el hipocampo (una estructura cerebral que
está profundamente involucrada en la memoria, véase el Capítulo 16) es físicamente más pequeño en los
gemelos de soldados con TEPT que en los gemelos de soldados que no lo padecían. 9 Al igual que con todas
estas vulnerabilidades (como las vulnerabilidades genéticas que hemos discutido en otra parte), estas son
correlaciones. Las personas con hipocampos más pequeños pueden tener más probabilidades de terminar con
TEPT que las personas con hipocampos más grandes; sin embargo, hay muchos otros factores involucrados.
Simplemente tener un hipocampo más pequeño no significa que sufrirás TEPT si alguna vez te expones a un trauma.
Se han propuesto tres teorías para explicar el TEPT: (1) que los pacientes con TEPT tienen 10 (2) que los
una memoria de “flash”, que no se puede olvidar, tienen dificultad para pacientes con TEPT almacenan
11
extinguir los recuerdos relacionados con el miedo, particularmente a través del miedo alterado 12 y (3) que los
lo que permite pacientes con TEPT tienen dificultad para identificar el contexto del procesamiento de la memoria,
13
que esos recuerdos se entrometan en otros contextos. Una cuarta posibilidad es que los
pacientes con TEPT tengan dificultades para consolidar los recuerdos de las representaciones episódicas
dependientes del hipocampo en representaciones semánticas independientes del hipocampo (Capítulo 16).
Abordaremos cada una de estas teorías y luego intentaremos reunirlas en una imagen coherente de la toma de
decisiones y el TEPT.
Recuerdos de flash
Las primeras teorías psicológicas del TEPT sugerían que el acontecimiento traumático producía una memoria
instantánea, una memoria fotográfica perfecta de un momento. El concepto era que el estrés y la intensidad del
almacenamiento de la memoria abrumaban los sistemas de almacenamiento cortical, “quemándolos en el
cerebro”. 14 Sin embargo, esta teoría predice que el recuerdo se recordará de forma idéntica cada vez, lo que no
es como ocurren estos recuerdos.
Aunque la definición original de los recuerdos de flash propuesta por Roger Brown y James Kulik reconocía
que el flash iluminaba solo una parte de la imagen, se mantuvo el concepto de que las imágenes iluminadas
permanecían estables. De hecho, Jennifer Talarico y David Rubin descubrieron que, aunque permanecían
vívidas, los recuerdos de “flash” (definidos como recuerdos que perduran durante largos períodos de tiempo)
perdían consistencia con el tiempo, lo que sugiere que se reconstruían cada vez.
15 Talarico y Rubin
sugieren que la principal diferencia entre los recuerdos instantáneos y los recuerdos más comunes y cotidianos
era la confianza interna en ellos, más que en las propiedades del recuerdo recordado en sí.
Machine Translated by Google
Curiosamente, esto sugiere que, aunque los recuerdos traumáticos son vívidos e intrusivos, son construidos,
al igual que los recuerdos ordinarios, y también sugiere una relación entre la memoria episódica y el TEPT.
Ya hemos visto (en el Capítulo 4) cómo los animales que extinguen las respuestas a las asociaciones aprendidas
cambian su comportamiento debido a que entran componentes adicionales en el nuevo proceso, en lugar del
original, conduce a la renovación espontánea de las respuestas y a la recuperación olvido de la asociación
Sin embargo, debemos tener cuidado de decir simplemente que los pacientes con TEPT tienen dificultades
para extinguir sus conductas. Existen varias diferencias clave entre el tipo de aprendizaje asociativo que ocurre
en los paradigmas de extinción típicos y el TEPT. Los paradigmas de extinción generalmente implican múltiples
exposiciones al estímulo desencadenante para crear el
18
asociación, y la reacción a la asociación es común entre todos los animales expuestos.
La reaparición espontánea de la asociación ocurre después de largos períodos de tiempo, no inmediatamente
después del evento. La reaparición de la asociación ocurre con una nueva exposición a las señales
20
específicas que crearon la asociación original. Por el contrario, el TEPT
generalmente ocurre en respuesta a un evento traumático único, los recuerdos intrusos ocurren rápidamente
después del evento y se desvanecen con el tiempo, y los recuerdos intrusos aparecen, incluso sin previo aviso,
21
en situaciones con poca o ninguna relación con la asociación original.
Lynn Nadel y W. Jake Jacobs han sugerido que los pacientes con TEPT tienen dificultades específicas para
separar contextos, lo que permite que los recuerdos reaparezcan (se entrometan) en situaciones en las que
22
normalmente no lo harían. En concreto, proponen que los glucocorticoides
en el hipocampo que surgen durante el estrés inhabilitan el hipocampo durante el almacenamiento de la
memoria, lo que permite que la memoria se desmarque espaciotemporalmente, lo que permite que la memoria
se despegue, en cierto sentido, en el tiempo. El estrés afecta el almacenamiento y la recuperación de los
recuerdos, principalmente a través de la acción de los glucocorticoides (como el cortisol). 23 En particular, Nadel,
Jacobs y sus colegas han descubierto que los acontecimientos estresantes previos a una experiencia facilitan
el almacenamiento de recuerdos emocionales a través de una interacción hipocampoamígdala, incluso mientras
perjudican el procesamiento hipocampal.
Machine Translated by Google
27 Nadel
amígdala y suprimen el aprendizaje del hipocampo. y Jacobs sugieren que el efecto del evento estresante masivo
es mejorar el aprendizaje en la amígdala, disminuir el aprendizaje en el hipocampo y producir una
memoria altamente cargada de valores pero desacoplada del contexto. 28 Sin
embargo, estas teorías sugieren que el paciente con TEPT no será capaz de proporcionar una
imagen espaciotemporal del evento, particularmente la ubicación del paciente dentro de la
secuencia del evento, lo que no parece encajar con las descripciones de la naturaleza vívida de
29
la memoria traumática en el TEPT.
En el capítulo 16 vimos cómo el progreso normal de la memoria es una transición de recuerdos episódicos
( estás ahí ) a semánticos ( recuerdo eso ). Una posibilidad intrigante es que el TEPT ocurre no cuando
el hipocampo es incapaz de crear un recuerdo episódico del evento, sino cuando el sistema hipocampo
cortical es incapaz de consolidar el recuerdo en un almacenamiento semántico. Como discutimos en el
capítulo 16, aunque los primeros estudios de consolidación sugirieron que la memoria se transfirió
intacta de las estructuras dependientes del hipocampo a las estructuras independientes del hipocampo
con el tiempo, estudios más recientes han sugerido que ciertas funciones de la memoria siguen
dependiendo del hipocampo para siempre. 30 Estudios recientes han sugerido que los recuerdos
transferidos tienen un carácter fundamentalmente diferente a los recuerdos almacenados recientemente:
los recuerdos almacenados recientemente (dependientes del hipocampo) se almacenan de manera
episódica , mientras que los consolidados se almacenan de manera semántica extrahipocampalmente.
Estas teorías son coherentes con las nuevas opiniones sobre el hipocampo, que desempeña un
papel en el viaje mental en el tiempo, papel clave tanto en la reconstrucción del pasado como en la imaginación
del futuro. 31 Si la recuperación normal de un trauma implica la consolidación de un recuerdo que pasa
de ser un recuerdo episódico ( de que uno está allí , de que se vuelve al pasado ,) a un recuerdo
semántico ( desprendido de la narrativa ), los pacientes con TEPT pueden quedar atrapados en el modo
episódico. Pueden ser incapaces de lograr esta transformación y seguir reconstruyendo su pasado cada
vez que acceden al recuerdo, lo que deja en el recuerdo una inmediatez que interfiere en el funcionamiento normal.
De hecho, esto es coherente con los estudios originales sobre los recuerdos de flash, 32 que
sugerían que el recuerdo normal de “flash” se almacenaba, se reproducía y se ensayaba, y su
impacto emocional disminuía con el tiempo. Es importante destacar que Brown y Kulik estaban
estudiando a personas normales que recordaban tragedias lejanas (por ejemplo, ¿dónde estaba
usted cuando se enteró de que el World Trade Center había sido atacado por terroristas? ), no a
personas con TEPT involucradas en el evento en sí (por ejemplo, bomberos que escapaban de los
edificios que se derrumbaban). Brown y Kulik plantearon la hipótesis de que los relatos finales de los
recuerdos de flash se derivaban de un ensayo continuo, encubierto y abierto, de estas historias,
traduciéndolas a una forma narrativa y tal vez incluso verbal.
Machine Translated by Google
Esta hipótesis se basa en el concepto de que el hipocampo en pacientes con TEPT es débil o
disfuncional, no no funcional. Los pacientes con lesiones completas en el hipocampo no muestran
ningún recuerdo episódico y, cuando recuerdan acontecimientos pasados o imaginan acontecimientos
futuros, sus descripciones son principalmente semánticas, no episódicas. 33 Las
experiencias de TEPT son vívidas y están ubicadas espacial y temporalmente, con fuertes
sugerencias de viajes mentales en el tiempo, todas ellas indicaciones de recuerdos episódicos y un
hipocampo disfuncional (pero no noA funcional).
Resumen
Los intentos de tratamiento para el TEPT han incluido tratamientos farmacológicos, intentos de
extinguir el recuerdo mediante la adquisición de señales de seguridad e intentos de recontextualizar
el recuerdo, transfiriéndolo efectivamente desde los sistemas episódicos etiquetados emocionalmente
34
a los sistemas semánticos más distantes.
Aunque todavía queda mucho trabajo por hacer para determinar
las vulnerabilidades que generan el TEPT, los mecanismos por los cuales crea disfunción y cuáles
podrían servir como posibles tratamientos, está claro que el trastorno mental conocido como TEPT
tiene una manifestación física en la función cerebral.
Lo que está claro es que el TEPT implica una interacción compleja y disfuncional entre los sistemas
de memoria. De alguna manera, los sistemas de memoria emocional y episódica se han enredado de
una manera que es difícil desenredar. Como se reconstruyen cada vez, los recuerdos del TEPT no
son “recuerdos de flash”, sino que, en un sentido muy real, están grabados a fuego en el cerebro. El
TEPT incluye problemas con los recuerdos emocionales, que afectan a los sistemas pavlovianos de
motivación y selección de acciones, pero también incluye interacciones hipocampales, en particular
con la recuperación de la memoria episódica. Los pacientes con TEPT parecen tener un hipocampo
disfuncional, incapaz de hacer la transición de los recuerdos de representaciones episódicas a
semánticas con el tiempo.
A
De manera similar, los pacientes de Alzheimer son bien conocidos por su capacidad de revivir recuerdos
episódicos. Esto sugiere que tanto los pacientes con TEPT como los de Alzheimer tienen un hipocampo que funciona
incorrectamente, en lugar de uno que simplemente está inactivo.
Machine Translated by Google
21
Psiquiatría computacional*
libélula zumbando en
todas direcciones ¡No
puedo salir!
Nuestras discusiones sobre la adicción, el juego problemático y el trastorno de estrés postraumático sugieren
que la visión neurocientífica del sistema de toma de decisiones tiene implicaciones para los trastornos psiquiátricos.
Desde la introducción del DSMIII en 1980, A
La psiquiatría ha estado desarrollando una
taxonomía de categorías para identificar a los pacientes, presumiblemente bajo el supuesto de que los pacientes
que caen en la misma categoría deberían requerir un tratamiento similar. Aunque estas categorías parecen ser
confiables en el sentido de que diferentes psiquiatras tienden a categorizar a los pacientes de ejemplo en
categorías similares (es decir, están de acuerdo en cómo son las categorías), estas categorías no han sido tan
2
buenas para identificar tratamientos para los pacientes.
En parte, esto se debe a que muchas de estas categorías son disyuntivas; están formadas por
subcomponentes vinculados por una relación “o”: si usted tiene el síntoma A o el síntoma B, entonces está en la
categoría C. 3 Si los dos síntomas incluidos en la categoría disyuntiva son ambos
confiables, entonces la combinación disyuntiva de ellos también será confiable.
*
Estoy en deuda con Larry Amsel de la Universidad de Columbia por nuestras discusiones sobre este tema.
El Manual diagnóstico y estadístico de los trastornos mentales es la guía de referencia para identificar
enfermedades psiquiátricas. La edición actual es el DSMIVTR (“TR” significa “revisión del texto”), y el DSMV
está en proceso. El otro manual importante utilizado por los médicos para la identificación de trastornos
1
psiquiátricos es la Clasificación Internacional de, conocida como CIE10.
Enfermedades.
199
Machine Translated by Google
Esta categorización disyuntiva se puede observar en el predominio de categorías del DSM basadas en la suma
de síntomas. En el DSMIVTR, el diagnóstico de ludopatía se puede realizar si el paciente tiene cinco o más
de diez criterios. Esto significa que dos personas pueden ser identificadas como ludópatas aunque no tengan
síntomas en común. El hecho de que las categorías sean fiables no implica que sean válidas , es decir, que
digan algo sobre el mecanismo compartido. 4 ,
El otro problema con las categorías identificadas en el DSM es que se basan en síntomas. Como todo el
mundo sabe, un síntoma determinado puede ser causado por cualquiera de una serie de posibles problemas
subyacentes. Imaginemos a un paciente que llega a un hospital con dolor en el pecho. Imaginemos que el
médico le dice al paciente: “Una cierta proporción de pacientes con dolor en el pecho requieren una cirugía a
corazón abierto y una cierta proporción de pacientes con dolor en el pecho responden bien a un antiácido, así
que probaremos ambos”. Obviamente, el tratamiento tendría más éxito si diferenciáramos de forma fiable a
B
los pacientes que están sufriendo ataques cardíacos de los pacientes que tienen indigestión.
A veces, la única opción disponible es curar el síntoma. Para un médico que mira a un paciente que acaba
de perder una pierna por la explosión de una mina terrestre, no hay nada que hacer en ese momento excepto
tratar la herida y eventualmente proporcionar una pierna mecánica de reemplazo. De manera similar, la
incapacidad para iniciar el movimiento (acinesia) y la lentitud para iniciar el movimiento (bradicinesia) observadas
en la enfermedad de Parkinson se deben a la pérdida de Así como sería genial abordar las causas subyacentes
6
células de dopamina en el cerebro. que colocaron la mina terrestre en el campo 7 ( No voy a estudiar la
guerra nunca más ), sería genial prevenir la pérdida de neuronas de dopamina en primer lugar. Sin embargo,
la única opción de tratamiento para un paciente que presenta la enfermedad de Parkinson es tratar los
síntomas, ya sea aumentando la dopamina disponible para las células supervivientes (como a través de
precursores de dopamina como la levodopa o mediante intentos de reemplazar las células perdidas) o
permitiendo que el cerebro eluda lo que sea que las células de dopamina estuvieran proporcionando (como se
hace en la estimulación cerebral profunda). 8
De manera similar, a veces el tratamiento adecuado consiste en evitar que los síntomas causen demasiado
daño al organismo y permitir que éste se cure por sí solo. Son los síntomas provocados por el cólera los que
matan, no la enfermedad en sí. La rehidratación es un tratamiento fiable que cura eficazmente la enfermedad
9
al tratar los síntomas.
En este punto, se reconoce que hay un problema en psiquiatría, pero los profesionales aún están
debatiendo cómo reestructurar la taxonomía para poder llegar a los mecanismos que conocemos, teniendo en
cuenta al mismo tiempo el hecho de que hay muchos mecanismos que no conocemos, todo ello mientras
seguimos haciendo lo mejor que podemos para tratar a los pacientes, muchos de los cuales necesitan ayuda
10
desesperadamente.
Parece estar surgiendo un nuevo campo de la psiquiatría computacional para hacer realidad
Conexiones. estos 11 El término pretende invocar el uso de constructos teóricos (como los que hemos
estado explorando en este libro) para redefinir las categorías y el tratamiento propuesto para los trastornos
psiquiátricos.
La pregunta que se plantea es, entonces, ¿cuáles son los mecanismos y las causas que subyacen a la
enfermedad psiquiátrica? ¿Qué es la depresión? ¿Qué la impulsa? ¿Qué es la esquizofrenia? ¿Cómo la
definimos? ¿Qué es un trastorno de ansiedad? La psiquiatría ha identificado muchos trastornos psiquiátricos diferentes.
B
En realidad, puede resultar difícil diferenciar el dolor de pecho de un ataque cardíaco del dolor de pecho de
una indigestión sin un ECG, 5 por lo que no se debe intentar diagnosticar uno mismo en casa. Por supuesto, esto
solo pone de relieve la cuestión de comprender las causas y los mecanismos, en lugar de solo los síntomas, y de
contar con pruebas clínicas que puedan diferenciar de manera confiable esas causas.
Machine Translated by Google
Enfermedades: el DSMIVTR tiene más de mil diagnósticos diferentes. ¿Cuántos de ellos son la misma
disfunción que se manifiesta de diferentes maneras? ¿La “fobia social” (miedo a estar en sociedad) es el
mismo trastorno o un trastorno diferente que la “agorafobia” (miedo a lugares donde escapar o recibir ayuda
puede ser difícil)? ¿Cuántos de estos son disfunciones diferentes que se manifiestan como un único síntoma?
(Véase nuestro análisis de la adicción en el capítulo 18.)
Los trastornos de ansiedad, por ejemplo, implican un miedo patológico a emprender acciones en
situaciones específicas. En los seres humanos, la ansiedad se manifiesta en términos de miedo y preocupación
por los resultados futuros. En los animales, la ansiedad se manifiesta en conductas observables de evitación
y miedo. 12 Los circuitos y las estructuras cerebrales implicadas son similares en los experimentos de
“postura de estiramiento y acción” es muy similar a la conducta de ensayo y error indirecto que vimos en el Capítulo 6. Al igual que la conducta de
ensayo y error indirecto, la conducta de postura de estiramiento y acción 16 Esto sugiere que depende del hipocampo, la corteza prefrontal y su
vacilación probablemente implica predicciones de peligros futuros. Por supuesto, las ratas y los ratones son animales de interacción. que esta
presa y los peligros realmente acechan en cada esquina . Los humanos generalmente están en la cima de la cadena alimentaria y tienden a no
Generalmente los humanos están más preocupados por los peligros sociales, pero la misma respuesta al
Parece que hay mecanismos implicados.18 estrés Los ataques de ansiedad pueden provenir de una variedad
de fuentes, incluidas las interacciones sociales (como hablar en público), el futuro financiero, el peligro
personal, el peligro para los amigos o la familia, la disponibilidad de escape y rescate (en la claustrofobia y la
agorafobia) e incluso circunstancias raras (como terremotos o derrumbes de edificios).
El DSMIVTR considera el TEPT como una forma de trastorno de ansiedad; ciertamente, la descripción del
corazón del soldado suena como un ataque de pánico. 19 Como otro ejemplo, ahora se considera que la
ansiedad desempeña un papel importante en el trastorno obsesivocompulsivo (TOC). Curiosamente, el TOC
parece ser una combinación de un trastorno de ansiedad sobre peligros futuros combinado con una
20
incertidumbre sobre el recuerdo de acciones completadas.
Se están empezando a construir modelos computacionales para explicar el miedo y la ansiedad. Si bien
aún no han dado lugar a cambios en el tratamiento, hay un consenso en cuanto a los mecanismos
subyacentes. Ya hemos hablado de la adicción, el juego y el trastorno de estrés postraumático en los
capítulos anteriores. De manera similar, se están empezando a abordar otras enfermedades psiquiátricas
21
mediante modelos computacionales, por ejemplo, la depresión, la esquizofrenia y otros trastornos.
Hay una serie de trastornos psiquiátricos importantes que no están relacionados con sistemas de
selección de acciones individuales, sino más bien con sistemas de interacción social; por ejemplo, el
trastorno límite de la personalidad y la sociopatía o psicopatía . 22 Estas disfunciones interactivas
Excepto quizás en Twin Peaks, Donde los búhos no son lo que parecen.
do 17
Machine Translated by Google
Implican a personas que no muestran interacciones sociales normales. Dejaremos de lado estas
cuestiones interactivas hasta que podamos abordar la neuroeconomía , la teoría de juegos , la
propensión de los humanos a organizarse en grupos y los mecanismos a través de los cuales se
mantiene la cooperación dentro de esos grupos (en los capítulos 22 y 23).
Con todos estos ejemplos (como con todos los trastornos psiquiátricos), hay una cuestión
importante: es extremadamente difícil definir la línea entre la normalidad y la disfunción. 23 En
los últimos años se ha debatido mucho sobre el sobrediagnóstico del trastorno por déficit de
atención e hiperactividad (TDAH). 24 ¿Dónde está la línea entre un niño revoltoso que no tiene
tiempo para correr todos los días y el TDAH? ¿En qué medida se utiliza el TDAH como diagnóstico
para controlar las aulas superpobladas? De manera similar, ¿es realmente cierto que uno de cada
diez estadounidenses está deprimido? (En 2008, el 10% de los estadounidenses tomaba
medicación antidepresiva, presumiblemente en su mayoría inhibidores selectivos de la recaptación
de serotonina [ISRS]). 25 ¿Con qué frecuencia se utilizan estos ISRS para aumentar la confianza
26
y en qué medida se utilizan para tratar el duelo normal?
Por otra parte, es importante reconocer que hay personas con disfunción psiquiátrica grave
que necesitan ayuda desesperadamente. La depresión verdadera y el duelo normal son
28
Cosas muy diferentes. El suicidio es la décima causa principal de muerte en los Estados Unidos.
De manera similar, mientras que a algunos niños revoltosos se les puede diagnosticar
incorrectamente TDAH y tratarlos con Ritalin, hay otros que realmente tienen un problema y para
quienes el Ritalin es la diferencia entre obtener una educación o no. La tricotilomanía (arrancarse
el pelo) no tiene que ver con la niña de 10 años que hace girar su cabello nerviosamente mientras
arrastra los pies y te sonríe tiernamente, ni con arrancarse esa primera cana. La tricotilomanía 29
con personas que se han arrancado la cabeza hasta quedar calvas y con el cuero tiene que ver
cabelludo ensangrentado. Personas con disfunción grave que sí necesitan ayuda.
En este momento no tenemos respuestas claras. Aunque no se trata de un problema nuevo y
se ha reconocido como un problema dentro de la psiquiatría durante muchosaños, 30 parece que
se está produciendo un cambio en el que se están identificando las conexiones entre los
Cuáles son estos mecanismos, dónde
mecanismos neurocientíficos y la disfunción psiquiátrica.
están las disfunciones graves y cómo tratarlas son todas preguntas abiertas que se están
explorando activamente dentro de las comunidades neurocientífica, psicológica y psiquiátrica.
PARTE CUATRO
LA CONDICIÓN HUMANA
Machine Translated by Google
22
Los seres humanos somos animales con capacidades únicas, sobre todo en los ámbitos
del lenguaje, la imaginación y la cultura. Sin embargo, al igual que nuestros cuerpos
Me fascina la historia y me encanta viajar y ver las antiguas ruinas de grandes civilizaciones.
He estado en las murallas de Troya y he contemplado las llanuras de Hisarlik, donde alguna vez estuvieron Aquiles y Odiseo.
He estado en el escenario de la antigua ciudad griega de Mileto y me he sentado en las gradas del estadio romano de Éfeso.
Siempre me fascina lo mucho que permanece constante. Las fortificaciones defensivas de un castillo medieval en Japón
(como el castillo de Himeji) son similares a las de una fortaleza medieval europea (como el castillo de Harlech, en Gales).
Los componentes de un antiguo estadio romano son inmediatamente reconocibles para cualquiera que haya asistido a un
estadio deportivo moderno: las filas de bancos (numeradas y etiquetadas por fila), incluso los puestos de comida. De manera
similar, podemos apreciar narraciones de todo el mundo. El lector moderno reconoce la petulancia de Aquiles ante las
demandas de Agamenón en la Ilíada de Homero y el agotamiento de Odiseo impulsado por la guerra en la Odisea .
El tramposo Anansi sigue cautivando la imaginación de los niños, 1 y las aventuras de D'Artagnan y
los tres mosqueteros 2 siguen despertando el interés de niños y niñas de todo el mundo. Ya se trate de los grafitis en la
pared del dormitorio de los chicos en Priene (una ciudad en ruinas en Turquía) o la forma de los asientos del consejo en
Wupatki (en el norte de Arizona), reconocemos interacciones humanas familiares en nuestros ancestros antiguos. Algo es
constante a través de los tiempos, algo que nos permite mirar un conjunto de dibujos en las paredes de la cueva de Lascaux
Sin duda, existe una diferencia cualitativa entre los seres humanos y los demás animales que se han mencionado en
este libro. Los castores pueden crear diques de madera que modifiquen su entorno local, pero nunca han puesto a un
205
Machine Translated by Google
Como se puede ver en todo este libro, nuestro sistema de toma de decisiones, al igual que nuestros cuerpos
físicos, contiene ecos de nuestros primos mamíferos. Si evolucionamos a partir de los animales, ¿en qué nos
diferenciamos de ellos? Incluso la frase “evolucionamos a partir de los animales” implica una trayectoria de los
animales a los humanos, con los humanos por encima y más allá. Una mejor afirmación sería que somos parte
de la historia evolutiva, un momento en el tiempo evolutivo.
No evolucionamos a partir de animales: nosotros también somos animales.
Hay muchos rasgos de los seres humanos que parecen únicos entre los animales. Ningún otro animal tiene
habilidades lingüísticas como las nuestras. (Aunque ha sido posible enseñar a algunos animales los rudimentos
del lenguaje, ninguno de ellos ha alcanzado nunca habilidades lingüísticas más allá de las de un niño pequeño.
4 ) La complejidad de las ciudades que construimos y nuestras especializaciones individuales dentro de ellas
no tienen paralelo. (Aunque las termitas y otros insectos sociales también construyen grandes colmenas, estas
están formadas por un número limitado de individuos específicos. 5 ) Y parece que estamos en castas y no nos
parecemos a la flexible
complejidad de las ciudades humanas. destruyendo nuestro ecosistema a una velocidad
6
sin precedentes. Sin embargo, como bien señala Matt
,
Ridley en El gen ágil, muchas especies son únicas. Las termitas construyen en el barro, los calamares expulsan
tinta y las cobras escupen veneno. No basta con ser únicos. La pregunta es: ¿qué nos hace únicos?
Jane Goodall, que ha estudiado una tribu de chimpancés en Gombe durante los últimos 50 años, se quejaba
de que cada vez que encontraba a sus chimpancés mostrando signos de lo que nos hace... Al principio, los
7 humanos éramos usuarios de herramientas.
Humanos, los filósofos cambiarían los postes de la portería.
Pero ya en la década de 1920, el psicólogo Wolfgang Köhler descubrió que los simios podían aprender a apilar
cajas a propósito para encontrar una recompensa. 8 En el campo, Jane Goodall observó
9
Chimpancés que usan ramitas para sacar hormigas y termitas de los tocones de los árboles.
En aquel entonces, los humanos eran los únicos que fabricaban herramientas, pero luego Goodall
observó que los chimpancés fabricaban sus propias herramientas: encontraban el palo adecuado, lo ,
otras especies limpiaban y preparaban el objeto. 10 (Ahora se sabe que las nutrias, los cuervos y muchas
también utilizan herramientas. Las nutrias utilizan rocas para abrir erizos de mar y se ha descubierto que
los
cuervos fabrican herramientas con ramitas y hojas para pescar insectos. 11 )
Luego se sugirió que los humanos son los únicos que han desarrollado culturas separadas. Pero las tribus
de chimpancés utilizan diferentes herramientas para obtener alimentos. En el bosque de Tai, en Costa de Marfil,
una tribu de chimpancés utiliza piedras para romper nueces de cola (que tienen una cáscara muy dura). Los
chimpancés de la tribu Gombe no saben cómo utilizar piedras para romper la nuez de cola.
12
Las nueces y los chimpancés de la tribu del bosque Tai no saben pescar termitas.
Estas diferentes habilidades se transmiten culturalmente de un chimpancé a otro.
Incluso se han observado las habilidades culturales a medida que se fueron descubriendo. En la década
de 1960, los monos macacos japoneses comenzaron a lavar batatas en el océano para eliminar la suciedad y
agregar sal. 13 La habilidad se propagó primero del descubridor (una hembra joven) a otras que conocía, y
luego a los demás miembros de la tribu. Siguió rastros de parentesco, paternidad y entrenamiento.
Observaciones posteriores de comportamientos culturales han demostrado que generalmente se propagan a
través de la celebridad y el dominio, de modo que los primates de rango superior (que son observados de cerca
14
por los de rango inferior) difunden el meme más rápido que los primates de rango inferior.
Así, otros animales muestran el uso de herramientas y otros primates tienen presencia de cultura (o al
menos un precursor de la cultura). ¿Qué hace que los humanos sean diferentes?
Una sugerencia ha sido que los humanos son los únicos que piensan en otros lugares y otros tiempos, para
(por así decirlo) “viajar mentalmente en el tiempo”. 15 Pero, como hemos visto, las ratas muestran conductas
de búsqueda al tomar decisiones y parecen representar expectativas de la
Machine Translated by Google
comida, pueden tener en cuenta cuánto tiempo esa comida seguirá siendo comestible y pueden tener en cuenta la probabilidad de que otro arrendajo
sepa dónde está escondido el escondite de comida. 17 Tanto los monos como las ratas pueden representar opciones alternativas que podrían haber
existido cuando cometen errores (como en “podría haber obtenido una recompensa si hubiera elegido la otra opción”). 18
Dicho esto, no está claro que los arrendajos puedan mantener una memoria episódica más allá de
los escondites de comida, 19 que los monos o las ratas puedan imaginar futuros o pasados muy lejanos,
o que la cultura de los chimpancés se extienda al tipo de historias narrativas que nos contamos a nosotros
mismos. Sospecho que la diferencia va a ser que las diferencias cuantitativas se conviertan en
cualitativas. Sin embargo, las cosas que nos hacen humanos tienen sus raíces en nuestra historia
20
evolutiva.
Observaciones cuidadosas han demostrado que otros animales juegan, ríen, pelean e incluso montan
lo que, a falta de otra terminología, solo puede llamarse guerras. 21 Y, sin embargo, hay diferencias.
Tenemos una flexibilidad en nuestros sistemas de toma de decisiones que va mucho más allá de lo que pueden hacer otros animales. Nos
comunicamos con un lenguaje infinitamente flexible y capaz de transmitir una gran profundidad de significado. Podemos trabajar juntos en grupos
más grandes y complejos que otras especies. En particular, nuestros grupos van y vienen. Somos capaces de cambiar de grupo con el contexto más
Nuestra identidad social puede ser extraordinariamente dinámica y flexible. Tenemos familias
extensas, tribus y naciones, pero también grupos basados en los lugares donde trabajamos, nuestras
A
iglesias, mezquitas y templos, y nuestros equipos deportivos y partidos políticos. Las
personas que trabajan juntas como parte del mismo grupo en un contexto (en un trabajo o animando a
un equipo deportivo) pueden disolverse en la ira y en discusiones insolubles en otro contexto (como la
política). 25
que tiene
primer lugar, varias puede
el lenguaje propiedades importantes
comunicar que pueden
información explicar nuestras diferencias. En
muy detallada
(como planes o instrucciones) rápidamente.
26
En segundo lugar, puede
almacenar conocimiento fuera del individuo (como en libros o páginas web). 27 En tercer lugar, el
28
lenguaje proporciona una red social interactiva y marca nuestro lugar dentro de ella.
A menudo utilizamos el lenguaje como acciones en sí mismas. 29 Una persona que dice “Sí,
quiero” en su boda se compromete a cumplir un acuerdo contractual específico. Como señala
, , un matrimonio es un contrato entre tres
Orson Scott Card en su novela Speaker for the Dead
partes: las dos personas que se casan y la comunidad que acepta tratarlas como casadas. 30 El
lenguaje
también puede utilizarse para construir sobre sí mismo: una persona puede proporcionar parte
de la respuesta y otra puede construir sobre
31ella.
Ésta es la mal llamada “sabiduría” del grupo, que no es
tanto sabiduría (los grupos pueden ser muy imprudentes) sino más bien un proceso positivo de
retroalimentación del conocimiento.32 Uno de los principales avances que condujeron a la revolución
científica y a nuestro mundo moderno fue el desarrollo de la revista científica.
A
En uno de los desastres más extraños que he presenciado, la política se ha convertido en una cuestión
deportiva sobre quién gana, en lugar de una cuestión política sobre qué es lo correcto. Esto ha llevado al tribalismo
político, en el que el líder de un partido puede decir públicamente que está más interesado en que el líder del
otro partido pierda la presidencia que en solucionar los problemas que enfrenta su24país.
Machine Translated by Google
En el siglo XVII. B
Un artículo científico informa sobre un único resultado o hallazgo y, aunque generalmente es
una historia completa, no tiene por qué responder por completo a todas las preguntas que puedan surgir. Antes
de las revistas científicas, la ciencia se informaba en libros y monografías, que requerían décadas para escribirse.
Esto significaba que otros científicos no podían seguir el trabajo de uno hasta que estuviera completo. Al
proporcionar un medio para informar sobre una respuesta parcial, las revistas científicas permitían a los científicos
indicar a otros científicos la dirección correcta, poner un solo ladrillo en el edificio de la ciencia en lugar de tener
que construir un edificio entero por sí solos.
La otra cosa que el lenguaje puede hacer es señalar. El lenguaje nos permite coordinar nuestras acciones.
33
objetivos y coordinar nuestra atención. obtener Puede señalar una dirección, identificar un peligro, un objetivo.
un resultado. El nivel en el que otros animales pueden rastrear referentes aún es objeto de debate, pero no
parecen rastrearlos tan fácilmente como los humanos. Por ejemplo, los humanos somos el único simio con
esclerótica blanca, lo que permite a los demás saber dónde estamos mirando.
34 Gran parte de nuestra interacción social se basa en saber dónde está la otra persona 35 (Por
mirando. Tomemos, por ejemplo, la importancia del contacto visual en una conversación. Saber supuesto,
dónde está mirando alguien no siempre es algo bueno, como lo sabe cualquier mariscal de campo de la NFL
interceptado).
Sin embargo, fundamentalmente, una de las mayores diferencias entre los humanos y otros
36
Los animales se encuentran en lo que tradicionalmente se ha llamado Jane Goodall observó la sociología
moralidad . La ética en sus chimpancés, una madre y su hija (llamadas Passion y Pom) desarrollaron un
procedimiento caníbal para atacar a las nuevas madres y sus bebés, donde una de ellas distraía a la nueva
madre y la otra atacaba y mataba al bebé. 37 Si una de ellas
El macho grande estaba en la zona, él defendería a la nueva madre y al bebé, pero los machos no atacaron a
Passion y Pom fuera del contexto de su crimen. Los humanos no toleran a esos sociópatas.
38
Todavía no se sabe si la diferencia es un salto cualitativo (un cambio de tipo que se puede separar
claramente) o simplemente el efecto repetido de pequeños cambios cuantitativos (cambios de nivel o profundidad).
Sin embargo, algo es diferente. Las termitas pueden construir montículos, y otros animales pueden construir
nidos de increíble complejidad, pero esos montículos no son ciudades a escala de Nueva York, Tokio o
Alejandría. Los chimpancés pueden luchar en guerras, pero esas guerras no incluyen ametralladoras, tanques o
bombas nucleares. Los pájaros jardineros pueden crear arte, pero ese arte no se difunde ni se discute entre
millones de pájaros jardineros en todo el mundo. Los babuinos pueden vivir en grupos, pero esos grupos no se
agregan como amigos en Facebook.
Se han producido debates fascinantes sobre cuán inteligentes son algunas especies.
Los elefantes tienen sociedades altamente complejas, calculan expectativas sobre la disponibilidad de
fruta y agua en función de patrones climáticos recientes y recuerdan a sus muertos durante años . 39 Los
las ballenas
monos vervet mienten acerca de atacar a los depredadores para escapar de los agresores. 40 Y
B La primera revista científica fue Philosophical Transactions of the Royal Society , que ha estado
publicando artículos científicos desde 1665, incluidos los primeros informes científicos de Newton, Darwin y otros.
C Por supuesto, es discutible si esto es bueno o no. Como señala Douglas Adams en su clásico La guía
del autoestopista galáctico , “el hombre siempre había asumido que era más inteligente que los delfines
porque había logrado mucho (la rueda, Nueva York, guerras, etc.), mientras que los delfines lo único que
habían hecho era jugar en el agua y divertirse. Pero, a la inversa, los delfines siempre habían creído que
eran mucho más inteligentes que el hombre, precisamente por las mismas razones”.
Machine Translated by Google
y los delfines cantan canciones increíblemente complejas que dependen de sus interacciones culturales y sociales.
41
Aunque algo puede ser diferente en los humanos, las cosas que fundamentalmente nos
hacen humanos, nuestro lenguaje, nuestras mentes y nuestros sistemas de toma de decisiones, al igual
que nuestros cuerpos físicos, comparten puntos en común con nuestra naturaleza animal y derivan de ella.
En los próximos dos capítulos exploraremos dos de esas singularidades: la moralidad y la conciencia.
23
La ciencia de la moral
En gran parte del debate actual, se dice que la moral está fuera del
ámbito de la ciencia porque la ciencia es descriptiva, no prescriptiva.
En pocas palabras, esto significa que la ciencia no puede decirnos qué
hacer. Aunque sin duda existe una diferencia clara e importante entre
descripción y prescripción, las implicaciones de la ciencia de la toma de
decisiones para la moral son más complejas de lo que parece a primera vista.
Descripción y prescripción
Todo el mundo está de acuerdo en que existe una diferencia filosófica fundamental entre descripción
y prescripción . En las famosas palabras de David Hume, hay una diferencia entre la
“debería ser”). 1 descripción y lo que sucederá. (Si dejamos de lado ese pesado “es” y
(Si la piedra cae sobre tu pie, te dolerá.) La receta es lo que debes hacer. (¡No dejes caer esa piedra
sobre tu pie!)
Esta distinción es muy clara en la medicina moderna. La descripción es el efecto del tratamiento
(los antibióticos son ineficaces contra los virus, las bacterias evolucionan en respuesta a los
antibióticos). La prescripción es lo que debemos hacer para tratar la enfermedad (si tienes una
infección bacteriana, los antibióticos son una buena idea, pero si tienes una infección viral, no uses
antibióticos porque solo estás ayudando a que las bacterias del mundo desarrollen resistencia a ellos).
La ciencia es fundamentalmente descriptiva. La ciencia es un método para determinar la causalidad.
A Necesitamos un término diferente.
Estructura del mundo a través de la predicción y la replicación.
A Las complejas cuestiones de la sociología de la ciencia y de si la ciencia funciona mediante la refutación explícita no son
2
O bien, mediante la construcción de marcos importantes para el debate aquí.
integrados, existen muchos libros sobre este tema. Mi favorito es Just a Theory , de Moti BenAri. En cualquier
caso, digamos simplemente que, a largo plazo, nuestro control del mundo ha mejorado porque las teorías
científicas se han convertido en descripciones más precisas de la realidad a lo largo de los siglos.
211
Machine Translated by Google
sobre cómo tomar decisiones prescriptivas entre individuos y grupos que están en desacuerdo.
B
Éstas son cuestiones de política y el mejor término, creo, es política . Decir que las decisiones
prescriptivas son cuestiones fundamentalmente políticas no implica que dependan de la afiliación
partidaria de uno (política con P mayúscula) o de lo específico de lo que se escribe en las leyes (la
moralidad no es legalidad); estamos hablando de política con p minúscula: ¿cómo interactúan los
humanos con otros humanos y con sus sociedades? Como veremos a continuación, los humanos se
organizan espontáneamente en estructuras políticas con p minúscula para manejar sus interacciones
3
sociales, y gran parte de esa política con p minúscula son construcciones sociales no escritas.
Como veremos, el papel de la política con p minúscula se hace evidente cuando no estamos de
acuerdo sobre los objetivos. Si un niño quiere jugar al baloncesto con su padre al aire libre y el otro
quiere jugar a un juego de ordenador con su padre dentro, tiene que haber alguna negociación para
establecer una distribución justa del tiempo del padre. De manera similar, una empresa puede denunciar
las normas que le impiden abrir nuevas tiendas y nuevos mercados, mientras que otros exigen esas
normas para garantizar un principio deseado a nivel local. O puede ser necesario tomar una decisión
sobre si se debe arriesgar a buscar petróleo en zonas frágiles de cría de camarones. Obsérvese que
en estos ejemplos he sido muy cuidadoso para no hacer ninguna afirmación sobre lo que está bien y lo
que está mal; sólo he mostrado ejemplos en los que los objetivos difieren y se requiere negociación. Lo
que está bien y lo que está mal en cada uno de estos ejemplos probablemente dependerá de los
detalles de la situación. Por ejemplo, hay una gran diferencia si esas normas impiden a la empresa
verter residuos tóxicos en el agua potable de una ciudad vecina o si esas normas establecen que sólo
los blancos pueden ser propietarios de empresas.
La afirmación de que los objetivos difieren no implica que ambas partes sean moralmente
equivalentes (los miembros de un bando pueden decir que su objetivo es exterminar a todas las
personas de una determinada etnia, mientras que el otro bando puede decir que quiere que ambos
vivan en paz). De manera similar, la afirmación de que se requiere negociación no significa que haya
que llegar a un acuerdo: en la Guerra Civil estadounidense y la Segunda Guerra Mundial, la
“negociación” entre dos códigos morales opuestos (esclavitud o no, fascismo y genocidio o no)
implicaba que las dos partes libraran una guerra.
Hay tres literaturas que han intentado reivindicar el control del magisterio prescriptivo:
Teoría de la moral: religión, filosofía y economía.
Religión
En la separación entre “ser” y “debería ser”, la moral se considera a menudo como competencia de la
4
religión y la filosofía. Stephen Jay Gould defendió célebremente lo que llamó “NOMA”,
o magisterios no superpuestos , y trató de definir la diferencia entre ciencia y religión como
“magisterios” diferentes (diferentes reinos del pensamiento).
La religión podría seguir centrándose en lo que deberíamos hacer, mientras que la ciencia podría seguir
centrándose en lo que sucede cuando hacemos algo. La religión podría centrarse en el significado, mientras
que la ciencia podría centrarse en el mundo físico. La religión podría centrarse en el por qué , mientras que la
ciencia podría centrarse en el cómo .
B
Estoy en deuda con Peter Collins, de la Universidad de Salford, cuya presentación en una pequeña conferencia
organizada por Don Ross en 2007 aclaró esta distinción con una frase sencilla y sorprendente: “La ciencia trata de lo
que sucede cuando hacemos algo. La política trata de lo que deberíamos hacer, dado que no estamos de acuerdo
sobre nuestros objetivos”.
Machine Translated by Google
La separación entre prescripción y religión se puede ver en George Bernard Shaw, donde
y el Superhombre preobra , varios de los personajes rechazan el objetivo (rechazando el Hombre
la prescripción pero no la descripción) y deciden que prefieren ir al Infierno que sufrir en el Cielo.
, , Lucifer dice la famosa frase: “Es mejor
De manera similar, en El Paraíso Perdido de Milton
gobernar en el Infierno que servir en el Cielo”. Podemos decir que estas personas están
equivocadas, que han tomado las decisiones equivocadas (en Milton eso está claro, en Shaw no
tanto), pero el hecho de que un cambio en los objetivos cambie la moralidad implícita en la creencia
religiosa deja en claro la inadecuación de la religión como magisterio prescriptivo.
Algunos códigos morales no sobrenaturales se mencionan a menudo bajo el epígrafe de
8
como el confucianismo, el taoísmo y el utilitarismo. religión. Sin embargo, estos son en
realidad ejemplos de funciones de optimización: el objetivo declarado del confucianismo es
maximizar la estabilidad dentro de una sociedad, mientras que el taoísmo apunta a la "paz interior"
y la armonía con el entorno, y el utilitarismo intenta maximizar la felicidad total. Se trata de
afirmaciones prescriptivas: definen un objetivo a optimizar y dicen que "debemos" hacer cosas
que maximicen ese objetivo. El análisis de las funciones de optimización nos lleva primero a la
filosofía y luego a la economía.
Filosofía
Históricamente, los filósofos han estado buscando un imperativo categórico, una declaración simple
que pueda usarse para definir la moralidad a partir de los primeros principios.9 El ejemplo clásico es, por
supuesto, la Regla de Oro: “Haz a los demás lo que te gustaría que te hicieran a ti”, con versiones en la Torá, el Nuevo Testamento y las Analectas de
Confucio. 10
C Estas afirmaciones no pretenden dar a entender que la religión no sea una construcción humana útil. La
religión podría servir para muchos propósitos útiles, entre ellos, como consuelo o como medio para organizar
grupos humanos con el fin de reforzar el altruismo dentro del grupo. La religión también puede servir como una
construcción psicológica para imponer la moralidad y fomentar el autocontrol, pero el contenido de esa moralidad y
los objetivos de ese autocontrol derivan de mecanismos no religiosos. 5
Machine Translated by Google
La complejidad de esto es interesante porque las versiones difieren en términos de si están redactadas
en términos positivos ( Haz a los demás lo que te gustaría que te hicieran a ti ) o negativos ( No hagas a
los demás lo que no te gustaría que te hicieran a ti ).
Se han propuesto muchos imperativos categóricos de este tipo, pero, como señala Patricia, siempre
Churchland en su libro BrainTrust , ha sido posible encontrar situaciones extremas que los
debilitan. Aplicar la regla a situaciones reales exige excepciones, y terminamos con una mezcolanza de
reglas y regulaciones. Por ejemplo, la afirmación de que deberíamos aumentar la felicidad total en el
mundo sugiere que uno tendría que sacrificar la comida de sus hijos para alimentar a los niños
hambrientos de otros lugares. Si bien podemos celebrar a alguien que trabaja incansablemente por los
niños hambrientos, no hay muchas personas que estén dispuestas a dejar que su propio hijo muera de
hambre por el de otro, incluso por otros dos.
De la misma manera, la afirmación de que debemos hacer a los demás lo que nos gustaría que nos
hicieran a nosotros si fuéramos esa otra persona conduce a situaciones problemáticas frente a prejuicios
fanáticos. Imaginemos a alguien que dice que preferiría morir antes que vivir parapléjico.
Obviamente, no querríamos que esa persona cumpliera sus deseos imaginarios con otra persona
paralizada. De hecho, los pacientes parapléjicos (e incluso tetrapléjicos) que quedan paralizados a
causa de un accidente tienden a volver a los mismos niveles de felicidad que tenían antes del
accidente. 11 (La felicidad se reajusta alostáticamente a la nueva situación.)
De nuevo volvemos a la cuestión política de ¿cómo negociamos diferentes objetivos?
John Rawls propuso una elegante propuesta basada en su teoría de la ignorancia de la posición original .
12 Rawls sugiere que las leyes y la justicia deben definirse de tal manera que sean las
leyes que a uno le gustaría ver, dado que no sabe dónde estará en la sociedad antes de escribir las leyes.
Por lo tanto, no querría hacer una ley que apoye la esclavitud porque no sabría de antemano si va a
nacer esclavo o libre. La propuesta de Rawls es una descripción filosófica de una solución política. Afirma
explícitamente que su objetivo es partir del supuesto de una democracia constitucional, del supuesto de
que todos los hombres (todas las personas) son creados iguales.
El problema de esta teoría es, por supuesto, que la gente no siempre está dispuesta a asumir que
podría haber empezado en cualquier parte de la sociedad. Las aristocracias, el seleccionismo religioso
y las diferencias en el talento individual pueden llevar a una renuencia a aceptar la premisa de Rawls. Las
personas no tienen el mismo talento. Algunas personas son más inteligentes que otras.
Algunas personas son más fuertes, otras son más reflexivas y otras más emocionales. Aunque estas
diferencias están influidas por la genética, son claramente una interacción entre esa genética y las
13
influencias sociales.
Como lo señaló Stephen Jay Gould en A Mismeasure of Man , Estos efectos genéticos son
notoriamente difíciles de medir con precisión, son peligrosamente susceptibles a las influencias culturales
y tienden a verse eclipsados por la variabilidad de esas influencias culturales. Sin embargo, es fácil para
un individuo exitoso (que generalmente es quien escribe las leyes) mirar a un individuo fracasado y decir
que la razón de la diferencia en el éxito es un fracaso moral. La propuesta de Rawls depende
fundamentalmente de la empatía, la capacidad de ponerse en el lugar del otro (un componente crítico de
los códigos morales tanto religiosos como filosóficos 14 ).
Puede resultar difícil decir: “Si no fuera por la gracia de Dios, no habría existido”. Las personas
15
amorales tienen dificultades explícitas con la empatía.
Una de las cosas que veremos más adelante, cuando
examinemos directamente lo que hace la gente, es que las personas tienden a estar menos dispuestas a
compartir si creen que han trabajado para obtener su recompensa. 16 Incluso si creemos en la premisa de
Rawls, todavía necesitaremos entender cómo negociar con individuos que no la creen.
Machine Translated by Google
Un campo que, de hecho, ha hecho afirmaciones “científicas” sobre la moralidad es la economía. Estas
afirmaciones han sido implícitas más que explícitas, pero debido a nuestra separación entre descriptivos
y prescriptivos, una cantidad notable de resultados económicos son prescriptivos más que descriptivos.
Esto se debe a que están definidos bajo una función de optimización.
La función de optimización más comúnmente utilizada en economía es la de eficiencia , que se
17
define como una economía sin oportunidades perdidas. Imaginemos que el país A
puede cultivar zanahorias por 10 dólares el bushel y apio por 20 dólares el bushel, mientras que al país
B le cuesta 20 dólares cultivar un bushel de zanahorias, pero sólo 10 dólares cultivar apio. Esto significa
que si cada país cultiva todas sus propias verduras, los dos países están desperdiciando dinero.
Son ineficientes . Sería más eficiente que el país A cultivara sólo zanahorias y que el país B cultivara
sólo apio, y que el país A intercambiara algunas de sus zanahorias con el país B por parte del apio
cultivado en el país B. Esto sería más eficiente incluso si el transporte de zanahorias y apio a través de
la frontera tuviera un pequeño coste. Si el transporte costara 1 dólar por fanega, entonces el país A
podría cultivar zanahorias por 10 dólares y apio por 11 dólares. Del mismo modo, el país B podría
cultivar apio por 10 dólares y zanahorias por 11 dólares.
Los economistas suelen analizar esto en términos de costes monetarios, pero obtenemos los mismos
resultados si pensamos en términos de fuerzapersona, cuántas horas se necesitan para lograr algo. El
país A cultiva zanahorias con menos trabajo que el país B, mientras que el país B cultiva apio con
menos trabajo que el país A. Juntos, pueden producir más alimentos con menos trabajo. Ésta es la
ventaja de la especialización.
Todo esto suena muy bien, pero supone que el objetivo de una economía es minimizar las
“oportunidades perdidas”. El efecto de este acuerdo de libre comercio entre los países A y B es que
los productores de apio del país A están ahora sin trabajo, al igual que los productores de zanahorias
del país B. Si su objetivo es maximizar los empleos, entonces este acuerdo es malo. El problema es
que los economistas utilizan palabras cargadas de moralidad como eficiencia o racionalidad .
18;D Un coche ineficiente que consume poco combustible es obviamente algo malo. ¿Una
economía ineficiente también es algo malo?
La suposición de que la eficiencia es el único objetivo es extraña. 20; mi A veces la
ineficiencia es un problema obvio, como cuando los costos y los precios de compra están demasiado
desequilibrados y la economía se paraliza, o cuando la corrupción elimina la producción económica
22
de una economía; pero, como sucede con un automóvil que consume poco combustible, la eficiencia
es en realidad solo un elemento de una función de optimización más compleja . 23
Hemos discutido el uso peligroso de la terminología de “racionalidad” e “irracionalidad” a lo largo de este libro, en particular la idea de
discusión en los capítulos 8 y 15.) Como espero haber dejado claro, me siento incómodo con este rechazo de los sistemas de toma de
La gente compra coches ineficientes porque les gustan las características de seguridad o la capacidad de
transportar objetos grandes (como muchos niños) o por su estilo y su apariencia.
De hecho, estas descripciones económicas de la maximización de la eficiencia son descripciones
deficientes de lo que los seres humanos realmente hacen, en particular a nivel microeconómico (individual),
y requieren muchos componentes adicionales para describir adecuadamente el comportamiento. 24
A nivel microeconómico, estas cuestiones de interacciones interpersonales pueden enmarcarse en el
contexto de la teoría de juegos , 25 que supone que dos personas están jugando un juego.
Se supone que este juego se especifica como una secuencia de opciones (acciones y sus consecuencias)
que conducen a un conjunto final de pagos. Cada situación es un nodo en un árbol, y cada acción lleva a los
dos jugadores de un nodo a otro. (Observe cómo este concepto de situación y acción refleja las definiciones
de toma de decisiones que hemos estado utilizando a lo largo de este libro). Un ejemplo clásico sería el juego
del tres en raya (Figura 23.1). Al comienzo, la situación tiene un tablero vacío. El jugador X tiene nueve
opciones. Cuando el jugador X pone una X en el tablero, la situación se vuelve un poco más complicada.
En uno de los cuadrados, el jugador O tiene ahora ocho opciones. Al final del juego, hay tres posibles pagos:
el jugador X gana y O pierde, el jugador O gana y X pierde, o hay un empate. (Se puede demostrar que si
ambos jugadores juegan de manera óptima, el tres en raya siempre terminará en un empate). La estrategia
se define como el conjunto de elecciones que un jugador haría en cada punto de la secuencia. (¿Qué debería
hacer el jugador X al comienzo del juego? [El centro es óptimo.]
¿Qué debe hacer el Jugador O cuando el Jugador X tiene dos seguidos? [Bloquearlo.])
Si ninguno de los jugadores puede mejorar su estrategia cambiando algo, entonces los jugadores están
en un equilibrio de Nash . 26;F El problema con esto es que no funciona en los juegos
cooperativos. (La prueba de optimalidad de Nash técnicamente era solo para juegos no cooperativos de
juegos cooperativos de prisioneros
suma cero ).. 28 Como veremos más adelante, en los juegos cooperativos (como los
incógnita
incógnita
Oh Oh Oh
... ... ...
incógnita incógnita
incógnita incógnita
Oh
...
Oh OOO
Oh Oh Oh BUEY
...
incógnita
Oh incógnita incógnita
incógnita
Figura 23.1 Teoría de juegos y tres en raya. Cada configuración del tablero de tres en raya es un estado .
La acción de cada jugador cambia el estado. El tres en raya es un juego de suma cero:
si el jugador X gana, el jugador O pierde, y viceversa. Compárese con el juego del dilema del
prisionero (Figuras 23.2 y 23.3).
El equilibrio de Nash debe su nombre a John Nash, el famoso matemático que lo descubrió como parte de
su tesis doctoral en 1950. Tanto las matemáticas de Nash como sus dificultades con la esquizofrenia se
27
describieron elocuentemente en el libro y la película Una mente maravillosa .
Machine Translated by Google
dilema , más abajo), un jugador puede mejorar sus ganancias al no cooperar, pero si ambos jugadores no
cooperan, entonces ambos lo hacen peor. De hecho, como veremos más adelante, las personas son
notablemente cooperativas, incluso cuando se establece explícitamente que los juegos solo se jugarán una
vez y cuando nadie sepa quién eres, de modo que no hay oportunidad de que la reciprocidad afecte la toma
29
de decisiones.
El resto de este capítulo planteará la pregunta ¿Qué hacen los humanos en sus interacciones?
En lugar de abordar la cuestión prescriptiva, dedicaré el resto de este capítulo a abordar lo que sabemos
sobre el comportamiento humano (descriptivamente). Así como conocer la descripción correcta mejora la
prescripción en medicina (véase el ejemplo anterior de los antibióticos), podemos esperar que una mejor
descripción del comportamiento humano nos ayude a saber qué prescripciones son posibles.
Así como en el Capítulo 18 dejamos de lado la cuestión de si tomar drogas es correcto
GRAMO
o incorrecto y, en su lugar, preguntamos ¿por qué la gente toma drogas? y ¿cómo podemos cambiar eso (si
queremos hacerlo)?, voy a dejar de lado la cuestión de qué es moral y, en su lugar, voy a preguntar ¿qué
hacen las personas cuando se enfrentan a cuestiones morales (sociales, de interacción personal)?
En esencia, lo que llamamos “moralidad” se refiere a nuestras interacciones con otras personas (y con
otras cosas, como nuestro entorno). Nuestras interacciones diarias se basan en una confianza social
subyacente (civilización). 32 Como se señaló en el capítuloanterior (donde analizamos lo que nos hace
humanos), estos grupos se organizan espontáneamente, ya sea para la protección mutua, para la estabilidad
social o porque los grupos bien organizados superan a los grupos mal organizados. En pocas palabras, si
dos ejércitos se enfrentan y uno trabaja en conjunto, pero el otro está formado por miembros egoístas, está
bastante claro qué grupo tendrá más probabilidades de ganar la batalla. 33
¿Qué significa eso para la moralidad? ¿Cómo puede la ciencia abordar la moralidad? ¿Qué significa
estudiar la moralidad? Sabemos que los seres humanos pueden ser gloriosamente morales (Martin Luther
King, los Freedom Riders, los soldados que sacrifican sus vidas por su país, los bomberos que corren hacia
un edificio en llamas, las donaciones a la caridad). Sabemos que los seres humanos pueden ser gloriosamente
inmorales (los nazis, el KKK, el genocidio en Ruanda, Serbia y Darfur). La primera pregunta que tendremos
que hacernos es ¿qué hacen los seres humanos cuando se enfrentan a una situación moral?
¿Qué hacen los seres humanos y cuáles son los parámetros que determinan sus decisiones de acción? Si
comprendemos cómo piensan los seres humanos sobre la moralidad, podremos decidir si queremos cambiarla
y, en caso afirmativo, cómo hacerlo.
Fundamentalmente, la moralidad tiene que ver con nuestra interacción con los demás. Al igual que con las
otras cuestiones que hemos abordado en este libro, para estudiar la moralidad necesitamos una
GRAMO
Es muy importante no caer en el error de la sociobiología. 30 El hecho de que algo sea descriptivamente cierto no
debe interpretarse como una indicación de que sea prescriptivamente bueno. Como se señala en la nota D del capítulo 13, si bien es cierto
que el esfuerzo que se requiere para la reproducción cambia la dinámica del riesgo y la inversión y, por lo tanto, explica muchas dinámicas
humanas observadas entre hombres y mujeres y la dinámica (invertida) de los caballitos de mar (donde el macho empolla los huevos en
una bolsa), 31 no se debe tomar este hecho como una prescripción de los roles masculinos y femeninos apropiados en la sociedad nosotros
moderna.
Machine Translated by Google
Una forma de tomar esas interacciones y llevarlas al laboratorio, donde podemos usar experimentos controlados
para estudiarlas. Los primeros intentos de estudios de moralidad se basaron en juegos de rol, donde los
cómplices pretendían estructurar el mundo de tal manera que impulsara ciertas conductas. Dos experimentos
tempranos muy famosos sobre moralidad fueron el experimento de obediencia de Milgram y el experimento de la
34
prisión de Zimbardo.
En el experimento de Milgram, se le dijo a un sujeto que debía desempeñar el papel de “maestro” mientras
que otro desempeñaba el papel de “alumno”. (El sujeto pensaba que el alumno era otro sujeto que también
participaba en el experimento y no sabía que el alumno era un actor). Los dos estaban separados por una pared,
de modo que no podían verse. El maestro le hacía preguntas al alumno (pares de palabras arbitrarios que el
alumno tenía que memorizar). Los “alumnos” daban respuestas incorrectas a muchos de los pares.
Cada vez que el alumno se equivocaba, el profesor tenía que presionar un botón que le daba una descarga
eléctrica. A medida que el alumno cometía más errores, el voltaje aumentaba hasta el punto de que el alumno
gritaba, golpeaba la pared, suplicaba que pararan y, finalmente, se quedaba en silencio. En realidad, no había
descargas eléctricas. El "alumno" era un actor que interpretaba un papel. Pero las descripciones de los sujetos
(que interpretaban el papel de "profesor") dejan muy claro que creían que el "alumno" era un actor que interpretaba un papel.
Los shocks fueron reales.
El experimento de Milgram suele interpretarse como una demostración de la falta de voluntad humana para
cuestionar a la autoridad; sin embargo, aunque muchos sujetos continuaron aplicando descargas eléctricas a
niveles máximos, muchos de ellos pidieron parar y continuaron sólo después de que se les aseguró que estaba
bien, incluso era necesario, continuar. Otros sujetos se negaron a aplicar descargas eléctricas más allá de ciertos
niveles. Durante los años siguientes, Milgram realizó docenas de variaciones del experimento tratando de
identificar qué haría que las personas fueran más o menos propensas a continuar. Las cifras variaron
drásticamente en función de la conexión física y emocional entre el maestro y el alumno y de la autoridad
inherente al experimentador que aseguraba al sujeto que los experimentos eran necesarios. Reexaminaciones
recientes de los datos originales sugieren que la garantía de que los experimentos eran "necesarios" era una
35
El componente crítico que impulsa la voluntad de los sujetos de continuar es la Lo más probable es que se trate de una combinación
presencia de ambos: una figura de autoridad que pueda convencer a uno de que los crímenes son necesarios
para una causa importante. Esta es una buena descripción de muchos de los peores males perpetrados por los
humanos entre sí (genocidio para "purificar la raza", tortura para "extraer información", etc.). La clave del
experimento de Milgram puede haber sido una figura de autoridad que afirma que el "experimento requiere que
continúes" e implica que no continuar arruinaría un importante esfuerzo científico.
En el experimento Zimbardo, a dos grupos de estudiantes universitarios se les asignaron arbitrariamente los
papeles de guardias y prisioneros en una cárcel simulada en el sótano de un edificio de psicología de la Universidad
de Stanford. En el transcurso de menos de una semana, los guardias se volvieron arbitrariamente violentos,
abusivos e incluso sádicos. Fue tan malo que el experimento se detuvo después de solo seis días, más de una
semana antes de lo previsto. El experimento Zimbardo suele considerarse una demostración de cómo las
estructuras de poder impulsan la deshumanización y el maltrato.
El problema con ambos experimentos es que abordan extremos y son experimentos únicos. Son muy difíciles
de reproducir y de utilizar para llegar a los mecanismos subyacentes de la conducta humana. Sin embargo,
ambos efectos ocurren claramente en la vida real. Por ejemplo, los casos recientes de tortura en la prisión de
Abu Ghraib son ejemplos tanto del efecto Milgram como del efecto Zimbardo. (Las investigaciones limitadas que
se han realizado sugieren que los soldados fueron empujados a crear un impacto negativo en la sociedad).
Machine Translated by Google
situaciones por figuras de autoridad del interrogador y luego fueron más allá y se deleitaron con la tortura
que estaban haciendo a medida que la autoridad moral se deterioraba. 36 )
Aunque son sumamente importantes, los estudios de Milgram y Zimbardo nos dicen lo que tememos
que ya sabíamos: los humanos a menudo son susceptibles a la autoridad (en particular, a una autoridad
camuflada en una causa), y los humanos a quienes se les da poder a menudo hacen un mal uso de él.
Pero la mayoría de las personas no viven sus vidas en estos extremos. Estos estudios, y los horrores de
Ruanda o Abu Ghraib, son extremos. Ciertamente, estas situaciones ocurren, pero la pregunta con
situaciones como los experimentos de Milgram y Zimbardo (o Ruanda, el Holocausto, Nanking, Abu
Ghraib) nunca es : ¿Están equivocados? Obviamente están equivocados; la pregunta es cómo evitar llegar
a ellos en primer lugar. Las contribuciones de los estudios de Milgram y Zimbardo han sido: ¿Cuándo son
susceptibles los humanos a las figuras de autoridad? ¿Qué los hace capaces de cuestionar esa autoridad?
(Recuerde que algunos sujetos en el experimento de Milgram cuestionaron al experimentador y detuvieron
el experimento y que otros sujetos estaban claramente incómodos y preguntaron si la otra persona estaba
bien y continuaron sólo después de que la figura de autoridad les aseguró que el experimento era
necesario. Un soldado estaba lo suficientemente incómodo con la situación en Abu Ghraib como para
filtrar las fotos a los medios.)
La repulsión que sentimos ante lo que es claramente malo (el abuso de niños por parte de figuras de
autoridad confiables en la Iglesia Católica o el abuso de prisioneros [incluidos niños inocentes] por parte
de soldados en Abu Ghraib o el asesinato de millones de inocentes en genocidios) identifica que el mal
existe en el mundo y que los humanos pueden hacer el mal, pero en realidad no nos ayuda a llegar a los
mecanismos de ese mal. De hecho, nuestras instituciones han demostrado su incapacidad para lidiar con
un mal de esa magnitud (por ejemplo, la incapacidad de la Iglesia Católica para llegar a un acuerdo con
los sacerdotes pedófilos, o la incapacidad del gobierno de los EE. UU. para llevar a los autores de los
incidentes de Abu Ghraib ante la justicia, o la incapacidad de las Naciones Unidas para detener los
genocidios en Ruanda, Bosnia o Darfur). El problema no es si podemos identificar el mal . Identificamos
de manera confiable el verdadero mal. El problema con el verdadero mal es lidiar con él.
yo
En nuestro
En cambio, la cuestión más difícil es la de la moralidad en nuestra vida cotidiana. En nuestra
vida cotidiana se nos dan oportunidades de hacer el bien y el mal: si damos o no un dólar a una persona
sin hogar en la calle, si copiamos o no en un examen o en nuestros impuestos. Para la mayoría de las
personas del mundo, nuestras vidas normales no se parecen ni a los horrores de Milgram ni a los de
Zimbardo. En su capítulo en el libro Moral Markets , Lynn Stout señala que pasamos la mayor parte de
nuestra vida en un “altruismo pasivo”: no golpeamos a la gente al azar en la calle ni les robamos su dinero.
38
Algunos han sugerido que esto se debe a que existen leyes y que la gente se desintegraría sin ellas,
(profundamente como se describe, por ejemplo, en el famoso libro El señor de las moscas
defectuoso y violento) de William Golding. Pero, en realidad, las comunidades pequeñas
yo
También nos gustaría abordar cuestiones humanas de justicia y decencia sin necesidad de que nuestros
laboratorios se conviertan en paisajes infernales malignos. Una de las consecuencias del experimento de Zimbardo
es que estudiar el mal es una pendiente resbaladiza. Parte de la razón por la que el experimento se detuvo
37
después de sólo seis días fue el efecto psicológico en los guardias tanto como en los prisioneros.
I
Pongo la palabra “salvajes” entre comillas porque el término se utilizó originalmente para referirse a culturas
no occidentales, no altamente tecnológicas, esencialmente “bárbaros”. La palabra “bárbaro” viene de la palabra
griega que describe el habla ininteligible de los extranjeros (que a ellos les sonaba como “bar bar”). 39 El punto
importante, sin embargo, es que los “salvajes” no eran particularmente salvajes, al igual que los “bárbaros” no eran
bárbaros (ciertamente no más que la gente “civilizada”), y vivían en comunidades con reglas (a menudo no escritas)
40
que dictaban justicia y moralidad.
Machine Translated by Google
En general no se parecen en nada a El señor de las moscas . Contienen vecinos que se ayudan entre
sí, comparten comida, con amplios ejemplos de altruismo tanto pasivo como activo. 41
Cuando vemos el auto de nuestros vecinos atrapado en la nieve (o incluso el auto de un extraño,
como sucedió afuera de mi casa durante la gran tormenta de nieve que tuvimos el invierno pasado), no
nos reímos, no disparamos a la persona y tomamos su auto, todos sacamos nuestras palas y quitanieves
y limpiamos el auto y ayudamos a la persona a regresar sana y salva a su camino.
Los bomberos, los agentes de policía y los ciudadanos comunes corren hacia el peligro para ayudar a los
necesitados. Cuando el puente 35W en Minneapolis se derrumbó durante la hora punta en agosto de
2007, arrojando automóviles al río Mississippi cerca de la universidad, nuestros primeros intervinientes
llegaron al lugar en cuestión de minutos, y los estudiantes universitarios, el personal docente y el personal
médico del hospital local corrieron a ayudar. Incluso desde un puente con tráfico en hora punta, solo
murieron 13 personas ese día, debido en gran parte al notable trabajo de los primeros intervinientes y la
42
reglas comunitarias ayuda que recibieron. Incluso los barcos piratas despiadados operaban bajo
(escritas y a menudo muy detalladas). El gancho invisible de Peter Leeson ofrece una descripción vívida
de cómo los piratas "sin ley" usaban reglas internas cuidadosamente construidas para garantizar una
comunidad viable. No vivimos en una situación de El señor de las moscas . Entonces, ¿qué es lo que
hace que las comunidades funcionen? Si no son las leyes, ¿qué es?
de este libro hemos visto la importancia de descomponer el mecanismo de toma de decisiones en sus
componentes. Nos gustaría poder entender los mecanismos de la moralidad de una manera que sea
repetible y que pueda estudiarse de forma fiable en el contexto de un laboratorio. Sería realmente útil
poder estudiar las cuestiones morales de tal manera que podamos preguntar cómo el cerebro representa
estas cuestiones, tal vez estudiándolas mientras observamos la actividad cerebral mediante fMRI. Para
llegar a estas preguntas en un entorno más controlado, más científico (y menos perturbador), volveremos
a la teoría de juegos. Sin embargo, en lugar de tratar de determinar cuál es la elección óptima bajo algún
supuesto normativo (prescriptivo), examinaremos qué elecciones toman realmente los humanos. Estas
elecciones se vuelven particularmente interesantes cuando hacemos que los juegos sean de suma no
cero.
Un juego de suma cero es aquel en el que las ganancias y las pérdidas totales se cancelan. Es decir, si un jugador gana, entonces
otro debe perder. En física, la cantidad total de energía dentro de un sistema cerrado no se puede crear ni destruir. Si dos bolas de billar
chocan entre sí, y una aumenta su velocidad, entonces la otra debe disminuir su velocidad. Sin embargo, la vida no es de suma cero.
Muchos trabajos humanos requieren una enorme cantidad de entrenamiento y práctica. Preferiría pagar a un experto para que reconstruya
mi techo para que quede bien hecho en lugar de tratar de aprender a hacerlo yo mismo y probablemente hacer un trabajo mediocre. Esta
es la ventaja de la especialización. Cada persona se vuelve mejor en su tarea, capaz de producir más y mejores productos, que podemos
J Aunque antes me quejé de que utilizar la eficiencia como único criterio de optimización es un problema, esto no
significa que la eficiencia sea algo malo en sí misma. La especialización puede permitir que las personas se concentren
en los trabajos que prefieren y, al mismo tiempo, mejorar la eficiencia. Hay muchas cosas en nuestro mundo moderno
(como la computadora portátil en la que estoy escribiendo este libro) que nunca existirían si todos tuvieran que cultivar
sus propios alimentos y construir sus propias herramientas.
Machine Translated by Google
Por lo tanto, necesitamos experimentos de laboratorio en los que tengamos juegos de suma distinta de cero.
Se han desarrollado varios juegos de este tipo para estudiar cuestiones morales. 43 El dilema del
prisionero más simple es el que, que introduce la cuestión de la cooperación y la deserción en
analizamos. En este dilema, un par de ladrones han sido atrapados robando en una tienda, pero la
policía no puede encontrar el botín escondido. Sin el botín, la policía sólo tiene pruebas suficientes
para acusarlos de allanamiento. Pero si la policía puede conseguir que un prisionero confiese,
puede condenar al otro. La policía le dice a cada uno que si confiesa y el otro no, le lanzarán la ley
al otro y dejarán libre al prisionero que confiesa. Si ambos confiesan, entonces los prisioneros
recibirán sentencias leves (presumiblemente porque la policía no necesitará ir a juicio). Básicamente,
podemos escribir esto como una tabla con cuatro condiciones: si el jugador 1 confiesa pero el
jugador 2 no, entonces el jugador 1 recibe 0 años pero el jugador 2 recibe 10 años. De manera
similar, si el jugador 2 confiesa y el jugador 1 no, el jugador 2 recibe 0 años, pero el jugador 1 recibe
10 años. Si ninguno confiesa, reciben 1 año. Si ambos confiesan, reciben 5 años (Figura 23.2).
La clave de la estructura de este juego es que cooperar con K cuando el otro jugador deserta
contra ti te hace quedar como un tonto y pierdes mucho. Sin embargo, si ambos jugadores desertan,
ambos pierden. Podemos escribir esto en forma positiva y negativa.
uno activo.yo En pocas palabras, imaginemos dos jugadores; cada uno puede “cooperar” o “desertar”.
Si ambos cooperan, ambos ganan $50. Si uno coopera y el otro deserta, el jugador que deserta
obtiene $80 y el otro no obtiene nada. Si ambos desertan, ninguno obtiene nada (Figura 23.3). Al
igual que con la versión negativa, la clave es que si el jugador 1 coopera, entonces es mejor que el
jugador 2 deserte que coopere, pero que ambos jugadores deserten es peor que que ambos
cooperen.
Por supuesto, la clave de una comunidad es que no solemos jugar estos juegos sólo una vez;
jugamos lo que generalmente se denomina el dilema del prisionero repetido (o “iterado”). 46
En esta versión, los dos jugadores juegan una y otra vez. Imaginemos dos comunidades que
intercambian bienes entre ellas. Tu comunidad cultiva trigo y la otra, fruta.
En el primer año, llevas trigo a la otra comunidad y te dan fruta a cambio. En el segundo año, te
traen fruta y les das trigo a cambio. Cada dos años, te arriesgas, llevas mucho trigo a su comunidad
donde tienen todo su
K La terminología de este ejemplo tradicional es desafortunada. Los prisioneros están cooperando con
Comencé con esto en forma negativa porque sería un poco extraño hablar del “dilema del prisionero” con
dinero compartido. En cualquier caso, a lo largo del resto de este capítulo, basaré estos juegos en transferencias de
dinero, porque así es como se han hecho la mayoría de los experimentos. 44 Es cierto que existen diferencias en
cómo los humanos tratan las decisiones enmarcadas positiva y negativamente 45 (ver Capítulo 3), pero aún no se
sabe cómo interactúan estas cuestiones.
Machine Translated by Google
La gente podría robarte la fruta y enviarte a casa sin ella. Por supuesto, si lo hicieran, no volverías. Esto
nos lleva al simple concepto de “ojo por ojo”.
A principios de los años 1980, Robert Axelrod, un científico interesado en la teoría de juegos y la
cooperación, organizó una serie de torneos informáticos en los que los jugadores presentaban
estrategias de cooperación y deserción. 47 Cada jugador jugaría una secuencia de 200 partidas de
dilema del prisionero con cada uno de los otros jugadores. (Es decir, cada jugador jugaría un dilema
del prisionero iterado con 200 repeticiones contra cada uno de los otros jugadores). Lo que esto
significaba era que un jugador podía castigar o engañar a otro jugador. Aunque se presentaron muchas
estrategias muy complicadas, la ganadora constante fue una estrategia muy simple llamada "ojo por
ojo", presentada por Anatol Rapoport, un matemático que estudiaba la teoría de juegos. La estrategia
consistía en cooperar en la primera jugada y, a partir de entonces, hacer lo que hiciera el otro jugador.
Si el otro jugador comenzaba a desertar, el titfortat desertaría, pero mientras el otro jugador cooperara,
el titfortat cooperaría.
Una de las cosas que Axelrod descubrió en su serie de torneos es que una comunidad de
jugadores de titfortat era notablemente estable. Si uno simulaba la evolución entre los jugadores (es
decir, los jugadores con las mayores ganancias replicaban una mayor proporción de esa estrategia en
la siguiente generación, mientras que los jugadores con las menores ganancias morían), entonces el tit
fortat generalmente llenaba la población y se convertía en una población evolutivamente estable; otras
estrategias no podían entrar en la comunidad. Recuerde que el titfortat jugando contra el titfortat
ambos cooperarían. Cualquiera que desertara en su contra ganaría a lo grande una vez, pero luego
sería castigado por el titfortat y comenzaría a perder. Aunque el jugador del titfortat perdería contra
ese desertor, todavía le iría bien cooperando con los otros jugadores del titfortat, pero el desertor
perdería contra todos.
El problema con el titportat, particularmente cuando se juega contra otro jugador que también
juega con titportat, es que si hay algún error, las deserciones empiezan a propagarse hacia el futuro.
Imagínese que, una vez, cuando va a llevar su trigo a otra comunidad, es atacado por bandidos y le
roban todo el trigo. La otra comunidad cree que usted ha desertado y, haciendo caso omiso de todas
sus súplicas y explicaciones, se niega a volver a comerciar con usted. Axelrod descubrió que, cuando
se incluyen errores en el juego, la estrategia óptima era “ojo por ojo con perdón”. Incluso entre una serie
de defectos, en ocasiones el jugador intentaría una cooperación. Podría ser suficiente para que ambos
jugadores volvieran a cooperar.
La clave de todas estas cuestiones es que la cooperación entre dos jugadores produce más
ventajas que las deserciones alternas (véase la Figura 23.3). Las estrategias en un mundo de juego en
el que esto es cierto evolucionan para producir comunidades que cooperan.
En esencia, somos criaturas sociales. Vivimos en comunidades de ese tipo. Varios estudios han
demostrado que si tienes dos grupos (piensa en esto como dos tribus o dos aldeas), uno de los cuales
contiene muchos cooperadores altruistas (piensa en esto como la aldea de altos impuestos y alta
colaboración, donde la gente se ofrece voluntariamente para ayudarse mutuamente) y otro que contiene
muchos desertores egoístas (piensa en esto como la aldea del “yo tengo lo mío”,
donde la gente hace lo mejor que puede para obtener lo suyo de la comunidad), entonces la aldea
altruista tendrá más éxito como grupo que la aldea egoísta. Las personas de la aldea altruista
pasarán más tiempo en la entrada cooperarcooperar de la tabla de interacción, mientras que las
personas de la aldea egoísta pasarán más tiempo en la entrada defectodefecto de la tabla de
interacción.
Se trata de una forma de selección grupal, en la que, aunque la determinación del éxito
selectivo se basa completamente en el individuo, ciertos grupos obtienen mejores resultados que
otros. Los grupos que tienen éxito pueden crecer lo suficiente como para dividirse en dos grupos,
mientras que los grupos que no lo tienen pueden destruirse a sí mismos desde dentro. Las
implicaciones evolutivas de este proceso de selección grupal se exponen con mayor claridad en
el libro Unto Others , de Elliot Sober y David Sloan Wilson.
Sin embargo, esta teoría predice que es más probable que uno sea más cooperativo con los
miembros de su propia aldea o grupo que con otros miembros de aldeas o grupos. Esta diferencia se
denomina altruismo dentro del grupo y xenofobia fuera del grupo . En su libro La catedral de
Darwin , David Sloan Wilson sostiene que una de las claves de la humanidad es la flexibilidad y
complejidad con la que definimos nuestros grupos. Sostiene que muchos de nuestros constructos
sociales (religión, nacionalismo, cultura, incluso franquicias deportivas) son formas de definir Wilson
Quién está en el grupo y quién no. En la Catedral de Darwin , examina explícitamente el
desarrollo del calvinismo en la década de 1530, donde el exilio y el ostracismo eran las principales
herramientas para garantizar un comportamiento cooperativo dentro del grupo.
En su libro Historical Dynamics , Peter Turchin define el término asabiya , que significa
“cohesión” o “unidad de grupo”. Turchin sostiene que el éxito de las dinastías, tribus, estadosnación
y grupos depende de la voluntad de los individuos de sacrificarse por el grupo. Turchin sostiene
que los grupos, los estadosnación, las tribus y las dinastías tienen un ciclo, donde los grupos
surgen con mucha asabiya (cooperación dentro del grupo), toman el control (porque son más fuertes
juntos que otros grupos que no pueden trabajar juntos), pero luego pierden esa asabiya en un par
de generaciones (los desertores se extienden dentro del grupo), lo que los hace vulnerables al
siguiente grupo con asabiya .
Este efecto que Turchin describe se produce porque, aunque a todos los habitantes de la aldea
altruista les irá mejor en promedio, una persona egoísta de la aldea altruista va a 49 (Esa persona
construido por el gobierno para protestar por el pago de pasará más tiempo en el sistema de metro
impuestos). Esto genera un conflicto entre niveles: a nivel de las aldeas, las aldeas altruistas obtienen
aldeas, pero a nivel individual, los desertores egoístas de esa aldea mejores resultados que otras
obtienen mejores resultados que los altruistas de esa aldea (mayoritariamente altruista). Hay dos formas
de abordar este problema (llamado 51 ): el exilio y el castigo altruista. el problema del polizón
El exilio implica identificar a los desertores y expulsarlos explícitamente de la comunidad. Uno de los principales objetivos
Un gran ejemplo del desarrollo del altruismo dentro del grupo como factor crítico para el éxito en una
54
Esta práctica de grupo por grupo se puede observar en el desarrollo de reglas a bordo sobre los buques piratas.
Sería difícil imaginar individuos más egoístas que los piratas, pero estar atrapados juntos en un barco
en medio del océano abierto, enfrentando la batalla juntos, ciertamente define
Machine Translated by Google
Un grupo muy específico. El factor clave descrito por Leeson en El anzuelo invisible es el castigo por
robar a la tripulación o por no hacer lo que corresponde. No cooperar con el resto de la tripulación
hacía que el resto castigara al pirata egoísta, que luego cambiaba su forma de actuar o de lo
contrario...
El castigo altruista implica que la comunidad identifique y castigue explícitamente a los desertores.
En cierto sentido, un grupo de cooperadores se reúne y cada uno sacrifica una pequeña cantidad
para garantizar que la ventaja que obtenga el desertor sea mínima.
El juego más simple que aborda esta cuestión del castigo altruista es el ultimátum , un experimento
justicia de laboratorio que prueba directamente la voluntad de una persona de sacrificarse por la
del juego . 55 En el juego del ultimátum, un jugador (el donante) recibe 20 dólares para dividir con
otro jugador (el receptor). El receptor luego decide si “lo toma o lo deja”.
Si el receptor acepta la distribución, ambos jugadores reciben el dinero, dividido entre el donante. Si
el receptor rechaza la distribución, ninguno de los jugadores recibe nada. En un mundo perfectamente
“racional”, el receptor debería tomar lo que reciba. El donante debería darle al receptor la cantidad
mínima (digamos $1 o 1 centavo) y el receptor debería tomarla. Pero si observa su propia reacción a
esto, probablemente tendrá una reacción visceral y emocional al recibir solo $1 o 1 centavo y se lo
arrojará en la cara al donante. En la práctica, los receptores rechazan cualquier cantidad por debajo
de un tercio del dinero, y los donantes (sabiendo esto) dividen el dinero en una proporción de
METRO
aproximadamente 60/40.
Curiosamente, otros animales, incluso animales muy inteligentes como los chimpancés, no
parecen mostrar esta propensión al castigo altruista; aceptan todo lo que se les da. 58 Hay algunas
diferencias en la forma en que se ha hecho pasar a los chimpancés por los experimentos (tienen que
realizar múltiples casos porque no se les puede decir a los chimpancés cómo jugar el juego). Y los
chimpancés son sensibles a la desigualdad y la injusticia, en particular entre compatriotas, entre
59
humanos y nuestro pariente genético más Sin embargo, parece haber claras diferencias
cercano. Aunque los chimpancés son nuestro pariente genético más cercano, tienen interacciones
sociales muy diferentes y no viven en las mismas comunidades unidas y basadas en aldeas que los
humanos. 60 Otros animales que sí viven en tales comunidades (como los lobos) sí parecen mostrar
castigo altruista. 61 Esto
sugiere que la diferencia puede ser menos una cuestión de humanidad que de comunidad.
El punto aquí es que parte de nuestro cerebro demanda justicia. La cooperación, la confianza y
producen cambios en la activación del circuito de recompensa emocional. Han la falta de ella
identificado que el castigo altruista (rechazar una oferta injusta) está asociado con aumentos en el
flujo sanguíneo en la amígdala y la ínsula, dos estructuras involucradas en las reacciones
emocionales (pavlovianas) a los resultados negativos. De hecho, el rechazo de ofertas injustas está
correlacionado con la emoción de la ira y el disgusto, y el castigo de los jugadores injustos está
asociado con la emoción de la satisfacción. El castigo de los jugadores injustos produce aumentos
en el flujo sanguíneo en las estructuras emocionales positivas como la corteza prefrontal medial
ventral y el estriado ventral. La satisfacción de castigar a los jugadores injustos ocurre incluso cuando
METRO 56
Los economistas nos dicen que esto es “irracional” porque uno pierde dinero al no aceptar la oferta más pequeña.
Dos grupos que juegan más “racionalmente” de lo esperado (ambos aceptan y ofrecen cantidades menores a lo normal) son los
sociópatas, que no parecen capaces de reconocer la reacción emocional del otro jugador, y los graduados de escuelas de
negocios, que han sido entrenados para actuar en base a sus ecuaciones de optimización “racional”. 57 Los graduados de
ciones.escuelas de negocios parecen normales antes de ingresar a la escuela de negocios, pero anormales al salir.
El castigador es un tercero, es decir, el jugador A se rebela contra el jugador B, que cooperó (y por
lo tanto fue engañado), y el jugador C gasta parte de su propio dinero para castigar al jugador A.
Los jugadores que observaban a un jugador injusto recibiendo descargas dolorosas expresaron
satisfacción, un deseo de venganza logrado y mostraron actividad en áreas relacionadas con la
recompensa, como el estriado ventral. Cuando evaluamos los objetivos, algunos de ellos son
complejos y sociales.
También se han examinado variaciones del juego del ultimátum. Si el receptor piensa que la otra persona
es en realidad un programa informático que ofrece opciones al azar, es más probable que ese receptor
donantes que piensan que "ganaron" el dinero acepte ofertas injustas sobre castigar a otros jugadores. Los
(mediante algún esfuerzo, por ejemplo, realizando una tarea antes de jugar el juego) ofrecen menos que si
el dinero se les da simplemente. Cuanto más haya trabajado el donante para conseguir el dinero (cuanto
más difícil fue la tarea), menos ofrecerá.
64;N
Como se ha señalado anteriormente, el castigo altruista puede ser motivo de chismes, vergüenza y
mala reputación. Una de las interacciones humanas que siempre me ha parecido especialmente interesante
es el éxito de Amnistía Internacional. Una de las principales actividades de Amnistía Internacional es escribir
cartas a dictadores, gobiernos y violadores de los derechos humanos para que liberen a los disidentes y
pongan fin a esos abusos. No amenazan. No tienen un ejército. Ni siquiera amenazan con la “quema en el
infierno” religiosa. Se limitan a escribir cartas, y lo notable es que a menudo esto funciona.
Un problema similar se relaciona con el perdón. Como vimos en los experimentos de ojo por
ojo, la estrategia más resistente a los errores y al ruido es el ojo por ojo con perdón. Aunque
algunos crímenes pueden ser imperdonables, perdonar (posiblemente después de cumplir un
castigo apropiado) es una herramienta para rehabilitar a un desertor. Si la persona coopera a partir
de ese momento, puede volver a formar parte de la comunidad. En una de las historias más
notables de nuestro tiempo, después del fin del apartheid en Sudáfrica, el arzobispo Desmond
Tutu dirigió la Comisión de la Verdad y la Reconciliación en
, la que se pidió a los criminales que
Proporcionar una descripción completa, divulgación y disculpa.
La ciencia de la moralidad está todavía en pañales. En este momento, se está concentrando en la
pregunta descriptiva de ¿qué hacen realmente los humanos? La evidencia parece indicar que hemos
desarrollado una serie de juicios “morales” que nos permiten vivir en comunidades (en su mayoría) pacíficas.
Estas interacciones no siempre son simples y dependen de una interacción compleja que fomenta la
cooperación y reduce las ventajas de la deserción.
Lo que es particularmente interesante es que la humanidad está de acuerdo en gran parte sobre la moralidad,
en particular la de las interacciones sociales. La Regla de Oro es reconocida en todo el mundo, como parte de la
mayoría de las religiones y de la mayoría de los tratados morales no religiosos. Las prohibiciones específicas (el
matrimonio homosexual, el aborto, el consumo de carne de cerdo) varían de una religión a otra y de una religión a otra.
N Por eso el meme antiimpuestos de “es tu dinero” es tan efectivo e insidioso: 65 alienta la deserciónegoísta de la
comunidad. (Como dijo el juez de la Corte Suprema Oliver Wendell Holmes, “los impuestos son lo que pagamos por una
sociedad civilizada”. Esto se repite a menudo como “los impuestos son el precio que pagamos por vivir en una sociedad
civilizada”). De manera similar, por eso los grupos antiimpuestos están tratando de deshacerse de la “retención” que
ocurre en la mayoría de los trabajos remunerados (pero no para los autónomos). Cuanto más logren los grupos
antiimpuestos hacer que los ciudadanos vean el dinero como ganado y luego regalado, menos dispuestos estarán esos
ciudadanos a pagar impuestos. (Por supuesto, como la mayoría de los desertores egoístas de una comunidad, los grupos
antiimpuestos quieren todos los servicios de la comunidad, pero no quieren pagarlos. 66 )
Machine Translated by Google
La dinámica varía de una cultura a otra, pero las interacciones sociales y morales primarias (ser justo en el trato
con los demás, tratar a los demás como nos gustaría que nos trataran a nosotros, ayudar cuando podamos) no.
Cuando un no creyente presionó al rabino Hillel (110 a. C.10 a. C.) para que describiera toda su religión
mientras estaba de pie, prometiendo convertirse si Hillel podía hacerlo, el rabino Hillel respondió: “Lo que es
odioso para ti, no se lo hagas a los demás. Todo el resto es solo un comentario. Ve y aprende”. 67 La Regla de
Oro es un primer paso hacia la cooperación, pero por sí sola no es suficiente. El comentario es largo y complicado,
y aún se está descubriendo.
• Sam Harris (2010). El panorama moral . Nueva York: Free Press. • Paul J. Zak [Editor]
(2008). Mercados morales: el papel fundamental de los valores en la economía .
Princeton, Nueva Jersey: Princeton University Press .
Machine Translated by Google
24
El enigma de la robótica
El libre albedrío es un término curioso. Es una combinación de palabras tan sencillas que lleva consigo
todo lo que nos hace sentir humanos. ¿Qué significa ser libre ? ¿Qué significa querer algo? Uno de los
A
grandes terrores de la vida moderna es que el concepto de libre albedrío es una ilusión. Si el libre
albedrío es una ilusión, entonces nos subiremos a una montaña rusa que nos llevará a grandes alturas
y luego a grandes profundidades, sin ningún control sobre nuestro viaje. Pero este terror presupone
que sólo hay dos opciones: o tenemos completa libertad para elegir lo que queramos o nuestra
sensación de identidad es una ilusión, que no tenemos el control, que somos meras máquinas,
completamente predecibles en lo que hacemos. Esta dicotomía es la ilusión.
La verdad es que nunca somos completamente libres . Estamos limitados por las leyes de la
física, por nuestras interacciones inmediatas con la sociedad y por nuestros recursos físicos y monetarios.
Puedo querer volar como un pájaro todo lo que quiera, pero no importa cuán alto salte, nunca lo haré.
La irreverente tira cómica Jesús y Mo captó este enredo con elegancia: “¿Sabías que el libre
albedrío es una ilusión?” “¿Y qué pasa con la responsabilidad personal?” “¡Eso es exactamente! ¡Una
1
vez que aceptas que no existe el libre albedrío, puedes hacer lo que te dé la gana!”
227
Machine Translated by Google
B
despega y vuela hacia el cielo. Puedo querer lanzar en las grandes ligas, pero no tengo una bola
rápida de 100 millas por hora. Todos aceptamos estas limitaciones, y aun así nos aferramos al término
libre albedrío .
Voluntad es una palabra antigua que significa deseo o anhelo. La voluntad es el medio que nos define.
Fundamentalmente, el hecho de que el concepto de voluntad implica un dualismo es lo que está en el
corazón del problema del término libre albedrío . Si podemos explicar el motivo de una acción de Nosotros
una fuente que no es nuestra “voluntad”, entonces negamos nuestra propia agencia al tomar esa acción.3
Verá que este no es un concepto nuevo y que el hecho de que seamos o no máquinas en realidad no tiene
relación con el hecho de que tengamos o no libre albedrío.
Debemos abordar el libre albedrío desde tres perspectivas. Desde una perspectiva externa , el libre
albedrío se refiere a si tratamos a otro ser como un agente o como una máquina. Desde una perspectiva
desde una social , el libre albedrío se refiere a si podemos culpar a los individuos por sus acciones. Y
perspectiva interna , el libre albedrío se refiere a si somos verdaderamente esclavos de nuestra propia maquinaria.
Desde una perspectiva externa, ya hemos visto que asignamos agencia a muchas cosas que no son
agentes. (¿Recuerdas la discusión sobre el GPS en el Capítulo 2?) La suposición de agencia es una
forma que tiene el cerebro humano de manejar la imprevisibilidad. En particular, la suposición de agencia
nos permite abordar la compleja interacción de la previsibilidad basada en las probabilidades de selección
de acciones.
Los individuos tienen personalidad, carácter; son predecibles. No es cierto que los humanos actúen al
azar. Piense por un momento en qué clase de mundo sería ese: cada persona que conozca podría de
repente empezar a cantar o podría de repente empezar a matar. Un mundo así es inimaginable para
nosotros. En cambio, hablamos con fiabilidad de propensiones, de la naturaleza de una persona . "Está en
,4 explicando
mi naturaleza", le dice Fergus a Dil al final de The Crying Game , reconociendo sus acciones,
por qué se hizo cargo de ella. Fergus explica su capacidad de acción diciendo que esto está dentro de los
límites de lo que cabría esperar si realmente lo conocieras. La capacidad de acción requiere previsibilidad,
pero sólo una previsibilidad limitada: identificamos un carácter, una naturaleza, un rango de posibilidades,
y esperamos que el agente actúe en algún lugar dentro de ese rango.
El problema de la mecánica y el libre albedrío se remonta a la época de Galileo, Newton y Descartes,
quienes reconocieron que los sistemas físicos no tenían agencia en la forma de la que estamos hablando
aquí: eran completamente predecibles. (Por supuesto, ahora sabemos que esto solo ocurre con los objetos
a escala macro que Galileo y Newton estaban estudiando. A escalas suficientemente pequeñas (cuánticas),
la previsibilidad se rompe. 5 Aún se desconoce si los objetos cuánticos son deterministas o no, pero
nuestro mejor conocimiento actual sugiere que no lo son; en cambio, parecen ser probabilísticos. Como
veremos más adelante en este capítulo, es posible que los efectos cuánticos se expandan al mundo
macro, lo que los hace fundamentalmente probabilísticos también. 6 ) Antes de Galileo, los objetos mismos
tenían agencia: Aristóteles explicó la gravedad porque las cosas querían caer a la tierra, y propuso que los
objetos tenían una causa impulsora, que los empujaba a sus acciones, y una causa teleológica, que los
atraía en función de su agencia y sus objetivos.
7
Descartes, a través de sus propios estudios médicos y siguiendo directamente las observaciones de
Galileo sobre la mecánica, se dio cuenta de que el cuerpo en sí mismo era una máquina.
B
Nunca estuve dispuesto a poner a prueba la sugerencia de La Guía del autoestopista galáctico de
2
apuntar al suelo y fallar.
Machine Translated by Google
Fue un anatomista consumado y reconoció que los animales eran máquinas; sin embargo, negó que él
8
mismo fuera una máquina y separó explícitamente la mente del cuerpo.
La preocupación de Descartes era la predictibilidad: la mecánica newtoniana implica que si se conocen
suficientes detalles sobre el estado del universo en un momento dado, es completamente predecible a
partir de ese momento. El notable éxito de la mecánica newtoniana en la predicción del movimiento en el
mundo físico, a veces llamada la teoría del “universo de relojería”, condujo a la hipótesis del determinismo.
9 Los filósofos de la época creían que sólo había dos opciones: un
agente de toma de decisiones extrauniversal con libre albedrío, o que todo está predeterminado y que todo
libre albedrío es una ilusión.
Algunos filósofos han tratado de rescatar de la mecánica cuántica la aleatoriedad necesaria
para el libre albedrío. 10 Las mejores teorías actuales de la física sugieren que el determinismo
universal implícito por Newton es erróneo: no podemos predecir las acciones de una partícula
cuántica, es verdaderamente aleatoria (dentro de los límites de las probabilidades C ). 11 Los
neurocientíficos han tendido a desdeñar las teorías que basan el libre albedrío en la mecánica
cuántica porque la aleatoriedad cuántica no suele alcanzar el nivel macro que experimentamos en
nuestro mundo cotidiano. En gran parte, esto ocurre porque la aleatoriedad cuántica está limitada
por las probabilidades. Con suficientes elementos, las distribuciones de probabilidad se completan
y las cosas se vuelven extremadamente predecibles. Incluso los productos que dependen de
12
propiedades cuánticas (el láser, el transistor) proporcionan resultados predecibles de los que dependemos ad
Sin embargo, las matemáticas no lineales proporcionan un mecanismo a través del cual pequeñas (micro)
13 En estas ecuaciones, pequeños cambios se
fluctuaciones pueden generar eventos grandes (macro).
filtran a través del sistema, produciendo una gran divergencia en los resultados finales. Las neuronas
individuales son altamente no lineales y contienen muchas funciones de retroalimentación positiva que podrían llevar estos efectos de nivel micro al
do
Una de mis frases favoritas es una que escuché por primera vez de mi padre (que es físico teórico): “Los electrones
tienen libre albedrío”. Podemos predecir con mucha precisión lo que harán los electrones en conjunto. Podemos proporcionar
una predicción probabilística sobre lo que hará un solo electrón, pero es imposible decir con certeza lo que hará un solo
electrón.
Este crecimiento desde manipulaciones de nivel micro hasta efectos de nivel macro a veces se llama el "efecto mariposa",
del concepto de que la forma en que una mariposa bate sus alas en China (un cambio pequeño) puede cambiar la trayectoria
de un huracán en el Caribe (un efecto grande). Fue descrito por primera vez por Henri Poincaré (18541912) a fines del siglo
XIX, pero era difícil verlo realmente hasta que el desarrollo de la computadora permitió el cálculo confiable de ecuaciones
complejas. La primera demostración por computadora de que pequeños cambios llevaron a grandes divergencias bajo ciertas
condiciones fue de un meteorólogo llamado Edward Lorenz (19172008), quien estaba tratando de simular patrones climáticos
en la década de 1950. Sus simulaciones pasaban por una serie de ecuaciones diferenciales simples. En cada ciclo, la
simulación imprimía lo que debería haber sido una descripción completa del sistema en un momento dado. Cuando su cálculo
se detenía (debido a problemas eléctricos con las computadoras antiguas de la época), volvía a escribir los números
impresos. Este era un sistema completamente determinista, pero lo que descubrió fue que las diferencias en los dígitos menos
significativos se filtraban hacia los dígitos más significativos y producían efectos altamente divergentes. Para aquellos
interesados en este efecto, el libro de divulgación científica de James Gleick de 1987, Chaos, sigue siendo una de las mejores
introducciones a este campo.
mi
Las células tienen muchos componentes individuales que funcionan a niveles cuánticos. Uno de los ejemplos más
claros es el de los canales iónicos. Estos canales iónicos son un componente clave de la función celular, incluida la función
neuronal. Los canales iónicos están formados por proteínas de formas intrincadas que forman dispositivos mecánicos que
permiten que ciertos iones pasen a través de la membrana celular mientras restringen el flujo de otros iones. La distribución
de iones, que están dentro de la célula y que están fuera de la célula, es un proceso que se puede llevar a cabo de forma independiente.
(continuado)
Machine Translated by Google
Célula: controla la función de la célula, incluyendo la activación de una espiga (que transporta información) y la liberación de
neurotransmisores (que se comunican con otra célula). Cada canal iónico tiene varias configuraciones diferentes; cada
configuración tiene diferentes propensiones a estar abierta o cerrada, para permitir que los iones fluyan a través de ella o no.
14
El que un canal iónico esté abierto o cerrado en un momento dado es un hecho aleatorio.
Las medidas de cada canal iónico individual muestran que, si bien la probabilidad de que se cierre un canal abierto o se
abra un canal cerrado tiene una probabilidad caracterizable, el momento real de cada uno es aleatorio.
Debido a que una célula normalmente tiene miles de canales iónicos de un tipo determinado, que realizan una
función específica, la aleatoriedad individual se promedia y el nivel macro de la función celular es extremadamente
consistente de un evento a otro.
Pero hay algunos casos en los que el número de canales es realmente muy pequeño, en los que los procesos de
retroalimentación pueden traducir los microcambios cuánticos en macrocambios. Una de esas situaciones es la activación de
potenciales de acción. Las neuronas integran información y luego la envían mediante la activación de potenciales de acción o
picos. (Véase el Apéndice A.) El pico en sí es una retroalimentación positiva de los canales de sodio sensibles al voltaje. 15
Esto significa que el umbral entre la activación y la desactivación puede depender de que se abran un número muy pequeño
de canales de sodio adicionales.
Los estudios computacionales y experimentos que han reemplazado los canales cuánticos aleatorios por canales
persistentes han descubierto que hay propiedades de red a nivel macro que desaparecen sin esa aleatoriedad cuántica. (Por
ejemplo, las células en la corteza entorinal muestran una oscilación inherente al ritmo theta de 57 Hz. Esta oscilación depende
del ruido del canal y desaparece sin la aleatoriedad inherente a 16 ) Otros ejemplos en los que la aleatoriedad estocástica a
Estos canales. nivel micro (cuántico) se puede reflejar en efectos a nivel macro incluyen si una sinapsis libera o no un
neurotransmisor, y cómo el axón de una neurona se extiende para encontrar otras neuronas durante el desarrollo (lo que se
relaciona con cómo está conectada la red). 17 Pero, al igual que con los transistores, los láseres y otros fenómenos que
dependen de las propiedades cuánticas, los efectos a nivel macro en las células (como los picos) son fenómenos altamente
18
confiables. Todavía se desconoce cómo el dominio afecta a las propiedades sutiles en ¿Cuánta carrera cuántica?
neurociencia (a través del efecto mariposa).
F
De hecho, los componentes cuánticos (microtúbulos) que Penrose y su colega Stuart Hameroff alcanzan para
19 están en cada célula de cada criatura multicelular, desde el gusano más pequeño hasta la ballena más grande.
Machine Translated by Google
aleatoriedad o indeterminación caótica) y esa aleatoriedad nos lleva a asignarle agencia a otros. Como ya
hemos visto, los humanos asignan agencia a cualquier cosa con la que interactúan que sea impredecible
dentro de un rango limitado (como el fuego o el clima); no estoy haciendo ninguna afirmación sobre la
conciencia de esos otros agentes.
De modo que podemos identificar por qué otras personas parecen ser nuestros agentes: son
previsiblemente aleatorias. Pero sospecho que es poco probable que los lectores se sientan satisfechos con
esta historia, porque he eludido los dos problemas reales del libre albedrío. En primer lugar, ¿cómo podemos
responsabilizar a las personas de sus acciones si no tienen libre albedrío? Y en segundo lugar, ¿tiene usted,
querido lector, libre albedrío?
El problema, sin embargo, surge cuando empezamos a tener explicaciones de por qué alguien cometió
un crimen. Si descubrimos que alguien tiene un tumor cerebral que altera el procesamiento de su corteza
prefrontal, ¿culpamos a la persona por la acción? ¿Y si la persona tiene una adicción? ¿Y si llegamos al
punto en que podemos explicar la neurociencia de la decisión lo suficientemente bien como para poder decir
que cualquiera con un cerebro como éste habría tomado esa decisión? ¿Perdonamos entonces al criminal el
crimen?
Es importante destacar que este concepto es milenario y anterior a la neurociencia. En todas las épocas
ha habido explicaciones de por qué alguien hace algo que no implica su responsabilidad. Antes de la ciencia,
existían las brujas y los demonios. 21 Antes de la
22
neurociencia, existían explicaciones sociales y de desarrollo.
Esta cuestión de nuestra capacidad para predecir la conducta criminal también abre un conjunto
completamente diferente de problemas: si podemos predecir con absoluta certeza que alguien cometerá un
delito, ¿no estamos obligados a detenerlo? 23 ¿Qué pasa si sólo podemos predecir que cometerá el delito
con una alta probabilidad? ¿Cuál es el equilibrio entre esa probabilidad y los derechos de la persona a la
libertad? La mayoría de los sistemas jurídicos modernos han decidido inclinarse por la balanza de la libertad,
es decir, que hay que dar a la persona la oportunidad de no cometer el delito, que es injusto juzgar a una
persona por sus pensamientos y sólo es justo juzgar a una persona por sus acciones, y que, por lo tanto, hay
yo
que esperar a que se cometa el delito antes de actuar.
En gran medida, el problema de la ética de la elección radica en la distinción que se ha establecido entre
el objetivo de castigar al agente responsable y el objetivo de garantizar que los peligros para la sociedad se
eliminen con éxito de ella. Como vimos en los dos últimos capítulos, uno de los factores clave que nos hace
humanos y nos ha permitido vivir en condiciones estables es la libertad.
G Esto no es del todo cierto. En muchas de estas situaciones, hay una opción, pero la otra es tan atroz que el crimen se convierte en la
mejor opción. Tal vez en lugar de decir que la persona que comete el crimen “no tiene culpa”, deberíamos decir que somos misericordiosos y
yo
Por supuesto, no hay motivos para no preparar defensas de antemano. Cerrar la puerta con llave es una
respuesta muy diferente para prevenir un robo que encerrar al ladrón potencial.
Machine Translated by Google
El verdadero objetivo de un sistema jurídico moderno es garantizar la capacidad de una sociedad para funcionar.
Sin embargo, aunque la comunidad médica ha pasado las últimas décadas luchando para garantizar que sólo se
utilicen terapias científicamente probadas, un proceso llamado “medicina basada en la evidencia”, todavía no existe
tal restricción en el sistema legal. 24 Esto significa que las leyes
en el capítulo sobre “guerra contra las drogas” (capítulo 18), el consumo de drogas conduce a claras disminuciones
del bienestar, tanto en el individuo como en la sociedad. Sin embargo, el consumo de drogas, incluso el consumo de
drogas altamente adictivo, en particular al principio de la vida de un individuo, es a menudo un problema individual
no violento, en lugar de un problema social.27 Hay datos muy completos que demuestran que enviar a los adictos no
violentos a un tratamiento reduce la adicción, reduce la probabilidad de que se vuelvan violentos y tiene buenas
tasas de éxito en su reinserción en la sociedad. Por el contrario, enviar a los adictos a la cárcel aumenta la
probabilidad de que se vuelvan violentos, tiene bajas tasas de éxito en su reinserción en la sociedad y es más
probable que conduzca a una recaída, a menudo con drogas peores, al regresar a la sociedad. Y, sin embargo, el
debate en la sociedad estadounidense actual se ha centrado claramente en el castigo penal y la prisión por el
consumo individual de drogas.
Nunca olvidaré un ejemplo de desconexión de este tipo, que escuché en mi graduación de la universidad. El
orador era el novelista Tom Clancy, que estaba tratando de complacer a los ingenieros en un discurso en la
ceremonia de graduación de la escuela de ingeniería. Al principio del discurso, habló de lo importante que era mirar
los datos científicos y de cómo a veces los datos científicos eran diferentes del sentido común, por lo que los
ingenieros tenían que aprender a mirar los datos en sí. Apenas diez minutos después, en el mismo discurso, Clancy
denunció los centros de tratamiento de la adicción a las drogas, diciendo que no le importaba si los datos decían
que el tratamiento funcionaba mejor que la prisión, los adictos sabían que irían a la cárcel y decidían tomar las drogas.
I
Como han señalado muchos comentaristas y filósofos, la terminología “guerra contra las drogas” realza
ciertas perspectivas sobre el manejo del problema y probablemente limita nuestras opciones políticas a la hora de
26
abordar el problema del consumo adictivo de drogas.
Machine Translated by Google
De todos modos, tuvo que ser enviado a prisión. Estas desconexiones lógicas se encuentran en la visión
limitada del libre albedrío instalada en nuestro sistema legal como un fenómeno de todo o nada: o alguien
es libre de elegir y debe ser castigado, o alguien es un esclavo y se debe encontrar al agente real de la
decisión en su lugar. Como hemos visto a lo largo de este libro, la historia no es tan simple.
El sistema legal ha tenido problemas con la cuestión de la culpa y el castigo mucho antes del problema
de que la comprensión del mecanismo de toma de decisiones puede llevar a explicaciones independientes
del libre albedrío. 28 Sin embargo, si nos alejamos de la cuestión de la “culpa” y nos acercamos a objetivos
de misericordia y perdón a nivel individual, mientras mantenemos el objetivo de mantener una sociedad
funcional a nivel social, encontramos que la cuestión del libre albedrío nuevamente se vuelve discutible.
Por supuesto, como hemos comentado en la primera parte de este capítulo, el libre albedrío significa
que podemos predecir en conjunto, pero no en forma individual. 29 Esto significa que la predicción de una
acción futura es sólo eso: una predicción. Como se muestra en la película Minority Report , es
inherentemente peligroso suponer que una predicción es la realidad.
Hay una gran diferencia entre cerrar la puerta
con llave para evitar robos y encerrar al ladrón antes de que entre en tu apartamento (nota H, arriba).
Podemos entender las razones por las que alguien ha hecho algo y, en lugar de preocuparnos por si
debemos culparlo por sus acciones o no, podemos preocuparnos por cómo asegurarnos de que no vuelva
a suceder. El castigo es sólo una herramienta en esa caja de herramientas; hay muchas otras. Saber
cuáles funcionarán, cuándo y cómo implementarlas son cuestiones científicas que dependen de nuestra
comprensión de la máquina de toma de decisiones humana.
Dos grandes ejemplos del uso de otras herramientas son los usos exitosos de la vergüenza por parte
31 Pudieron lograr sus objetivos mostrando al mundo lo que otros
de Mahatma Gandhi y Martin Luther King.
hacían. (No subestimemos la importancia de los noticieros de televisión y cine en sus éxitos.) Al utilizar el
mecanismo intersocial humano que reconoce la fuerza no sólo en términos de capacidad física sino también
en términos de “corazón”, de capacidad de permanecer de pie incluso frente a un poder físico mayor, J.
Gandhi y King pudieron lograr grandes cosas.
De modo que un proceso aleatorio combinado con un mecanismo que garantice que la aleatoriedad se
encuentre dentro de una distribución de probabilidad es suficiente para explicar lo que observamos como
capacidad de acción en los demás. Y reconocer que el castigo altruista es sólo una herramienta en la caja
de herramientas de la sociedad para garantizar la cooperación en lugar de la deserción deja sin respuesta
la cuestión ética de si alguien realmente tiene libre albedrío o no. Sin embargo, hasta ahora hemos evitado
la difícil cuestión de la conciencia: ¿Tiene usted, querido lector, libre albedrío?
J Rocky es el héroe de su película porque permanece de pie hasta el final, incluso cuando pierde la pelea.
32
Machine Translated by Google
La ira, la lujuria, o que dejamos de prestar atención y nos encontramos llevando a nuestro amigo a
la oficina en lugar de al aeropuerto, nos llevan a la teoría del jinete y el caballo, según la cual hay
un jinete consciente y un caballo inconsciente. El jinete puede dirigir al caballo, pero también puede
ceder el control y dejar que el caballo tome su propio camino.
33 A veces el caballo realiza una acción repentina que el jinete luego tiene que compensar.
De manera similar, todos hemos tenido la experiencia de racionalizar una acción que claramente
se tomó con prisa: “Quise hacer eso”. Después de los famosos experimentos de Libet, que
demostraron que las decisiones conscientes de actuar están precedidas por señales cerebrales
mucho antes del momento en que creemos que tomamos la decisión, muchos filósofos se han
refugiado en la hipótesis de que la conciencia es totalmente una ilusión y que el conductor es sólo
un pasajero que observa cómo se desarrolla la película. Otros han sugerido que la conciencia se
parece más a un secretario de prensa que a un ejecutivo, y que la conciencia implica racionalizar
las acciones que realizamos. Daniel Wegner diferencia las acciones que identificamos como
voluntarias y las que no, y señala que existen casos de (1) acciones sobre las que no tenemos
control pero creemos que lo tenemos y (2) acciones sobre las que sí tenemos control pero creemos
que no lo tenemos. Wegner identifica explícitamente el “libre albedrío” con la ilusión de agencia. Sin
embargo, los experimentos de Libet se basan en la idea de que la decisión consciente de actuar se
produce cuando reconocemos (lingüísticamente) la decisión de actuar. Libet y otros han sugerido
que la conciencia monitorea las acciones que realizamos para poder detenerlas, modificarlas o
vetarlas. 34
El problema, como yo lo veo, es que los filósofos tienen el concepto de que la conciencia debe
ser una cosa externa, externa al mundo físico, o una propiedad emergente de las cosas físicas que
es (de alguna manera) fundamentalmente diferente de las cosas físicas subyacentes.
35 Esta cuestión salió a la luz por primera vez con el determinismo descartiano, a raíz
de las implicaciones de Galileo, Newton y Johannes Kepler de que uno podía predecir con precisión
de los objetos, y que estos no necesitaban una agencia para moverse. no el movimiento
38
necesitaban una agencia para actuar, entonces tampoco la necesitaba la Claramente desesperado
maquinaria del cuerpo. Al no abandonar el libre albedrío humano, Descartes concluyó que, aunque
los animales eran máquinas, él mismo no lo era.
K La teoría del sistema de toma de decisiones múltiples sugiere por qué tenemos deseos múltiples (a veces conflictivos). A veces,
el sistema pavloviano quiere una cosa, mientras que el sistema deliberativo quiere otra... todo mientras el sistema procedimental toma
Compárese con Tomás de Aquino (12251274), quien planteó la hipótesis de que los ángeles empujaban
los planetas en sus órbitas. 36 Aunque ya no se toman en serio los ángeles como explicación del movimiento
planetario, en su época era una teoría seria. Tomás creía que las cosas no podían moverse sin un agente. Con
los avances de Galileo, Descartes, Newton, Brahe y Kepler, ya no se necesitaban agentes para mover los
planetas, y se abandonó la teoría del empuje de los ángeles.
En realidad, la cronología es la siguiente: Galileo (15641642) precede a Descartes (15961650), quien a
su vez precede a Newton (16431727). Galileo demostró que se podía medir la realidad física experimentalmente.
Descartes demostró que el espacio podía representarse matemáticamente, y Newton dedujo descripciones matemáticas precisas del
movimiento determinista. Las otras dos figuras clave de esta cronología son Tycho Brahe (15531601) y su alumno Johannes Kepler
(15711630), que demostraron que los planetas se movían en órbitas regulares, que podrían describirse como elipses. Al igual que sucede
con la ciencia moderna, estos hombres conocían bien el trabajo de los demás, leían cada tratado a medida que salía y se basaban en él.
Ninguno de ellos trabajaba de forma aislada. 37
Machine Translated by Google
La famosa frase de Descartes es, por supuesto, cogito ergo sum ( pienso, luego existo ), lo
cual está bien, pero no dice nada sobre si sus semejantes humanos piensan o si el lenguaje que
le hablaban simplemente le daba la ilusión de que pensaban, y no dice nada sobre si sus
semejantes animales piensan, aunque no puedan contarle sus introspecciones. Descartes
concluyó que la glándula pineal es la conexión de un alma consciente externa a un ser físico. Si
bien la glándula pineal conecta el cerebro con el... Un anatomista consumado, Descartes era
40
cuerpo,M todos los mamíferos tienen glándulas
pineales. muy consciente de esto, pero concluyó que solo la glándula pineal humana "funcionaba" para conectar
las almas con los cuerpos. 41
Una versión más moderna de esta hipótesis desesperada se puede encontrar en los cuánticos
Las teorías de Roger Penrose y Stuart Hameroff no , que han argumentado que la conciencia
pueden surgir de un sistema determinista y, por lo tanto, deben depender de fluctuaciones cuánticas.
42
En particular, han argumentado que la mente interactúa con el cerebro
manipulando probabilidades cuánticas: el libre albedrío ocurre porque nuestras almas separadas
pueden manipular las probabilidades cuánticas para darnos libre albedrío. Nótese que la teoría de
Penrose y Hameroff de que un alma externa controla las probabilidades cuánticas es muy diferente
de la discusión anterior de las probabilidades cuánticas como una fuente potencial de aleatoriedad
en otros. Sospecho que si realmente pudiéramos controlar las probabilidades cuánticas, seríamos,
como se muestra en Anathem de Neal Stephenson , en realidad mucho mejores en ciertos
problemas (como descifrar códigos) de lo que somos. Esta teoría cuántica a menudo se enuncia
como una declaración en la línea de Las máquinas no pueden ser conscientes. Dado que soy
consciente,
,43,no soy es
lo cual una máquina.
una reformulación apenas velada del cogito ergo sum de Descartes .
Mi opinión es que el problema es que, cuando lo imaginamos, creemos que sólo hay dos
opciones: o somos seres conscientes que pueden emprender cualquier acción o somos esclavos
,
que no tienen opciones. Pero, como Fergus y Dil en The Crying Game, tenemos personalidades y
somos fieles a nuestra “naturaleza”.
La palabra robot proviene de una obra de teatro de Karel Čapek (titulada RUR [Los robots
universales de Rossum] ), que en realidad trataba sobre el efecto de la industrialización sobre la individualidad.
De manera similar, nuestro concepto más moderno de robots proviene de observaciones de
máquinas sumamente complejas, muchas de las cuales se utilizan en fábricas industrializadas. Esto
refleja nuestro temor de que la robótica conduzca a la esclavitud, pero como hemos visto, el
problema no es la esclavitud. Incluso si la conciencia fuera una ilusión, no cambiaría nuestra
percepción de nuestra conciencia. No es que de repente nos vayamos a convertir en esclavos, ya lo somos o no
norte
El mundo es más complejo que eso. Ciertamente, hay decisiones que se toman sin intención
consciente, pero también hay deliberaciones conscientes muy largas que duran minutos, horas, días,
semanas o incluso meses. Incluso en el caso de decisiones específicas que ocurren demasiado
rápido para ser conscientes, podemos decidir entrenarnos para tomar las decisiones correctas en
el momento correcto. Se necesita tiempo para aprender a andar en bicicleta. Tanto las estrellas del
deporte como los soldados saben que hacer lo correcto en el momento correcto rápidamente (sin
pensar) requiere mucha práctica. Aunque la acción en el momento puede ser reactiva, la decisión de practicar es
La glándula pineal libera hormonas en el torrente sanguíneo en función de la activación de las neuronas y detecta los niveles hormonales en el torrente sanguíneo, traduciendo
las representaciones neuronales en niveles hormonales y los niveles hormonales en representaciones neuronales.
39
Tengo un amigo al que le gusta decir que en realidad no importa si tienes libre albedrío o no. Si
norte
Si lo haces, entonces es mejor que creas que lo haces. Si no lo haces, entonces estás predeterminado a creer que lo haces.
Machine Translated by Google
Antonio Damasio (2010). El yo llega a la mente: la construcción del cerebro consciente . Nuevo
York: Panteón .
• Jeff rey Gray (2004). Conciencia: Acercándose sigilosamente al problema difícil . Nueva York:
Oxford University Press. •
Robert Kurzban (2010). Por qué todos (los demás) son hipócritas . Princeton, NJ: Princeton
Prensa universitaria.
• Neil Levy (2007). Neuroética . Cambridge, Reino Unido: Cambridge University Press. •
Daniel M. Wegner (2002). La ilusión de la voluntad consciente . Cambridge, MA: MIT.
Prensa .
Machine Translated by Google
EPÍLOGO
Hemos recorrido un largo camino en este libro, desde nuestras primeras discusiones sobre la toma
de decisiones y el ciclo de percepciónevaluaciónacción del termostato hasta la imaginación, la
moralidad y cómo somos máquinas con libre albedrío. En este libro, hemos explorado la ciencia de la
toma de decisiones y cómo los humanos (y otros animales) toman decisiones, a veces de manera
consciente, a veces menos. Nos gusta pensar que somos criaturas racionales, pero a menudo
tomamos decisiones irracionales. Esta irracionalidad proviene de la separación entre el "yo"
deliberativo y el "otro" pavloviano e impulsado por los hábitos (procedimental), pero esos otros
sistemas de toma de decisiones, los sistemas pavlovianos de selección de acciones y motivación,
los componentes de reconocimiento de situaciones (memoria), los hábitos aprendidos a lo largo de
1
los años, todos conforman la persona que eres. Parafraseando la analogía del caballo y el eres
jinete de Jonathan Haidt, tanto el caballo como el jinete. Estas son las historias que nos contamos a
nosotros mismos, los recuerdos que nos definen quiénes somos.
Aunque este no es un libro de autoayuda, la teoría de que las decisiones que tomamos surgen de
múltiples sistemas de toma de decisiones que interactúan entre sí tiene implicaciones sobre cómo podemos
cambiar nuestras vidas si así lo deseamos. La razón por la que algunas decisiones se toman mediante
sistemas emocionales (pavlovianos), mientras que otras son cadenas de acciones reactivas
(procedimentales) y otras se toman solo después de una extensa consideración de las opciones
(deliberativo) es que cada uno de estos sistemas tiene ventajas y desventajas. El sistema deliberativo es
lento de ejecutar (lleva tiempo considerar esas opciones) pero flexible (considerar dejar tu trabajo no
significa que lo harás). El sistema procedimental es realmente bueno para acciones que deben suceder de
la misma manera cada vez y rápidamente (como tocar un instrumento musical).
Los sistemas emocionales son fundamentales para las interacciones sociales.
237
Machine Translated by Google
238 Epílogo
(bien entrenado) El sistema procedimental recibe rienda suelta y descubre que puede lanzar strikes de manera
confiable. Por supuesto, esto solo funciona si el sistema procedimental ha sido entrenado adecuadamente.
Aunque generalmente no tenemos control consciente de los comportamientos procedimentales durante la
4
ejecución de ese comportamiento, la decisión de practicar a menudo es consciente. Como todo Como cada
A
músico sabe, la clave para tocar bien una pieza es practicarla.
De manera similar, los sistemas pavlovianos emocionales son fundamentales para tomar decisiones
siones. 5 apropiadas. El coraje no es la ausencia de miedo, sino la superación del miedo. 6 Uno debería ser
El miedo a un edificio en llamas. Y, como vimos en el capítulo 23, estas reacciones emocionales son
fundamentales para desenvolvernos adecuadamente en el entorno social en el que vivimos. El castigo altruista
(la voluntad de sacrificar parte de las ganancias propias para castigar a un tramposo) se produce porque
sentimos respuestas emocionales a la injusticia. 7
No sólo es posible entrenar a cada uno de los sistemas individualmente, sino que es posible aprender a
navegar entre sistemas, aprendiendo cuándo deliberar y cuándo permitir que se ejecuten. Además, los cambios
8
ejecutar el sistema de reconocimiento en las estructuras de apoyo (como el sistema procedimental para
de situaciones, capítulo 12) pueden cambiar las decisiones de uno. 9 Por ejemplo, darse cuenta de que no
existe “tal cosa como una bebida” para un alcohólico significa que las opciones no son entre el aburrido Dr.
Jekyll y un hombre elegante y de mundo, sino más bien entre el Dr. Jekyll y Mr. Hyde. Esto cambia las
decisiones de uno.
Nuestra comprensión de cómo tomamos decisiones tiene enormes implicaciones para la forma en que nos
entendemos a nosotros mismos, cómo interactuamos con los demás, cómo vemos el mundo que nos rodea y
cómo definimos y tratamos la disfunción mental. Aunque se sabe mucho sobre el sistema de toma de
decisiones y cómo el cerebro crea la mente, todavía hay mucho que se desconoce. La mayoría de los
conceptos que hemos discutido en este libro todavía son áreas de investigación muy activa dentro de la
comunidad científica. Hay una gran cantidad de preguntas abiertas que aún no tienen respuesta. ¿Cómo
interactúan estos múltiples sistemas? ¿Qué controla qué sistema impulsa el comportamiento cuando los
múltiples sistemas de decisión están en conflicto? ¿Cómo ocurre la transición de Deliberativo a Procedimental
(hábito)? ¿Qué es realmente el autocontrol? ¿Cómo nos cambia el cambio de nuestra narrativa conceptual?
¿Cómo afecta el sistema de motivación pavloviano a los sistemas de selección de acciones Deliberativo y
Procedimental (hábito)? ¿Cuál es el papel de la atención en la evaluación, particularmente durante la
deliberación? ¿Qué efecto tiene el tratamiento en la adicción o en otras enfermedades psiquiátricas? ¿Qué
es lo que falla en estas enfermedades psiquiátricas? ¿Cómo podemos determinar las causas subyacentes?
¿Podemos aprender a guiar a cada paciente individual hacia el tratamiento adecuado? Todavía queda mucho
trabajo por hacer en este aspecto. ¿Qué vamos a encontrar a continuación? No lo sé, pero estoy seguro de
que será un gran viaje.
A. David Redish
Minneapolis, Minnesota, 2010–2013
A
A menudo, el impulso para practicar viene del exterior, como lo sabe todo padre que engatusa a su hijo para que
practique un instrumento musical, todo sargento de instrucción que impulsa a los nuevos reclutas y todo asesor que impulsa a
los estudiantes de posgrado.
Machine Translated by Google
APÉNDICE
En estos tres apéndices, abordo cuestiones relacionadas con la función neuronal (A),
la representación (B) y la memoria (C). En cada uno de ellos, hay cuestiones
computacionales interesantes que tienen una relación indirecta con los procesos de
toma de decisiones, pero cuya complejidad es tangencial al tema principal del libro
(cómo tomamos decisiones).
Machine Translated by Google
Apéndice A
En primer lugar, el cerebro está formado por células. Cada neurona tiene todo el material biológico
necesario para el funcionamiento normal de las células. Cada neurona individual del cerebro tiene
un núcleo y comparte el mismo código genético con todas las demás células del cuerpo. Cada
neurona tiene toda la maquinaria para traducir ese código genético en ARN y, luego, en proteínas.
En segundo lugar, una neurona es un dispositivo de procesamiento de información. Tiene una enorme
cantidad de maquinaria intracelular (y extracelular) que reacciona a los cambios de tal manera que
Calcular información.
Información
A
En La asombrosa historia de la mecánica cuántica , Jim Kakalios sostiene que las tecnologías que
cambiaron nuestro mundo en el siglo XX son todas avances en el procesamiento de la información.
241
Machine Translated by Google
242 Apéndice A
1 B
Shannon, un ingeniero que trabajó para Bell Labs, Basándose en el trabajo que realizó en criptografía,
do
2
tanto por su cuenta como en colaboración con Alan Turing durante la Segunda Guerra Mundial.
Matemáticamente, Shannon se dio cuenta de que la “información” consistía en separar los posibles códigos
en grupos. D Shannon caracterizó esto como responder a preguntas de sí/no. Cada respuesta a
una pregunta de sí/no equivalía a un bit de información. En el mundo moderno, nos encontramos con esta
definición de información todos los días. La memoria de la computadora y la capacidad del disco duro
generalmente se miden en unidades de ocho bits llamadas "bytes" (como en megabytes [un millón de bytes] y
gigabytes [mil millones de bytes]). Un byte consiste en ocho pequeñas cosas físicas que pueden estar cada
una en uno de dos estados (encendido/apagado, sí/no). En la memoria de su computadora o en una memoria
USB, esa pequeña cosa física suele ser un pequeño imán que se puede girar de un lado a otro. En un CD, esa
pequeña cosa física es un minúsculo hoyo excavado en el plástico que refleja la luz de diferentes colores
según la profundidad a la que se haya excavado.
Shannon se dio cuenta de cómo utilizar la teoría de la probabilidad para definir matemáticamente menos
de un bit de información. El juego Twenty Questions se basa en este concepto. Si los pájaros vuelan y los
mamíferos caminan, entonces responder a la pregunta ¿vuela? proporciona información sobre si la persona
está pensando en un pájaro o en un mamífero. Por supuesto, algunos pájaros no vuelan (pensemos en los
pingüinos) y algunos mamíferos sí (pensemos en los murciélagos). Dado que ¿vuela? separa en gran medida,
pero no por completo, a los pájaros de los mamíferos, la respuesta a ¿vuela? proporciona menos de un bit de
información sobre si la persona está pensando en un pájaro o en un mamífero.
La toma de decisiones consiste en cambiar nuestras acciones en función de la información que tenemos
disponible en el mundo.
Neuronas
Las neuronas (como todas las células) mantienen una diferencia de voltaje entre el espacio intracelular y el
extracelular. Hay más iones con carga negativa dentro de la célula que fuera, lo que crea una diferencia de
voltaje entre el interior y el exterior de la célula. En efecto, una neurona es como una batería, que mantiene un
voltaje a través de la membrana celular. Esta batería se mantiene a través de pequeños orificios en la
membrana llamados canales iónicos . E El ion ese
B
Bell Labs era el departamento de investigación del monopolio telefónico AT&T. Para aquellos demasiado
jóvenes como para recordarlo, el sistema de telefonía fija en los Estados Unidos estaba originalmente controlado
por una empresa monopólica, AT&T. Se dividió en muchas pequeñas empresas en 1984.
La mejor descripción de la teoría de la información y su papel en la criptografía que he visto jamás está en el
Cryptonomicon de Neal Stephenson , en el que los Aliados intentan determinar cómo utilizar los códigos alemanes
y japoneses que han descifrado (que descifraron utilizando la naciente teoría de la información) de tal forma que los
alemanes y los japoneses no se den cuenta de que los códigos han sido descifrados.
El concepto de “información” resulta ser idéntico al concepto termodinámico de entropía, y por lo tanto la cantidad de información necesaria
La física de la entropía, la teoría de la información y la termodinámica quedan fuera del alcance de este libro, pero
hay muchos libros buenos sobre el tema. Recomiendo Decoding the Universe de Charles Seife, The Quark and the
Jaguar de Murray GellMann o The Cosmic Code de Heinz Pagels o su Perfect Symmetry . El nuevo libro de James
Gleick , The Information, A Theory, A History, A Flood, es un excelente análisis de la historia y el significado de la
teoría de la información.
mi
En realidad, los canales iónicos no son agujeros, sino bombas especializadas. Cada canal solo permite
el paso de ciertos iones. Por eso, existen canales de potasio, que solo permiten el paso de potasio (continuación)
Machine Translated by Google
Apéndice A 243
Los canales están formados por proteínas de formas intrincadas que forman dispositivos mecánicos que permiten el
flujo de ciertos iones, mientras que restringen el flujo de otros iones. Las proteínas están formadas por largas cadenas
de aminoácidos que siguen el patrón del ADN, traducido a través de los mecanismos del ARN.
Estos canales iónicos son pequeñas máquinas mecánicas. Mientras que algunos de ellos
están constitutivamente abiertos, permitiendo siempre el flujo de iones específicos, otros pueden
abrirse y cerrarse. Por ejemplo, un tipo de canal, el canal de potasio dependiente de voltaje, tiene
literalmente una bola de aminoácidos en una cadena de aminoácidos unida a la base. Cuando el
voltaje en la célula cambia, la cadena cambia de forma y la bola se mete en el canal, bloqueándolo.
Como otro ejemplo, el canal de sodio dependiente de voltaje se retuerce como un iris para abrirse
o cerrarse dependiendo del voltaje de la membrana. En realidad, hay muchos subtipos de canales
de potasio y sodio dependientes de voltaje, cada uno con propiedades ligeramente diferentes.
Estas propiedades cambian la dinámica de la neurona para que realice el procesamiento de
información que realiza. Este paso desde el cual los canales iónicos se expresan en el lugar de la
neurona hasta cómo esa neurona procesa la información es un área de investigación muy activa
en la neurociencia actual. Algunos de estos pasos son conocidos, otros todavía se están
investigando.
La clave para el procesamiento de la información en el cerebro es un fenómeno llamado potencial de acción o (más
coloquialmente) el “pico”. Un pico es un evento breve en el que se abren canales específicos que permiten la entrada
de iones positivos, lo que cambia el voltaje a través de la membrana; luego, el primer conjunto de canales comienza a
cerrarse y se abre un segundo conjunto de canales, lo que reduce el voltaje. Todo este proceso lleva unas milésimas
de segundo (unos milisegundos). Una célula integra los cambios en su voltaje a través de la membrana y dispara un
pico cuando ese voltaje se vuelve lo suficientemente grande (cruza un umbral). 3
Siguiendo las definiciones de Shannon, la información se puede medir comparando el grupo de situaciones en las
que una célula (o un conjunto de células) emite un impulso con el grupo de situaciones en las que la célula (o el
conjunto de células) está en silencio. 4 Recuerde que Shannon definió la información como separaciones entre grupos:
emitir o no un impulso es una pregunta de sí o no sobre algo y lleva información sobre ese algo, sea lo que sea. Para
responder cómo los neurocientíficos aprenden qué es ese algo, tendremos que esperar hasta el Apéndice B, donde
abordaremos cuestiones de medición de a qué están sintonizadas las células .
¿Cómo hacen llegar la información las células a la siguiente célula? Esto nos lleva al concepto de sin ,
ábsideque
). conecta una célula con otra. Una espiga en una célula libera una sustancia química (llamada
neurotransmisor ) a través de un espacio muy pequeño (20 nanómetros o 20 milmillonésimas de metro) entre las
células y cambia el voltaje de la otra célula. Algunas sinapsis son excitatorias
y hacer que la segunda célula tenga más probabilidades de disparar picos, mientras que otras sinapsis son inhibidoras.
y hacer que la segunda celda tenga menos probabilidades de disparar picos.
Los canales iónicos son canales que permiten el paso de iones, canales de sodio, que solo permiten el paso de
sodio, canales de calcio, canales de cloruro, etc. Se sabe muy bien cómo funcionan los canales iónicos y cómo se
,
genera el voltaje de la membrana, y se pueden encontrar descripciones en muchos libros de texto de neurociencia.
Para aquellos interesados, Neuroscience, editado por Dale Purves y colegas, es un excelente punto de partida. Para
aquellos que quieran una comprensión más profunda de los canales en sí, Ion Channels of Excitable Membranes de
Bertil Hille sigue siendo el texto clásico y es legible para un estudiante avanzado.
Machine Translated by Google
244 Apéndice A
Por supuesto, cuando hablamos de sistemas biológicos, las cosas nunca son tan sencillas. En realidad,
hay muchos neurotransmisores diferentes y muchos receptores sinápticos diferentes para detectarlos. Hay
receptores sinápticos en la neurona presináptica. También hay receptores sinápticos, llamados receptores
acoplados a proteína G , que, en lugar de permitir que los iones fluyan hacia adentro, liberan un complejo
proteico unido, que luego interactúa con otras proteínas dentro de la célula. Esto genera un interflujo
extremadamente complejo de procesamiento de información intracelular. En general, no necesitaremos
entrar en detalles sobre las cascadas de proteínas para este libro, pero son una parte importante del
procesamiento celular, particularmente en cómo las células cambian durante el aprendizaje.
En una primera aproximación, las neuronas toman información a través de sus dendritas, realizan
cálculos sobre ella en las dendritas y el soma, y luego envían información a través del axón, principalmente
al decidir cuándo y si disparar un potencial de acción (pico), que viaja por el axón y libera una sustancia
química a través de una sinapsis que conecta con otras neuronas en el cerebro. Como ocurre con todas
las primeras aproximaciones, esta descripción a menudo es errónea en los detalles, aunque sea correcta
en general. Algunas neuronas también realizan cálculos en sus dendritas; algunas neuronas se conectan
a través de sinapsis dendrita a dendrita; algunas neuronas no disparan potenciales de acción; algunas
neuronas se conectan con otras neuronas con conexiones eléctricas en lugar de sinapsis químicas; etc.
Pero la descripción inicial de una neurona con una dendrita, un soma y un axón, conectada a otras neuronas
a través de sinapsis, es suficiente por ahora.
Podemos imaginarnos a cada neurona en equilibrio entre las entradas excitatorias que la estimulan a
activarse y las entradas inhibidoras que la suprimen. El cerebro pasa el tiempo en un equilibrio dinámico
entre opciones, como un jugador de béisbol que se apoya sobre las puntas de los pies, listo para saltar
hacia adelante para robar la segunda base o listo para lanzarse de nuevo a la primera. Lo hace exactamente
por la misma razón que el corredor de bases: para poder reaccionar rápidamente.
Las teorías actuales sugieren que muchas disfunciones cerebrales son condiciones en las que algo se
ha desequilibrado. La epilepsia, por ejemplo, es casi con certeza una consecuencia de una inestabilidad
en la excitación (que alienta a las neuronas a disparar picos) y la inhibición (que las frena). 5 Lo interesante
de la naturaleza del equilibrio dinámico (en particular debido a su dependencia de la retroalimentación) es
que se puede producir el pico de epilepsia como un incendio forestal con una inestabilidad en la excitación
o una inestabilidad en la inhibición. También se están investigando otras enfermedades, como la
esquizofrenia, como equilibrios dinámicos que se han vuelto inestables. 6
Este equilibrio existe en todos los niveles, desde el nivel de sistemas, donde múltiples sistemas de
toma de decisiones compiten por una decisión, hasta el nivel neuronal, donde las entradas excitatorias e
inhibitorias se equilibran para mantener las neuronas funcionando al ritmo justo, hasta el nivel subcelular,
donde residen el aprendizaje y la memoria.
Memoria
La memoria puede definirse como cambios que reflejan una historia de modo que las respuestas futuras
difieran debido a ella. Así como todo lo que nos permitió diferenciar dos señales es información, todo lo que
cambia de manera confiable en respuesta a un pasado puede considerarse un recuerdo de ese pasado. La
abolladura en el guardabarros del automóvil "recuerda" que fue golpeado. El guardabarros será más débil
y puede responder de manera diferente la próxima vez. Uno de los principios de este libro es
Machine Translated by Google
Apéndice A 245
que todas las observaciones psicológicas y mentales que observamos tienen instancias físicas.
La materialización física de la memoria reside en los cambios que se producen en las sinapsis
que conectan las neuronas entre sí y en las cascadas de proteínas internas dentro de cada neurona.
Los cambios primarios en el sistema nervioso durante el aprendizaje se producen en las sinapsis: el
grado de efecto que la célula presináptica tiene sobre la célula postsináptica cuando esta última
activa su pico. Ahora se sabe que estos cambios se producen en todo el cerebro, en el hipocampo,
Nosotros ahora
la corteza, el cerebelo, los ganglios basales e incluso la médula espinal. 7
Sepa que estas fortalezas de conexión dependen del entorno interno de las cascadas de proteínas
8
dentro de la célula y del momento de los picos presinápticos y postsinápticos.
Podría ser útil hacer un recorrido desde un receptor sensorial hasta el cerebro. Como vimos en
nuestro ejemplo del termostato al principio del libro, un proceso de decisión requiere medir el mundo,
procesar la información oculta en esas mediciones y luego actuar en función de esa información.
¿Cómo percibe el mundo el sistema neuronal?
El primer paso es que debe haber neuronas sensoriales, neuronas que disparan potenciales de
F
acción en respuesta a estímulos Algunas células, como los bastones y los conos de la retina, reaccionan
sensoriales a través de cascadas de proteínas. Los bastones y los conos contienen una proteína
sensible a la luz llamada opsina ; en respuesta a los fotones que golpean la retina, estas moléculas
cambian su forma, lo que provoca una cascada de otros cambios proteicos, el último de los cuales
es abrir un canal iónico y cambiar el voltaje en la célula. En otras células, la proteína de traducción
es un canal iónico directo en sí misma. Por ejemplo, las células pilosas del oído contienen canales
iónicos con pequeños resortes hechos de proteína en ellos. A medida que la onda sonora mueve los
pelos de la célula, los pelos tiran de los resortes proteicos, estirando el canal iónico y permitiendo
que los iones fluyan hacia adentro, cambiando el voltaje de la célula. Entonces, literalmente, estas
células tienen sensores que traducen o transducen la realidad física del mundo al mundo de
información interior de nuestros cerebros.
En el otro extremo, las neuronas motoras envían axones a los músculos. Los músculos son
células excitables al igual que las neuronas y también pueden disparar potenciales de acción (picos).
Debido a que todos los músculos se alinean en estructuras ordenadas, la activación de muchos
potenciales de acción en el tejido muscular se puede detectar eléctricamente con bastante facilidad.
Estos potenciales de acción basados en los músculos son los que se detectan en un ,
electrocardiograma (EKG [la K proviene del alemán Kardio que significa "corazón"]). En otros grupos
musculares, estas mismas señales generalmente se detectan con electromiografía (EMG [ myo
proviene de la palabra griega para músculo]). Cuando mueves cualquier músculo de tu cuerpo, los
músculos disparan potenciales de acción. Los potenciales de acción abren canales de calcio en la
célula muscular, que luego se traducen nuevamente en fuerza física por una proteína sensible al
calcio ( miosina ) que se contrae en presencia de calcio.
F
En realidad, la mayoría de las células sensoriales directas de los mamíferos no disparan potenciales de acción. Liberan
sustancias químicas sinápticas a una velocidad proporcional a su voltaje. Sin embargo, las células que se encuentran más abajo (por
ejemplo, las células ganglionares visuales de la retina o las neuronas del nervio auditivo) generalmente disparan potenciales de acción.
Machine Translated by Google
246 Apéndice A
La red neuronal que constituye el cerebro puede recibir información del mundo a través de sus
sistemas sensoriales y puede actuar sobre el mundo a través de sus sistemas motores. Este libro
trata de los pasos intermedios, de cómo una red de células, en constante flujo dinámico, procesa
la información que contiene para tomar las medidas adecuadas en las situaciones adecuadas.
Los detalles de cómo funcionan las neuronas se dan en los primeros capítulos de muchos libros de texto
de neurociencia, muchos de los cuales son realmente fáciles de leer para aquellos que no tienen miedo de
sumergirse en el tema.
• Dale Purves et al. (2008). Neurociencia . Sunderland, MA: Sinauer Associates. • Neil R.
Carlson (2010). Fisiología del comportamiento . Boston: Pearson. • Eric
Kandel, James H. Schwartz y Thomas M. Jessell (2000). Principios de la neurociencia .
Ciencia . Nueva York: Elsevier .
Machine Translated by Google
Apéndice B
Cada neurona activa sus impulsos que transportan información sobre algún aspecto del mundo, alguna señal sensorial,
alguna acción motora que debe realizarse, algún proceso interno o alguna combinación de los tres. Una de las
preguntas clave en la neurociencia del comportamiento es: ¿Qué información codifica el patrón de impulsos de una
neurona?
Generalmente respondemos a esta pregunta relacionando la activación neuronal de una célula con alguna variable
de comportamiento a través de una curva de sintonización . Clásicamente, una curva de sintonización define la
probabilidad de que veas picos de una neurona determinada cuando ocurre un evento. Por ejemplo, una célula auditiva
en la corteza auditiva primaria puede estar sintonizada a una frecuencia de sonido específica. Si escuchas un tono a
esa frecuencia, esa célula disparará picos.
Otras células se sintonizarán con aspectos de ese sonido, el timbre, incluso la canción específica si la reconoces. Una
célula visual en la corteza visual primaria puede estar sintonizada con un punto de luz, pero otras células en las cortezas
visuales más profundas (a veces llamadas "células de orden superior") pueden estar sintonizadas con un punto de luz.
247
Machine Translated by Google
248 Apéndice B
Las cortezas cerebrales (porque sus representaciones requieren más procesamiento) están adaptadas a
caras, árboles u otros objetos.
Es importante tener en cuenta que la curva de ajuste de una célula no explica por qué la célula está
ajustada a esa información en el mundo, sólo que el disparo de la célula está correlacionado con ella .
Las células visuales están sintonizadas con las señales visuales porque la luz impacta en la retina, que
activa las células ganglionares de la retina, que transmiten información al tálamo, que luego envía señales
a la corteza visual, haciendo que las señales disparadas por la neurona en la corteza visual se correlacionen
con la entrada visual. Las células de la corteza motora primaria están sintonizadas con movimientos
musculares específicos porque envían su salida a las neuronas que controlan los motores en la médula
espinal, por lo que su activación influye en el músculo y sus señales se correlacionan con su
movimientos.
Muchos neurocientíficos dirán que las curvas de sintonía sólo se pueden aplicar a variables de conducta
que se relacionan directamente con el mundo inmediato del animal, señales sensoriales (después de un
destello de luz, un sonido específico) o acciones motoras (precedentes al movimiento de un músculo
específico), pero el cerebro es un objeto físico. Cuando piensas en tu abuela, se activan algunas células
que representan la información sobre ella.
Si piensas en cómo se veía la última vez que la viste, se activan células que representan información sobre
su rostro. Si piensas en su voz, se activan células que representan información sobre cómo sonaba.
Gran parte de la literatura neurocientífica popular más antigua hablaba de la “célula abuela”, lo que
implicaba que había una sola célula en el cerebro que se activaba con los pensamientos de la abuela y
sólo de la abuela. Como veremos más adelante, esta hipótesis es incorrecta.
Las representaciones en el cerebro están distribuidas . Algunas células se activarán más para las mujeres
que para los hombres, otras células para las personas mayores más que para los jóvenes y otras células
para aspectos específicos de su abuela, como su voz o su rostro, y es ese conjunto de células el que
representa el concepto de su abuela, no cualquiera de esas células.
Para entender el concepto de una representación distribuida, imagine que enciende la televisión y ve
que está mostrando un partido de fútbol. Quiere saber qué equipos están jugando porque quiere decidir si
es un partido que quiere ver, pero la cámara simplemente pasa por encima de la audiencia. (Para que
este experimento mental funcione, deberá ignorar el hecho de que los programas deportivos de televisión
modernos tienen pequeños cuadros de texto en la esquina de la pantalla que le indican quién está jugando
y cuál es el resultado). A partir de la ropa de los fanáticos, probablemente podría hacer una muy buena
suposición sobre los dos equipos. Mirar a un solo fanático no le dirá. Tal vez a esa persona simplemente le
guste ese equipo. Es posible que los fanáticos no usen la camiseta del equipo, pero es probable que usen
ropa con los colores del equipo. Si nota que la mayoría de los fanáticos usan los colores de un equipo
específico, eso es una buena indicación de qué equipos están jugando. Probablemente notará que hay
camisetas y colores de dos equipos que se representan con mucha más frecuencia. Los aficionados
representan información sobre qué equipos están jugando. De hecho, probablemente puedas determinar
qué equipo está jugando bien en un momento dado por las expresiones en los rostros de los aficionados
de un equipo en comparación con los del otro. Los aficionados son una representación distribuida de los
dos equipos: puedes aprender mucho sobre el juego con solo observar a los aficionados.
Matemáticamente, una célula puede representar cualquier variable siempre que su activación esté
relacionada de manera fiable con esa variable. Por ejemplo, las células del hipocampo de los roedores están
sincronizadas con la ubicación del 1animal.
A medida que el animal se desplaza por un entorno, una célula de lugar
determinada disparará picos en una ubicación preferida (el campo de lugar de la célula). Esto no es un
Machine Translated by Google
Apéndice B 249
No es una respuesta sensorial ni una señal de iniciación motora, sino una representación de la
ubicación.
Las curvas de sintonización a menudo implican una activación intensa ante un único estímulo
preferido, que luego disminuye a medida que el estímulo difiere de ese estímulo preferido. Por ejemplo,
las neuronas auditivas en la corteza auditiva primaria tienen una frecuencia preferida en la que activan la
mayor cantidad de picos; a medida que la frecuencia del sonido suministrado disminuye en cada dirección,
2 Cada neurona auditiva tiene una frecuencia preferida
la cantidad de picos que activa la célula disminuye.
diferente. Cuando escuchas una nota, cada célula disparará picos que reflejen los armónicos de esa nota.
Las células de lugar en el hipocampo tienen una ubicación preferida. En el centro de ese campo de lugar,
la célula dispara la mayor cantidad de picos de manera más confiable; a distancias de ese campo de
lugar, la célula dispara cada vez menos picos, hasta que se queda en silencio. Cada célula de lugar está
sintonizada con una ubicación diferente en el espacio en un entorno diferente. La representación de una
posición en el entorno implica una distribución de células que disparan, algunas (con ubicaciones
preferidas cerca de la posición) disparan mucho y algunas (con ubicaciones preferidas lejos de la posición)
disparan solo un poco.
Sin embargo, las curvas de ajuste no tienen por qué tener un único estímulo preferido. 3 Lo único
que importa es que el pico de la célula sea informativo de manera confiable acerca de la variable conductual.
Dado que la información tiene como objetivo definir grupos, esto equivale a decir que la variable
conductual debe brindar información confiable sobre los tiempos de activación de la célula. 4
Esto significa que podemos determinar información sobre la representación del mundo que tiene el
animal a partir del disparo de las células. Volvamos a las células de lugar. Cada célula de lugar está
sintonizada con una ubicación diferente en el espacio. Esto significa que podemos invertir la curva de
sintonización: si sabemos qué ubicación está representada por esa célula de lugar, entonces cuando esa
célula de lugar dispara picos, podemos inferir que el animal está representando información sobre esa
ubicación. Aun así, un campo de lugar típico es bastante grande. (En ratas, los campos de lugar pueden
variar en tamaño desde 20 centímetros hasta metros5 de
) Aún más importante, la relación entre los picos de
longitud.
disparo y la ubicación del animal no es del 100%. A veces, una célula dispara picos cuando el animal está
fuera del campo de ubicación de la célula; a veces, la célula no dispara cuando el animal está en el campo
de ubicación. Pero si tenemos dos células con campos de ubicación superpuestos, podemos ser más
precisos porque podemos determinar si la primera célula está disparando pero no la segunda, si la
segunda célula está disparando pero no la primera, o si ambas están disparando.
Las tecnologías actuales nos permiten registrar simultáneamente hasta varios cientos de células de
animales despiertos y en movimiento. Al integrar la información de cientos de células, podemos descifrar
6 A partir de varios cientos de células,
la ubicación con bastante precisión.
podemos decodificar la ubicación con una precisión de más de un centímetro. Incluso podemos
determinar cuándo las células representan una ubicación diferente de la ubicación actual del
animal. 7
Podemos determinar dónde está imaginando o pensando el animal.
Podemos leer la mente de la rata.
A
La forma en que estas células de lugar determinan la ubicación del animal para decidir cuándo disparar las
púas es un asunto complejo: la rata no tiene un GPS incorporado para determinar su ubicación. Lo que sucede en
realidad es que mantiene un registro de su posición mediante la estimación (si sé dónde estoy y doy un paso hacia
adelante, sigo sabiendo dónde estoy, estoy un paso por delante de donde estaba) y aprende a asociar señales
espaciales (como puntos de referencia) con esas representaciones de ubicación, lo que permite al animal restablecer
su representación cuando se pierde. Para aquellos interesados, mi libro anterior Beyond the Cognitive Map describe
este proceso con gran detalle.
Machine Translated by Google
250 Apéndice B
Otras señales
Dado que ya hemos hablado sobre el registro de señales eléctricas y la identificación de patrones de
activación neuronal a partir de ellas, una buena próxima señal para discutir es el potencial de campo local ( LFP ).
Si se toma la misma señal eléctrica que aparece en los electrodos y se escuchan los componentes de baja
frecuencia en lugar de los de alta frecuencia, se pueden registrar. Actualmente, nadie está completamente
B LFP.
seguro de cómo se generan las LFP, pero parecen estar relacionadas con las corrientes eléctricas
8
lentas que surgen de las sinapsis.
En muchas estructuras cerebrales como el hipocampo y los ganglios basales, las células cercanas no
tienden a procesar la misma información, y las señales LFP no llevan información sobre la tarea en cuestión,
pero sí sobre cómo el cerebro está procesando esas tareas. 9 Estas señales LFP tienden a indicar el estado
del sistema y probablemente reflejen diferentes regímenes de procesamiento. Por ejemplo, cuando estás
atento, escuchando activamente a alguien que te habla o intentando activamente comprender nueva
información que estás leyendo, la señal LFP en tu hipocampo muestra un ritmo de 7 a 10 Hz, casi sinusoidal,
llamado “actividad lenta rítmica” (RSA) o theta (por la banda de frecuencia que cubre). Por el contrario, si
te estás desvaneciendo, sin escuchar realmente, perdiendo la atención, quedándote dormido, la señal LFP
en tu hipocampo muestra una actividad arrítmica de espectro más amplio llamada “actividad irregular de
gran amplitud” ,(LIA). 10
En contraste, en el neocórtex de los mamíferos, las células cercanas sí procesan información similar. 11 (Una
de las cosas más notables sobre la corteza de los mamíferos es que, aunque el cerebro en sí es
incuestionablemente tridimensional en su conectividad y su estructura, la corteza en sí es más una lámina que
una estructura tridimensional. Las seis capas de corteza forman una lámina delgada que cambia enormemente en
área pero no mucho en profundidad entre mamíferos. La evolución parece estar tomando una plantilla específica
y copiándola en 12 ) Debido a que las unidades de procesamiento en dos dimensiones para hacer cortezas cada
en pequeñas columnas de 0,3 milímetros de ancho, donde todas vez más grandes. corteza están dispuestas
las células en una columna están procesando cosas similares, hay evidencia de que las LFP en la corteza pueden
llevar señales sobre la información en esa columna. 13
Imagina que estás intentando entender el juego de fútbol americano pero no puedes verlo. Todo lo que
tienes es un micrófono que puedes bajar para escuchar a una sola persona.
Quizás puedas escuchar al mariscal de campo o al entrenador y aprender mucho sobre el juego.
Esto es como una grabación unicelular, donde descubres que la señal de tu micrófono te dice mucho sobre
la variable de comportamiento (el juego). Por otro lado, puedes terminar escuchando al fanático borracho
en la tercera fila, o al hombre de negocios discutiendo sobre ventas de acciones, y no encontrar mucha
relación con lo que está sucediendo en el juego. Sin embargo, si levantas tu micrófono y escuchas el rugido
de la multitud, también puedes aprender sobre el juego. Si escuchas
B Recuerde que los picos son destellos de 1 milisegundo, por lo que se ven mejor con filtros de frecuencia
configurados alrededor de 1 kilohertz (cambios que ocurren en el orden de 1 milisegundo). Los picos generalmente se
registran utilizando filtros configurados de 600 Hz a 10 kHz, que detectan cosas que suceden en el orden de un
milisegundo o más rápido. Los LFP generalmente se registran utilizando filtros configurados de 0,1 a 400 Hz, que
detectan cosas que suceden en el orden de décimas o centésimas de segundo.
Machine Translated by Google
Apéndice B 251
Si la multitud grita "¡Defensa! ¡Defensa!" o si la multitud está muy callada, puedes determinar con bastante precisión qué
equipo está a la ofensiva y cuándo. Puedes saber cuándo ocurre una jugada realmente buena (o realmente mala)
simplemente escuchando el volumen de la multitud. Eso es como el LFP en el hipocampo o en los ganglios basales. Si
todos los fanáticos de un equipo están sentados juntos y todos los fanáticos del otro equipo están sentados juntos, incluso
podrías saber qué equipo está ganando por el volumen de los gritos de cada grupo. Eso es como el LFP en la corteza.
El electroencefalograma (EEG)
Muchas personas están familiarizadas con una forma de LFP registrada fuera del cráneo: el electroencefalograma (EEG).
14 Los electrodos de EEG se colocan alrededor del cuero cabelludo y registran los mismos tipos de ondas que los LFP.
Al igual que con los LFP, los EEG se utilizan principalmente para categorizar los estados cerebrales. Muchas personas,
por ejemplo, están familiarizadas con el sueño de ondas lentas y REM, que se pueden identificar por las oscilaciones del
EEG. Los diferentes estados de ánimo y atención también se pueden medir por los cambios del EEG. Por ejemplo, los
estados tranquilos y relajados a menudo se identifican con ritmos de EEG (que surgen de la corteza) en el rango de 8 a
12 Hz (confusamente llamados "ondas alfa" en la literatura sobre EEG y "ondas theta" en la literatura sobre LFP).
Las personas pueden aprender a controlar sus ritmos EEG. 15 En la actualidad, existen juegos que
utilizan señales de EEG para controlar pelotas o luces. Se dice que estos juegos permiten “controlar
la pelota con la mente”. Miden las señales de EEG de un auricular y utilizan la relación de potencia
en diferentes regímenes de frecuencia (normalmente alfa [8–12 Hz] a beta [12–30 Hz]) para cambiar
la velocidad de un ventilador que impulsa una pelota hacia arriba o hacia abajo. 16
Cuando las señales de EEG se miden en respuesta a eventos de impulso en lugar de observar las frecuencias en
curso en la oscilación, estas señales a veces se denominan potenciales relacionados con eventos (ERP). 17 Ocurren
cuando un solo evento impulsa suficiente actividad en el cerebro para ser detectado como un cambio brusco en el EEG.
Una de las señales ERP más estudiadas es la negatividad relacionada con el error (ERN), en la que el EEG registrado
en la parte frontal del cuero cabelludo cambia en respuesta a la realización de un movimiento. Curiosamente, esta
18 un error.
actividad ocurre aproximadamente 100 milisegundos después de que uno comienza el movimiento, lo que
puede ser mucho antes de que el movimiento se complete. (El ERN parece reflejar esa señal de "oops, eso está mal" que
a veces sentimos cuando reaccionamos demasiado rápido). Ahora sabemos que el ERN surge de señales en la corteza
cingulada anterior, que está involucrada en el monitoreo de acciones y permite que uno tome una acción diferente de la
que normalmente tomaría. (Véase, por ejemplo, la discusión sobre la superación de una fobia y el enfrentamiento de los
experimentos primarios de medición de información en este libro provienen de experimentos con animales porque
tenemos la tecnología para registrar neuronas individuales y conjuntos neuronales en animales. C Dicha tecnología
do
Es importante destacar el gran cuidado que tienen los neurocientíficos, en particular los neurocientíficos del
comportamiento, en el tratamiento de sus animales. Un animal angustiado no realiza bien las tareas, en particular las
tareas complicadas como las que se requieren para los experimentos de toma de decisiones. Todos los experimentos
252 Apéndice B
implantación de electrodos de alambre en el sujeto; por lo tanto, esto se hace sólo con fines clínicos
tratamiento.
En ocasiones, se permite a los científicos aprovechar la implantación clínica y (con el permiso del
sujeto y la supervisión de un comité de revisión) registrar los electrodos implantados por otros motivos.
Dos ejemplos de casos en los que se implantan de forma rutinaria dichos electrodos son la
determinación de los sitios de inicio de las convulsiones epilépticas y la estimulación cerebral profunda
para el tratamiento de la enfermedad de Parkinson.
En pocas palabras, la epilepsia implica que las neuronas se vuelven locas. El primer tratamiento
que se intenta son generalmente los medicamentos anticonvulsivos, pero eso funciona sólo para una
porción limitada de la población epiléptica. 19 Si los tratamientos farmacológicos no funcionan, una
opción alternativa es literalmente quemar la parte del cerebro que se vuelve loca. Por supuesto, dañar
la parte equivocada del cerebro es extremadamente problemático (hemos visto algunos ejemplos
trágicos en este libro), y los médicos son muy cuidadosos para hacer todo lo posible para asegurarse
de que sólo obtienen el punto de partida correcto para la epilepsia y que la parte que van a extirpar no
está involucrada en facultades intelectuales críticas. Para hacer esto, implantan electrodos y registran
20
neuronas individuales y LFP mientras el sujeto realiza
Dado quetareas.
tener los electrodos en el cerebro no es un
proceso doloroso y el registro de las neuronas no daña el cerebro, muchos pacientes están felices de
realizar algunas tareas cognitivas adicionales y permitir que los científicos registren su cerebro durante
el procedimiento.
Sin embargo, estas grabaciones sólo se pueden tomar en situaciones muy limitadas (durante las
raras ocasiones en que un paciente tiene una razón clínica para tener electrodos implantados) y en
pacientes con cerebros disfuncionales (por eso están recibiendo el tratamiento clínico). Para estudiar la
función normal en no pacientes, necesitamos una tecnología capaz de registrar señales neuronales de
sujetos despiertos. Ya hemos hablado del EEG. Existe una tecnología de medición relacionada llamada
MEG que funciona como el EEG pero utiliza el componente magnético de la onda electromagnética.
Aunque el cráneo distorsiona menos el MEG que el EEG, tanto el MEG como el EEG sufren de una
incapacidad para localizar la señal. Estas tecnologías pueden apuntar a la "corteza frontal" en lugar de
a la "corteza visual" (que está en la parte posterior del cerebro), pero no pueden decirte qué está
sucediendo en el componente de reconocimiento de formas de la corteza visual, o el cuerpo estriado
de los ganglios basales, o el hipocampo.
Si ha seguido la neurociencia en la prensa popular durante las últimas décadas, probablemente se esté
preguntando por qué no he incluido la resonancia magnética funcional (fMRI) hasta ahora. La fMRI se
ha convertido en una técnica muy querida por la prensa popular porque permite obtener información
sobre el cerebro de sujetos humanos normales y crea imágenes hermosas.
Se puede realizar en personas normales que realizan tareas humanas complejas, como el lenguaje y la
cognición. Pero lo que es realmente importante entender sobre la fMRI (y sus parientes, como la
tomografía por emisión de positrones [PET]) es que mide el flujo sanguíneo, no la actividad neuronal.
21
Los experimentos que se llevan a cabo en cualquier universidad moderna deben ser aprobados por un comité de cuidado
de animales que incluye tanto a veterinarios y activistas comunitarios como a científicos. Este comité no solo tiene la tarea
de verificar el tratamiento de los animales, sino también de determinar si el experimento que se está realizando es “lo
suficientemente importante” como para justificar el uso de los animales.
Machine Translated by Google
Apéndice B 253
relacionadas, pero no exactamente de qué manera. Ésta sigue siendo un área de investigación activa en neurociencia.
22
Sabemos que cuando un área está “neuronalmente activa” (por ejemplo, su
corteza visual primaria está más activa cuando está mirando una escena visual parpadeante, como una
película, que cuando está cerrando los ojos y escuchando una escena auditiva, digamos escuchando
música), las células están usando glucosa, extrayendo energía adicional del cuerpo.
23;D Las neuronas sobrecargadas envían una señal a los capilares para permitir que fluya
más sangre. En realidad, las neuronas no necesitan más oxígeno, por lo que fluye más sangre, pero se
extrae la misma cantidad de oxígeno, por lo que lo que fluye se vuelve menos desoxigenado, lo que es
detectable con una resonancia magnética. Estos cambios en el flujo sanguíneo se denominan respuesta
hemodinámica, que se produce en el transcurso de unos 4 a 5 segundos. (Recuerde que un solo pico
neuronal es 1 milisegundo, es decir, ¡1/1000 de segundo!) El tiempo de reacción humano típico a un
estímulo sorprendente es de solo unos pocos cientos de segundos.
dred milisegundos. Los investigadores de resonancia magnética han desarrollado formas de inferir la
"actividad neuronal" a partir de la respuesta hemodinámica para identificar el momento, relacionando
esencialmente el flujo sanguíneo con eventos que ocurrieron 4 a 5 segundos antes de que se detectara la
señal, pero incluso eso no puede llegar a lo que están haciendo las neuronas individuales o el momento
específico de sus picos.
No está claro en este momento qué está causando que las neuronas gasten toda esa energía. Esto
significa que la fMRI puede decirnos qué partes del cerebro están trabajando duro, pero no puede decirnos
cómo las neuronas en esa parte del cerebro están procesando la información.
El cerebro es un componente del cuerpo que consume mucha energía. Aunque representa solo un par de por ciento del
peso corporal (un cerebro típico pesa un poco menos de 1,5 kg [3 libras]), consume aproximadamente el 20% de las reservas
24
de energía habituales.
Esta es la clave del béisbol: un lanzamiento a 100 mph tarda 400 milisegundos en llegar al plato. Esto significa que un
bateador tiene aproximadamente menos de la mitad de la distancia entre el montículo y el plato para decidir si golpear o no la
pelota y para determinar dónde estará la pelota y cuándo cruzará el plato. Por supuesto, si un bateador puede predecir qué
lanzamiento vendrá antes de que el lanzador lo lance, el bateador puede estar mejor preparado para reconocer el lanzamiento.
Esta es la esencia de la inteligencia: usar la información y las expectativas para ayudar a tomar mejores decisiones rápidamente.
Machine Translated by Google
254 Apéndice B
Correlación y causalidad
Todas las tecnologías descritas anteriormente son correlacionales . Se preguntan hasta qué punto cambian
juntas dos señales: una señal neuronal (activación de neuronas, LFP, EEG, flujo sanguíneo en el cerebro) y una variable
conductual (la ubicación del animal, una señal sensorial, una acción motora). Lógicamente, la correlación no es causalidad. El
hecho de que dos cosas ocurran simultáneamente no significa que una haya causado la otra. La correlación es necesaria
(aunque no suficiente) para la causalidad y, en la práctica, es un indicador bastante bueno de causalidad. Sin embargo, los
científicos en general, y los científicos médicos en particular, están particularmente preocupados por la causalidad porque no
quieren cometer el error de pensar que dos cosas que ocurren simultáneamente se causan mutuamente. Por eso han
Lesiones
El método más antiguo de manipulación del sistema era dañarlo físicamente, lesionar una parte del
mismo. Si esa parte es crítica para realizar alguna tarea, entonces el animal (humano o no) se verá
afectado en esa tarea. Obviamente, no se puede entrar y lesionar tejidos humanos con fines
experimentales. Sin embargo, el cerebro es un órgano biológico particularmente sensible, que
requiere un flujo sanguíneo constante. Cortar el suministro de sangre (o incluso el de oxígeno)
incluso durante unos pocos minutos puede provocar la muerte neuronal, dejando a la persona con
una desafortunada lesión cerebral.
26 Esto es lo que ocurre durante un accidente cerebrovascular, por ejemplo.
F
Debido a la forma en que se ramifican los vasos sanguíneos del cerebro, es común que un accidente cerebrovascular
ocurra por encima de la corteza parietal derecha (justo encima y detrás de la oreja derecha). 28 Cuando esta parte del cerebro
está dañada, las personas tienen problemas para reconocer el lado izquierdo de los objetos visuales.
G Esta incapacidad para reconocer objetos en un lado del campo visual se denomina negligencia hemiespacial
porque implica la incapacidad de procesar (descuida) la mitad del (hemi) campo visual espacial. Los pacientes con negligencia
hemiespacial dibujarán solo el lado derecho de un reloj y verán el reloj solo si está en el lado derecho de su campo visual.
La negligencia hemiespacial ocurre incluso en espacios imaginados. En un experimento clásico, Eduardo Bisiach y Claudio
Luzatt pidieron a pacientes con negligencia hemiespacial que imaginaran la Piazza Del Duomo en Milán (la ciudad natal de los
pacientes). 30 Pidieron a los pacientes que imaginaran estar de pie en el extremo sur de la Piazza y que nombraran los edificios
de la plaza. Cada paciente enumeraba solo los edificios del lado este (su derecha). Cuando se les pidió que imaginaran estar
de pie en el extremo norte y que nombraran los edificios, nombraron solo los del lado oeste (su derecha). Cuando se les
F
En realidad, durante un accidente cerebrovascular se producen varios procesos dañinos a lo largo de minutos, horas o días.
Uno de esos procesos es que la disminución del flujo sanguíneo puede hacer que las células pierdan el equilibrio y comiencen a disparar a un
ritmo elevado, lo que provoca la muerte de las células. Un tratamiento que pueda llegar a las células antes de que mueran puede ayudar a
Los sistemas sensoriales y motores se cruzan en el cerebro. Así, el campo visual izquierdo y la mano izquierda son procesados por el
GRAMO
lado derecho del cerebro. Lo que, en la evolución de los sistemas, los llevó a cruzarse todavía es objeto de debate, pero hay algunas pruebas
de que los primeros animales de presa tenían conexiones directas desde los sistemas sensoriales hasta los músculos del lado opuesto. 29 Si
algo viene hacia ti por el lado izquierdo, ¡quieres ir hacia la derecha rápidamente!
Machine Translated by Google
Apéndice B 255
¡Imagínense, aunque habían nombrado los otros edificios sólo unos minutos antes!
31
La imaginación visual utiliza los mismos sistemas perceptivos que usamos al ver.
Otros accidentes cerebrovasculares comunes afectan notoriamente ciertas áreas motoras y del
lenguaje, lo que lleva a incapacidades para procesar el lenguaje. Debido a que diferentes accidentes
cerebrovasculares afectan la capacidad de reconocer o producir lenguaje, incluso en la década de 1870,
Paul Broca (18241880) y Carl Wernicke (18481905) pudieron identificar por separado las ubicaciones del
cerebro humano que controlaban la producción del habla (ahora llamada área de Broca ) o el reconocimiento
del habla (ahora llamada área de Wernicke ). 32
Las lesiones cerebrales también pueden surgir de procedimientos médicos, algunos intencionales,
otros no. Por ejemplo, la epilepsia que no se puede controlar por medios farmacológicos (con medicamentos)
33
aún puede controlarse a veces eliminando el foco o el sitio de origen. La La epilepsia es como una avalancha.
epilepsia es una enfermedad que no tiene un punto de partida, desde el cual se propaga. Si ese punto de
partida es constante de una crisis a otra en un paciente y se puede encontrar, se puede eliminar. Por
supuesto, eliminar una parte del cerebro daña su capacidad para procesar información, pero a veces se
debe encontrar un equilibrio entre vivir con epilepsia y vivir con un cerebro dañado.
La resección (extirpación) del hipocampo en pacientes epilépticos (como HM) fue fundamental para el
descubrimiento de que existen al menos dos sistemas de toma de decisiones separados (deliberativo,
dependiente de la función hipocampal, y procedimental, independiente de la función hipocampal). 34
El problema de inferir funciones a partir de estudios de lesiones es que para resolver tareas se
necesitan muchos componentes. Volvamos a la analogía del termostato del capítulo 2: hay muchas lesiones
que se podrían hacer al termostato que enfriarían tu casa.
El horno podría estar averiado. Si es un horno a gas, la llama piloto podría estar apagada o el gas
apagado. El sensor de temperatura podría estar averiado. Todo esto haría que el calefactor no se
encendiera y que la casa estuviera fría, pero no queremos concluir que el sensor de temperatura y la luz
piloto estuvieran haciendo lo mismo.
El otro problema de las lesiones es el de la compensación . Como organismos biológicos, tenemos
sistemas de respaldo. (Durante la mayor parte de la evolución, no había un taller de reparación al que
acudir si algo se estropeaba, por lo que los animales que desarrollaron sistemas de respaldo tenían más
probabilidades de sobrevivir y procrear que los que no los tenían). Si un animal ha tenido tiempo suficiente
para recuperarse de la lesión, puede haber encontrado nuevas formas de hacer algo y puede ser capaz de
resolver las mismas tareas de formas diferentes a las que lo haría un animal intacto.
Para evitar la compensación, y puesto que no se puede controlar moralmente las lesiones que se ven en
los seres humanos (las únicas lesiones humanas que se van a ver son las causadas por fenómenos
naturales), los científicos han desarrollado varias técnicas complejas para inactivar partes del cerebro de
forma fiable. La técnica más común utilizada en animales es farmacológica, en la que se infunde en una
zona del cerebro una cantidad muy pequeña de una sustancia química que afecta temporalmente a las
neuronas. Por ejemplo, la lidocaína bloquea un tipo determinado de canal de iones de sodio, lo que impide
que las neuronas se activen. Cuando el dentista inyecta lidocaína debajo de la encía, impide que los
nervios de la piel se comuniquen con el cerebro, lo que deja la boca entumecida ante cualquier dolor que
pudiera causar el procedimiento posterior.
En los seres humanos, no se desea inyectar sustancias químicas en el cerebro de los sujetos
experimentales, pero recientemente se ha desarrollado una nueva tecnología llamada estimulación
magnética transcraneal (EMT). 35 La EMT crea un campo magnético que cambia rápidamente y que puede estimular
Machine Translated by Google
256 Apéndice B
y luego interrumpen la activación neuronal en un área específica de la corteza. El efecto es disruptivo pero
yo
transitorio y desaparece después de unos minutos.
Manipulaciones genéticas
Debido a que los procesos neuronales (como los canales sinápticos que escuchan neurotransmisores
específicos) dependen de la estructura genética de la célula de manera continua, al cambiar esa estructura
genética se modifica la forma en que la célula procesa la información. Ahora existen nuevas tecnologías
37 I
que permiten la manipulación directa de esa estructura genética. ;
Si se modifica el ADN (por ejemplo, para incluir la información para construir un nuevo y diferente tipo de
canal iónico), entonces la célula seguirá ese ADN.
Ahora sabemos que el ADN es más como un lenguaje de programación, con enunciados del tipo “si
entonces” y otros tipos de control local (como en “si la proteína X está presente, entonces también se
genera la proteína Y ”). Esto significa que las manipulaciones genéticas modernas pueden expresar nuevas
proteínas (nuevos canales iónicos, nuevos procesos) de modo que aparezcan sólo en un subconjunto
limitado de células, como por ejemplo sólo en las neuronas CA3 del hipocampo; o de modo que aparezcan
sólo en presencia de una sustancia química extrínseca, como el antibiótico doxiciclina; o de modo que sólo
aparezcan después de un cierto tiempo, como por ejemplo sólo en células que están activas (que disparan
muchos picos) durante la tarea. 39 Estas manipulaciones producen cambios en las capacidades de los
animales para resolver tareas, lo que nos informa sobre cómo funciona el sistema, físicamente.
En los últimos años, los investigadores han desarrollado una nueva tecnología que consiste en
implantar genéticamente en un animal un canal iónico sensible a la luz. 40 Estos canales producen cambios
de voltaje en respuesta a determinadas frecuencias de luz. Esto significa que si se proyecta una luz sobre
células que tienen estos canales, se puede inducir a las células a que emitan picos o impedir que lo hagan.
Como estos canales iónicos se pueden colocar en células específicas de áreas específicas del cerebro,
pueden proporcionar un control notable del mecanismo neuronal. Se trata de un campo en auge llamado
optogenética y tiene el potencial de revolucionar nuestra comprensión de los mecanismos reales de la
función cerebral.
Por supuesto, los sistemas celulares también son eléctricos y también se puede pasar corriente al sistema
para manipularlo. Por ejemplo, un tratamiento común para la enfermedad de Parkinson es la estimulación
cerebral profunda, en la que se coloca un electrodo en una estructura (comúnmente el núcleo subtalámico,
una parte de los ganglios basales). La estimulación regular de este electrodo (entre 50 y 200 Hz,
dependiendo de lo que funcione para el paciente) de alguna manera restablece el funcionamiento normal.
41
El núcleo subtalámico, lo que le permite procesar la información correctamente nuevamente.
La estimulación cerebral profunda hace maravillas en algunos pacientes, no sabemos por qué, no sabemos
La seguridad de la TMS aún es objeto de debate. 36 Para la mayoría de las personas, parece que los efectos a corto
plazo desaparecen bastante rápido, pero los efectos a largo plazo aún se desconocen.
I
Cabe señalar que hemos podido manipular los genes durante miles de años. Los humanos criaron perros para que
cría selectiva 38
fueran más amigables, vacas para que dieran más leche y maíz para que fuera comestible
mucho antes de las manipulaciones genéticas modernas. Las tecnologías modernas simplemente hacen que la
manipulación sea más directa.
Machine Translated by Google
Apéndice B 257
Se sabe cuál es el mecanismo. Hay muchas teorías, entre ellas la de que impide la activación
neuronal, apagando así una estructura disfuncional; que restablece las oscilaciones neuronales que
se han vuelto patológicas; y que facilita (o dificulta) la transmisión de información por parte de los
axones que pasan por la estructura. 42
La estimulación también puede utilizarse para manipular la información que se representa en el
cerebro. A mediados de los años 90, William Newsome y sus colegas lograron cambiar las decisiones
que tomaba un mono que observaba un estímulo visual estimulando ciertas partes de la corteza
visual. El mono tenía que decidir si un conjunto de puntos en una pantalla se movía en una dirección
u otra. Al estimular la parte del cerebro que representaba el movimiento visual, pudieron cambiar la
decisión del mono, presumiblemente modificando su percepción.
43
Varios laboratorios han intentado utilizar implantes de retina para restaurar la visión en pacientes
traducidasciegos . 45 De manera similar a los implantes cocleares, las imágenes externas son
por una cámara a señales eléctricas que se envían a electrodos de estimulación en la retina. Los
primeros ensayos clínicos están ahora en marcha. Una de las principales complicaciones de los
implantes cocleares y visuales es que la estimulación tiene que coincidir con las representaciones
neuronales que el cerebro espera. Al comprender los principios de la representación, hemos podido
comenzar el proceso de la cibernética, recuperando realmente la función perdida.
M. Green y John F. Kalaska (2011). Aprendiendo a mover máquinas con el 61–75 . • Adam Johnson,
mente. Tendencias en neurociencias, 34, André
A. Fenton, Cliff Kentros y A. David Redish (2009).
En busca de la cognición en la estructura del ruido. Tendencias en Ciencias Cognitivas, 13 55– ,
64 .
• Frederick Rieke, David Warland, Rob de Ruyter van Steveninck y William Bialek
(1996). Spikes . Cambridge, MA: MIT Press.
J Si aún necesitas convencerte en este punto de que la mente existe dentro del cerebro, esta es la prueba final.
La manipulación de la activación de las células cerebrales modifica la percepción, la decisión y la acción que
se lleva a cabo. Somos seres físicos.
Machine Translated by Google
Apéndice C
Huelo dulce de
tuna en flor.
Cuando una cámara digital toma una fotografía de la fiesta de cumpleaños de tu hijo y la escribe en su
tarjeta de memoria flash, traduce esa fotografía en un conjunto de señales de encendido y apagado (“bits”
A ), que escribe en la tarjeta. Luego escribe la ubicación en la “tabla de asignación de archivos”, que es
básicamente un índice de ubicaciones en la tarjeta de memoria. Cuando quieres recuperar la fotografía, la
cámara comprueba el índice, lo sigue y lee el archivo. Cuando la cámara almacenó por primera vez la
fotografía en su tarjeta de memoria, le dio un nombre como img_3541.jpg,
Lo cual no te dice nada sobre el contenido de esa imagen. Tu cerebro también puede almacenar información
como el recuerdo de la fiesta de cumpleaños de tu hijo en pequeños cambios a través de muchas neuronas,
en este caso a través de cambios en la fuerza de conexión entre neuronas. Pero no hay un índice central.
En cambio, el recuerdo completo se recupera del contenido parcial.
el olor de la tarta de cumpleaños, el sonido de la risa de los niños, la visión de un juguete específico.
A Recuerde que un bit es la respuesta a una pregunta de sí/no (Apéndice A). Ocho bits = un byte.
Cuando tu ordenador tiene 4 GB de memoria, eso equivale a 4 gigabytes, o 4 mil millones de bytes. Por supuesto,
no hace mucho tiempo los ordenadores solo tenían 1 MB (un megabyte = 1 millón de bytes) o incluso 640 KB (un
kilobyte = 1 mil bytes). Ahora, la tarjeta flash de mi cámara digital tiene 32 GB, y hay disponibles incluso más grandes.
259
Machine Translated by Google
260 Un apéndice
por índice
Stonehenge druidas
Salisbury
plano
neolítico Inglaterra
samurai
Vidrieras
Figura C.1 Memoria direccionable por contenido. La información puede ser direccionada por índices (ya
sea por nombres relacionados [como stonehenge.jpg] o por nombres no relacionados [como
img_1054.jpg]) o por memoria direccionable por contenido. Las memorias direccionables por contenido
se almacenan de manera que se vinculen imágenes y conceptos similares. Así, una imagen borrosa
de Stonehenge, una imagen recortada en papel de Himeji y un dibujo a lápiz de Notre Dame recuperan
sus respectivas imágenes. De manera similar, las memorias pueden ser recuperadas por contenido conceptual.
El término memoria direccionable por contenido proviene de la literatura sobre ciencias de la computación y
psicología de la década de 1980. En ciencias de la computación, el término se usaba para contrastar con la
memoria direccionable por índice, que es la forma en que su computadora portátil, de escritorio o teléfono
inteligente almacena
1
Eninformación.
psicología, el término se utilizó porque la memoria humana se activa con 2
como las imágenes, los sonidos o los olores de la fiesta de cumpleaños. (comparar la figura C.1),
El concepto, sin embargo, proviene del famoso libro de Donald Hebb de 1949. 3
Conjuntos de células
Una de las frases más famosas de la neurociencia es “las células que se activan juntas se conectan
entre sí”, que supuestamente proviene de un libro de 1949 sobre neuropsicología del psicólogo
Donald Hebb. Sin embargo, esa frase no está en realidad en el libro de Hebb; en cambio, la cita es
de un párrafo que concluye: “Cuando un axón de la célula A está lo suficientemente cerca como para
excitar a una célula B y participa repetida o persistentemente en su activación, se produce algún
proceso de crecimiento o cambio metabólico en una o ambas células de modo que aumenta la
eficiencia de A, como una de las células que activa a B” (Hebb, 1949/2002, p. 62). De este párrafo,
obtenemos los términos sinapsis hebbiana y aprendizaje hebbiano .
El concepto de que la cocombustión conduce a un aumento de la conectividad es casi seguro
anterior a Hebb. En cierto sentido, es la traducción obvia de las teorías de que la mentación es
asociativa, que se remontan a David Hume en el siglo XVIII, si no antes. 4 El propio Hebb dice que
la idea general es antigua (Hebb, 1949/2002, p. 70). En su perspectiva histórica sobre la LTP, Bruce
McNaughton cuenta que Hebb se sorprendió por el entusiasmo por la
Machine Translated by Google
Apéndice C 261
la “sinapsis hebbiana”, que data al menos de Lorento de No, y que es el único mecanismo de
asociación evidente. 5 De hecho, el famoso párrafo del libro de Hebb es el paso de
suposición en su teoría, no el paso de predicción: el párrafo completo comienza con “Supongamos que…”
Lo que Hebb realmente estaba proponiendo era que si vemos este mecanismo en un sistema cortical,
entonces obtendríamos conjuntos de células y memoria direccionable por contenido .
Hebb definió un ensamblaje celular como un conjunto de células que trabajan juntas para representar
un conjunto específico de información. A veces, el término "ensamblaje celular" se utiliza para identificar una
sola cosa; por lo tanto, el conjunto de células activas cuando piensas en el perro que tuviste cuando eras
niño forma un ensamblaje celular. A veces, el término se utiliza para identificar un conjunto de cosas; por lo
tanto, el conjunto de células activas cuando ves o piensas en perros formaría un ensamblaje celular.
6
El concepto importante en ambos casos es que no es una sola célula la que forma estos conjuntos.
En ambos casos, estamos hablando de grupos de células que trabajan juntas. Una sola célula puede
participar en múltiples conjuntos de células, pero algunas células diferirán entre ellas. Esto significa que solo
en el agregado un observador podrá diferenciar representaciones en esta población de células. Podemos
preguntar cuál es la curva de ajuste de una sola célula, pero no podemos decodificar la representación a
partir de ella. Para eso necesitamos una población de células, un conjunto de células. Este tipo de
representación se llama distribuida porque la representación está distribuida en toda la población.
El concepto de Hebb era que las células que representan, por ejemplo, el sonido del ladrido de ese
perro, el color de su pelaje y cómo te sentiste cuando lo abrazaste, estarían todas vinculadas entre sí porque
estas experiencias tendían a ocurrir simultáneamente. 7 Así, el sabor de un ratatouille preparado como
lo hacía tu madre podía traer de vuelta una avalancha de recuerdos: de tu ciudad natal, de tu juventud y de
esa emoción familiar que puede derretirte el corazón. 8 Las sinapsis hebbianas completarían una parte del
ensamblaje celular para formar la memoria completa. La memoria podría abordarse únicamente por su
contenido.
La derivación conceptual de Hebb se produjo antes de la base matemática necesaria para estudiarla, y
los conceptos de ensamblaje celular y memoria direccionable por contenido no se probaron ni exploraron
hasta los años 1980 y 1990, después del desarrollo de las tecnologías computacionales y neurofisiológicas
9
necesarias.
En términos computacionales, la memoria direccionable por contenido equivale a completar una imagen
10
patrón. parcial. Imagine una imagen degradada, donde algunos de los píxeles han sido reemplazados
por ruido. Con suficiente ruido, gran parte de la imagen cambiará tanto que ya no podrá reconocerla, pero
durante mucho tiempo antes de eso, aún podrá reconocer la imagen, incluso a través del ruido.
Los modelos informáticos de este tipo han demostrado que un sistema muy bueno para completar
patrones parciales es almacenar conexiones entre cada píxel que representan las similitudes y diferencias
entre los píxeles. Para simplificar, imaginemos una imagen en blanco y negro, donde cada píxel está
encendido o apagado . Si dos píxeles están encendidos, pueden apoyarse
mutuamente, pero cuando el par de píxeles están opuestos entre sí (uno encendido, el otro apagado), se
contrarrestan entre sí. Esta es una red estudiada originalmente por John Hopfield, quien demostró en un
artículo muy famoso de 1982 que una red de este tipo completará una imagen degradada a una imagen
11
almacenada original. Hopfield era físico en CalTech en ese momento.
Machine Translated by Google
262 Un apéndice
Usando matemáticas originalmente derivadas de la física para describir cómo el hierro se vuelve
magnético cuando se enfría (los polos magnéticos de los átomos individuales se alinean lentamente),
mostró cómo se puede definir un error o superficie de energía para entender cómo el sistema pasó
de la imagen ruidosa y degradada a la imagen recordada.
Imaginemos que representamos la actividad de todas nuestras neuronas como un punto en un
espacio de muy alta dimensión.
12 Cada neurona proporciona una dimensión y la posición a lo largo de
esa dimensión es la tasa de disparo de la neurona. Esto es más fácil de pensar con sólo dos
neuronas, por lo que tenemos sólo dos dimensiones, pero las matemáticas funcionan con cualquier
número de dimensiones. En cualquier momento en el tiempo, nuestro patrón de disparo a través de
la población de neuronas es un punto en este espacio n dimensional. Podemos describir la función
de error (energía) como altura en una tercera dimensión (( n + 1)th dimensión). Esto nos da una
superficie con colinas y valles. Lo que Hopfield fue capaz de demostrar fue que su red siempre rodaría
cuesta abajo y que los pesos sinápticos en su red podrían construirse de modo que el fondo de los
valles correspondiera correctamente a los patrones almacenados (recordados). La fuerza de la
conexión entre las células del patrón determina la profundidad de la cuenca que representa ese
13
patrón y la probabilidad de que una ruede hacia abajo en ella.
Imaginemos que almacenamos algún patrón (por ejemplo, una imagen de El pensador de Rodin )
en nuestra red (Figura C.2). Esto significa que el patrón de actividad en toda la red que corresponde a
nuestra imagen de esa imagen icónica va a estar en el fondo de uno de estos valles. Luego degradamos
ese patrón añadiendo ruido. Cuando ponemos ese patrón degradado en nuestra red, comienza en
algún punto diferente de nuestra memoria almacenada. Pero entonces la actividad de nuestra red
,
comienza a cambiar: las neuronas que están apagadas pero tienen muchas otras neuronas conectadas
que dicen que deberían estar encendidas, comienzan a encenderse; las neuronas que están
encendidas, pero no tienen mucho apoyo para permanecer encendidas, se apagan. A medida que
cambia el patrón de actividad, nos movemos a lo largo de esa superficie de energía/error. Somos una
pelota que rueda cuesta abajo. Finalmente, llegaremos al fondo del valle de El pensador .
Por supuesto, como vimos en nuestro análisis de las neuronas reales (Apéndice A), las neuronas
no están encendidas o apagadas . En cambio, emiten picos, pero estos picos son en respuesta a
señales que llegan a las dendritas de la neurona, que dependen del disparo de otras neuronas y del
peso sináptico entre esas otras neuronas y la neurona en cuestión. Esto produce una red de
neuronas que trabajan juntas.
E=88
E=82
E=74
E=39
E=21
E=0
Figura C.2 Patrones degradados. Podemos medir la diferencia entre patrones como el error
cuadrático medio E. A medida que el patrón cambia con respecto al patrón recordado, el error
aumenta. Podemos utilizar este error como una función de energía. Si se puede encontrar un
medio para moverse hacia abajo en esta función de "error", nos encontraremos completando el
patrón, "recordando" nuestra imagen. Los recuerdos direccionables por contenido funcionan de esta
manera: moviéndose cuesta abajo de la función de error o energía.
Machine Translated by Google
Apéndice C 263
El concepto de esta red de neuronas que trabajan juntas para recordar un recuerdo se
,
denomina a veces conexionismo , porque son las conexiones (sinapsis) entre las neuronas donde
se almacena el recuerdo. La contribución de B. Hopfield fue simplificar el modelo hasta el punto en
que pudo definir la función de energía o error y demostrar que su sistema recordaría el recuerdo
almacenado mediante la finalización de patrones. De hecho, este tipo de modelos funcionan bien,
incluso si solo cambiamos las conexiones excitatorias y usamos la inhibición solo para mantener
un nivel general de actividad, o si tenemos neuronas graduadas, que están tratando de recordar
tasas de disparo o si tenemos, modelos detallados de neuronas en descarga. 15;C Estos
modelos han podido explicar cómo los cambios en los neuromoduladores (como la dopamina, la acetilcolina
o la serotonina) pueden cambiar la capacidad de una red para almacenar recuerdos, así como patrones de
frecuencia de disparo muy específicos (y a menudo sorprendentes) observados en grabaciones neuronales
22 Lo que estos modelos nos dan es una explicación de la memoria
de animales en comportamiento.
consecuencias interesantes.
como categorización , lo cual tiene una serie de
¿Qué sucedería si se almacenaran dos recuerdos en esta red? En ese caso, habría dos valles. Esto
significaría que habría un conjunto de patrones que se extenderían hacia el primer valle y un conjunto
diferente de ubicaciones que se extenderían hacia el segundo valle. A cada uno de estos conjuntos
lo llamamos cuenca de atracción para un valle determinado. Así como el agua al este de la Divisoria
Continental en las Montañas Rocosas de los Estados Unidos fluye hacia el este hasta el Atlántico,
mientras que el agua al oeste de la Divisoria Continental fluye hacia el oeste hasta el Pacífico, los
puntos de partida de una cuenca de atracción fluyen hacia un recuerdo, mientras que los puntos de
partida de la otra cuenca fluyen hacia la otra (Figura C.3).
Lo que realmente ocurre aquí es que el patrón de colinas y valles depende de las conexiones
entre las células. Al cambiar esas conexiones, cambiamos las colinas y los valles y cambiamos
la forma en que nuestra memoria completa los patrones. Almacenar un recuerdo implica cambiar
B El término “conexionismo” se limita a menudo a modelos muy abstractos como el modelo de Hopfield, que obviamente es una descripción muy pobre de las neuronas
reales. Sin embargo, el concepto original del conexionismo era la idea general de que son las conexiones las que importan y que el procesamiento de la información puede
do
Uno de los grandes debates actuales en neurociencia es si la información está representada por la
momento específico de los picos o por la tasa de disparo promedio. Las 16 Mi sospecha es que tanto los picos como los promedios
En algunos casos, resulta evidente que la sincronización específica es fundamental. Por ejemplo, en el sistema de ecolocalización
de los murciélagos, los picos se sincronizan con una precisión de un microsegundo (una millonésima de segundo), porque la velocidad
17 En otros casos, está menos claro.
del sonido significa que el murciélago tiene que reconocer diferencias de tiempo de microsegundos.
Las despolarizaciones en las neuronas corticales, particularmente en sus entradas a lo largo de sus dendritas, no producen picos de
18
manera confiable, lo que sugiere que los picos se basan más en la frecuencia en la corteza.
Mi opinión sobre esto es que existe un continuo que depende de la estructura neuronal involucrada. Un experimento
mental útil es que podemos reformular esta pregunta como "¿En cuánto tiempo podrías desplazar la punta aleatoriamente
antes de que se pierda la información?" 19 Obviamente, inclusolas puntas corticales no podrían desplazarse en segundos.
20 De manera similar, el sistema de ecolocalización de los murciélagos necesita una precisión de las puntas del
microsegundo. 21 Pero, ¿se perdería la información cortical si desplazaras las puntas corticales en un microsegundo? ¿En un milisegundo
¿Por un centisegundo?
Machine Translated by Google
264 Un apéndice
Figura C.3 Cuencas hidrográficas de América del Norte como cuencas de atracción. El ejemplo más
simple de una cuenca de atracción es el de una divisoria de aguas. El agua al oeste de la Divisoria Continental termina
en el Océano Pacífico, mientras que el agua al este de ella termina en el Atlántico. La mayor parte del agua
canadiense fluye hacia el Ártico, pero una parte fluye hacia la vía marítima del San Lorenzo y otra hacia el Pacífico. El
agua de la Gran Cuenca fluye hacia el Gran Lago Salado y no termina en un océano. (Mapa modificado del Servicio
23
esas conexiones para que la memoria esté en el fondo de un valle. Para recordar un
recuerdo es necesario rodar por esa superficie hasta el fondo del valle (Figura C.4). Al cambiar los
pesos de conexión se modifican las cuencas de atracción de cada valle y se modifican los recuerdos
que se recuerdan a partir de qué señales. Resulta que (como predijo originalmente Hebb) la
sinapsis hebbiana (o las modificaciones de la misma que incluyen tanto aumentos como
disminuciones 24 ) cambia los pesos de conexión de la manera correcta para cambiar las cuencas
de atracción. De hecho, muchos recuerdos, con muchos valles y muchas cuencas de atracción, se
pueden almacenar en estas redes. Ahora hay buena evidencia de que varias estructuras cerebrales
25
que almacenan y recuerdan la memoria funcionan de esta manera, incluido el hipocampo y la corteza frontal.
Se pueden ver ejemplos de los efectos de estas cuencas en cómo afectan la categorización:
por ejemplo, en el habla, en la capacidad de reconocer diferencias entre sonidos, o, en la
percepción, en la capacidad de diferenciar colores.
Aunque el habla humana es capaz de producir muchos sonidos de manera fiable, cada lengua
selecciona un subconjunto de esos sonidos para utilizarlos para comunicar información. 26 Así, las
lenguas xhosianas del sur de África incluyen diferentes tipos de chasquidos (por ejemplo, un golpe
de lengua frente a un sonido de deglución), algo que no está incluido en ninguna lengua indoeuropea.
Algunos idiomas diferencian sonidos que otros no. Por ejemplo, en japonés, los sonidos /l/ y /r/
(como en “glosario”) se clasifican como el mismo sonido. Las palabras japonesas incluyen los
sonidos /l/ y /r/, pero los hablantes nativos de japonés no perciben la diferencia. Todos los idiomas
tienen sonidos que clasifica juntos. El inglés, por ejemplo, no diferencia los sonidos /t/ aspirados y
no aspirados, aunque el inglés utiliza ambos.
Machine Translated by Google
Apéndice C 265
Memoria 1
Memoria 2
Memoria 3
Figura C.4 Cuencas de atracción. La cuenca de atracción es el conjunto de puntos que, cuando se les
permite cambiar a través de un sistema dinámico, convergen en el mismo lugar. Si pensamos en el estado
de un sistema neuronal como un punto en un espacio de alta dimensión, entonces podemos describir el
flujo de puntos en este espacio como un espacio de colinas y valles. Los patrones similares cambiarán para
recordar un patrón almacenado.
En realidad, los dos sonidos (/l/ y /r/) forman un continuo en la forma de la boca y la posición de la
lengua. /l/ es la lengua tocando la parte superior delantera del paladar, mientras que /r/ es la lengua
contra los dientes laterales. (La /r/ enrollada del francés o el español incluye un ronroneo glotal con la
lengua contra los dientes laterales). En japonés, todos los sonidos de este continuo entre /l/ y /r/ caen
en la misma cuenca de atracción; activan el mismo conjunto de células y se clasifican como un solo
sonido. En inglés, trazamos una línea entre los extremos de este continuo, separándolos. Más /l/
Los sonidos similares caen en la categoría /l/, mientras que los sonidos más parecidos a /r/ caen en
la categoría /r/; activan diferentes conjuntos celulares y se categorizan de manera diferente. Esta
comprensión de la categorización ha llevado a nuevas técnicas para enseñar a los hablantes de japonés a
D
Para comprobar que la /t/ es diferente en “ton” y “stun”, coloca tu mano a unos centímetros de tu boca y di las
dos palabras. Sentirás tu respiración al decir la /t/ en “ton”, pero no en “stun”.
Machine Translated by Google
266 Un apéndice
/Yo/ /R/
Hablantes de inglés
diferenciar /L/
y /R/...
Reconocer la diferenciación en inglés entre /l/ y /r/ comenzando con la separación más grande,
enfatizando así la diferencia entre ellas, y luego entrenando explícitamente las habilidades de
categorización. 28 Esto permite a los hablantes japoneses crear nuevas cuencas de atracción,
aprender a separar estas categorías y mejorar su capacidad para diferenciar los sonidos. 29 De
manera similar, los padres que hablan con niños pequeños enfatizan demasiado la diferencia
entre vocales individuales, lo que puede ayudar a demostrarles a los niños las claras diferencias
de categoría. 30
Otro ejemplo clásico de categorización aprendida es la diferenciación de colores, que resulta
ser ayudada por ser capaz de nombrar los colores. 31 Aunque hay universales en algunas de las
etiquetas de color entre idiomas, probablemente debido a la neurofisiología 32 (Lo bueno de la
color, cada idioma diferencia los colores de forma un poco diferente. Lo bueno del visión del
color es que uno puede usar colores puros, lo que significa que uno puede medir cuantitativamente
la diferencia entre los dos colores en términos de la longitud de onda de la luz). Los hablantes de
inglés son más capaces de distinguir colores en el límite entre azul y verde que dos colores que
son ambos azules o que son ambos verdes, incluso cuando se enfrentan a pares de colores que
están separados por la misma diferencia de longitud de onda. 33 Esta es una propiedad general
encia. en todos los idiomas. Por ejemplo, mientras que el inglés tiene un único término para el color
azul (“blue”), el ruso tiene dos (синий “seenee”, azul oscuro, y голубой “goloboi”, azul claro). Esto
no significa que los angloparlantes no puedan distinguir el azul claro del oscuro; a menudo
hablamos del azul cielo y del azul marino. Estos son efectos pequeños y sutiles; ciertamente,
reconocemos las diferencias entre los muchos azules en una gran caja de crayones. Estos efectos
no deben confundirse con la idea de que algunos conceptos no existen en algunos idiomas y que
uno no puede pensar en las cosas de una manera que no sea la suya.
No se puede nombrar.
Por ejemplo, algunas personas han argumentado que algunos idiomas no representan el
personas viven siempre en el presente. La hipótesis de “Sapir tiempo o el número, y que esas
Whorf” (nombrada en honor a los lingüistas Edward Sapir y Benjamin
Machine Translated by Google
Apéndice C 267
Whorf, que no debe confundirse con el klingon Worf) y es más conocido por el uso de la neolengua
, se manipulan modificando el lenguaje mismo. Si
en 1984 de George Orwell , donde los conceptos
bien es evidente que el discurso político cambia al enmarcar los conceptos y las cuestiones,
todavía es posible pensar en las cosas, incluso sin terminología para ellas. 35 De manera similar,
el mito de que los inuit tienen veinte palabras para la nieve 36 no debe tomarse como algo tan
37
diferente del inglés. de nieve: aguanieve El inglés también puede identificar veinte tipos diferentes
, hielo, lluvia, nieve ,
, nieve esponjosa , nieve intensa etc. Sin duda, reconocemos las diferencias
entre estas formas de nieve (¡yo lo hago cuando intento palear la nieve de la entrada de mi casa!). La
diferencia es que los inuit tienden a utilizar palabras más precisas para la nieve porque es una parte
importante de sus vidas. De manera similar, mientras que un observador casual puede etiquetar a un
pájaro como "un pájaro", un observador de aves o un cazador sería más preciso y lo etiquetaría como un
"halcón" o incluso un "halcón de cola roja". 38
Los hablantes de ruso han aprendido a categorizar el azul oscuro (синий,seeee) y el azul claro
(голубой, goloboi) en lugar de categorizar el azul juntos. Los hablantes nativos de ruso son más
rápidos para identificar diferencias en los colores azules que cruzan el límite синий (seenee)
голубой (goloboi) que los hablantes nativos de inglés. Estas habilidades dependen del lenguaje:
si a uno se le da una tarea de bloqueo lingüístico (como repetir cadenas aleatorias de números en
silencio mientras se realiza la tarea E ), entonces las diferencias entre los pares de colores que
39
cruzan categorías y los pares de colores dentro de categorías desaparecen.
Se supone que la diferencia entre los hablantes nativos de inglés y los hablantes nativos de
ruso es que los hablantes nativos de ruso han desarrollado dos cuencas de atracción para
separar el azul claro del azul oscuro, mientras que los hablantes nativos de inglés tienen sólo
una. Lo que resulta particularmente interesante de estas categorías es que no son arbitrarias;
se relacionan con experiencias perceptivas universales y con una interacción entre nuestras
percepciones sensoriales y el mundo. 40 Los conjuntos de células de las estructuras de
reconocimiento de colores de nuestra corteza funcionan a partir de las señales de color
específicas del mundo (el azul del cielo, el azul del océano, el rojo de una puesta de sol, el
verde de una hoja, el amarillo de un girasol) y las señales de color específicas que pueden
detectar los fotorreceptores de la retina de nuestros ojos .
E Hemos visto varios casos a lo largo del libro en los que la capacidad de tomar decisiones depende del uso de recursos que
también se utilizan en tareas lingüísticas o de función ejecutiva (conscientes, que requieren esfuerzo mental). Si esos recursos se
utilizan en otra tarea, la capacidad desaparece. La segunda tarea interfiere con la primera. Algunos buenos ejemplos de tareas que
bloquean la función ejecutiva y lingüística incluyen recordar una larga cadena aleatoria de letras o números, decir el alfabeto al revés o
contar hacia atrás desde 1000 de siete en siete. Intente hacer las dos últimas tareas al mismo tiempo.
Los seres humanos normales tienen tres fotorreceptores detectores de color llamados conos, cada uno de los cuales tiene una
amplia sensibilidad al color (lo que hace que esta sea una representación distribuida del color). Los cálculos posteriores que se
producen en nuestra retina y corteza visual comparan la actividad en pares contrastantes de fotorreceptores detectores de color. Esta
es la razón por la que si miras una imagen roja durante suficiente tiempo, cuando mires una pantalla blanca, verás una imagen residual
verde. (Los conos rojos se han cansado y no se activan con tanta fuerza como deberían cuando apartas la mirada hacia la pantalla
blanca). Las personas daltónicas suelen carecer de uno o más de los conos, por lo que las personas con daltonismo rojoverde (falta
del fotorreceptor rojo) pueden diferenciar azul y amarillo, pero no rojo y verde. Los detalles de la percepción del color ocuparían un
libro entero en sí mismos, pero para aquellos interesados, la mayoría de los libros de texto de neurociencia tienen una buena
268 Un apéndice
Desde el punto de vista neurofisiológico, el estudio de los ensamblajes celulares, la memoria direccionable por
contenido y la compleción de patrones requiere la capacidad de registrar la actividad de un gran número de
neuronas simultáneamente, pero por separado. No basta con ver la actividad general de una red, como, por
ejemplo, a partir de un electroencefalograma, un análisis de fase lineal o una resonancia magnética funcional;
es necesario ver el patrón real de activación neuronal. Además, no basta con ver la actividad de una sola
neurona, porque lo que importa no es si una sola neurona se activa cuando se presenta un estímulo o se realiza
una acción; lo que se necesita es ver cómo la actividad de una sola neurona refleja la actividad de sus vecinas.
Los primeros pasos importantes hacia la identificación de conjuntos celulares en sistemas nerviosos reales
se debieron al trabajo de Bruce McNaughton y sus colegas en la década de 1990, donde desarrollaron técnicas
capaces de registrar grandes conjuntos de neuronas simultáneamente. En un famoso artículo publicado en
42
1993, Matt Wilson y Bruce McNaughton registraron simultáneamente más de cien células de ubicación del
hipocampo . El hipocampo ha sido un lugar particularmente útil para examinar conjuntos celulares porque las
células del hipocampo en la rata tienen una representación muy identificable: codifican la ubicación del animal
en el espacio.
Tal como predijo Hebb, la representación mental de las decisiones requiere comprensión de patrones.
finalización de conjuntos celulares e implica trayectorias a través del espacio de ensamblaje celular.
Lakoff (1990/1997). Women, Fire, and Dangerous Things (Mujeres, fuego y cosas peligrosas) . Chicago:
University of Chicago
Press. • Donald O. Hebb (1949/2002). The Organization of Behavior (La organización del comportamiento ).
Nueva York: Wiley/Lawrence
Erlbaum. • John Hertz, Anders Krogh y Richard G. Palmer (1991). Introduction to the Theory of Neural
Computation (Introducción a la teoría de la computación neuronal ). Reading, MA: AddisonWesley.