0% encontró este documento útil (0 votos)

14 vistas283 páginas

The Mind Within The Brain Español

Cargado por

Tamara Vaquero Pérez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

14 vistas283 páginas

The Mind Within The Brain Español

Cargado por

Tamara Vaquero Pérez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 283

Machine Translated by Google

La mente dentro del cerebro

Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

La mente dentro
del cerebro
Cómo tomamos decisiones y cómo esas
Las decisiones salen mal

. DAVID IDREDISHA

1
Machine Translated by Google

3
Oxford University Press es un departamento de la Universidad de Oxford.
Promueve el objetivo de la Universidad de alcanzar la excelencia en investigación, erudición y
educación mediante publicaciones en todo el mundo.

Oxford Nueva York

Auckland Ciudad del Cabo Dar es Salaam Hong Kong Karachi
Kuala Lumpur Madrid Melbourne Ciudad de México Nairobi
Nueva Delhi Shanghái Taipei Toronto

Con oficinas en
Argentina Austria Brasil Chile República Checa Francia Grecia
Guatemala Hungría Italia Japón Polonia Portugal Singapur
Corea del Sur Suiza Tailandia Turquía Ucrania Vietnam

Oxford es una marca registrada de Oxford University Press en el

Reino Unido y algunos otros países.

Publicado en los Estados Unidos de América por

Prensa de la Universidad de Oxford
198 Madison Avenue, Nueva York, NY 10016

© Oxford University Press 2013

Todos los derechos reservados. No se puede reproducir, almacenar en un sistema de

recuperación ni transmitir ninguna parte de esta publicación, en ninguna forma ni por ningún
medio, sin el permiso previo por escrito de Oxford University Press, o según lo permita
expresamente la ley, la licencia o los términos acordados con la organización de derechos de reproducción correspondiente.
Las consultas relativas a reproducciones fuera del ámbito de lo mencionado anteriormente deberán enviarse al
Departamento de Derechos, Oxford University Press, a la dirección indicada anteriormente.

No deberás difundir esta obra en ninguna otra forma y

deberás imponer esta misma condición a cualquier adquirente.

Datos de catalogación en publicación de la Biblioteca del Congreso

Rojizo, A. David.
La mente dentro del cerebro: cómo tomamos decisiones y cómo esas decisiones salen mal / A. David Redish.
páginas cm
Incluye referencias bibliográficas.
Resumen: En La mente dentro del cerebro, A. David Redish reúne investigaciones de vanguardia en psicología, robótica, economía,
neurociencia y los nuevos campos de la neuroeconomía y la psiquiatría computacional, para ofrecer una teoría unificada de
la toma de decisiones humana. Lo más importante es que Redish muestra cómo las vulnerabilidades, o "modos de falla", en el
sistema de toma de decisiones pueden conducir a disfunciones graves, como comportamiento irracional, adicciones, problemas
con el juego y trastorno de estrés postraumático. Abarcando desde los sorprendentes roles de la emoción, el hábito y la
narrativa en la toma de decisiones hasta las preguntas filosóficas más amplias sobre cómo se relacionan la mente y el
cerebro, qué nos hace humanos, la naturaleza de la moralidad, el libre albedrío y el enigma de la robótica y la conciencia,
La mente dentro del cerebro ofrece una nueva perspectiva sobre algunos de los aspectos más complejos del
comportamiento humano. —Proporcionado por el editor.
ISBN 978–0–19–989188–7 (tapa dura)
1. Toma de decisiones. I. Título.
BF448.R43 2013
153,8′3—23 cc* 2012046214

135798642
Impreso en los Estados Unidos de América
en papel libre de ácido.
Machine Translated by Google

Para Laura, Jay, Danny y Sylvia, las

mejores decisiones que tomé.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

CONTENIDO

Prefacio ix
Agradecimientos xiii

LAS DECISIONES Y EL CEREBRO

1. ¿Qué es una decisión? 3

2. El cuento del termostato 9

3. La definición de valor 15

4. Valor, euforia y la señal de “hazlo otra vez” 23

5. Riesgo y recompensa 35

EL SISTEMA DE TOMA DE DECISIONES

6. Sistemas de toma de decisiones múltiples 43

7. Reflejos 61

8. La emoción y el sistema pavloviano de selección de acciones 65

9. Deliberación 75

10. Los hábitos de nuestra vida 87

11. Integración de la información 97

viii
Machine Translated by Google

viii Contenido

12. Las historias que contamos 107

13. Motivación 113

14. El equilibrio entre exploración y explotación 125

15. Autocontrol 133

EL CEREBRO CON MENTE PROPIA

16. La mente física 145

17. Imaginación 161

18. Adicción 171

19. Juego y adicciones conductuales 185

20. Trastorno de estrés postraumático 193

21. Psiquiatría computacional 199

LA CONDICIÓN ZUMBIANCA

22. ¿Qué nos hace humanos? 205

23. La ciencia de la moral 211

24. El enigma de la robótica 227

Epílogo 237
Apéndices 239
Procesamiento de la información en las neuronas 241
B Obtención de información del cerebro 247
C Memoria direccionable por contenido 259
Bibliografía 269
Notas bibliográficas 271
Citas 309
Índice 365
Machine Translated by Google

PREFACIO

Si pudiera, llegaría más allá de la jaula de huesos,

tocar la mente dentro del cerebro,
para alcanzar los nervios asustados que envuelven el corazón;
Yo diría tu nombre allí.

Nuestras decisiones nos hacen ser quienes somos. Aunque nos gustaría pensar que nuestras decisiones se
toman de manera racional y deliberada, muchas de ellas no lo son. Todos sabemos que algunas de nuestras
decisiones se toman de manera emocional y otras de manera reactiva. Algunas tienen consecuencias
previstas y otras tienen consecuencias que nunca imaginamos posibles.
Somos seres físicos. El cerebro humano es una red compleja de neuronas y otras células que recibe
información del mundo a través de sus sistemas sensoriales y actúa sobre el mundo a través de sus sistemas
motores. Pero, ¿cómo esa red de células, en constante cambio dinámico, se convierte en la persona que
eres? ¿Cómo encaja la mente en ese pequeño lugar en la jaula de huesos que es nuestro cráneo? ¿Cómo
procesa la información? ¿Cómo percibe el mundo, determina la mejor opción, selecciona una acción y la
lleva a cabo? ¿Cómo se enamora? ¿Se ríe de la emoción abrumadora de sostener a un bebé? ¿Cómo crea
gran arte o gran música? ¿Cómo siente la emoción triunfante de la Oda a la alegría de Beethoven o el
patetismo devastador de Knock Knock Knocking on Heaven's Door de Bob Dylan ? ¿Cómo canta blues la
dama? ¿Cómo se vuelve adicta y cómo rompe esa adicción? ¿Cómo tiene personalidad? ¿Qué hace que tú
seas tú y que yo sea yo?

En el fondo, todas estas preguntas tienen que ver con la manera en que el ser que reconoces como tú
mismo encaja en este cerebro físico que está enclavado en tu cráneo. En el fondo, estas preguntas tienen
que ver con la manera en que ese cerebro toma decisiones. Este libro es un intento de responder a esa pregunta.

De donde viene este libro

Hace unos años, John Gessner, que dirige un programa local para personas con problemas de juego y sus
familias, me preguntó si estaría dispuesto a dar una charla a sus clientes sobre

ix
Machine Translated by Google

incógnita
Prefacio

Toma de decisiones. Había estado dando charlas en el programa BrainU de Jan Dubinsky para profesores
de secundaria interesados en la neurociencia y recientemente había dado una charla a profesionales
médicos de primera línea (médicos, enfermeras y trabajadores sociales en adicciones) sobre el trabajo
de mi laboratorio para identificar vulnerabilidades en los sistemas de toma de decisiones. John había oído
hablar de esta charla y quería que yo presentara este trabajo a sus clientes.
Yo protesté, diciendo que no era un profesional médico y que no podía decirles cómo arreglar lo que
estaba roto. Él dijo que tenían mucha gente que se lo decía, lo que querían era que alguien les dijera por
qué : ¿ por qué tomamos las decisiones que tomamos? Él dijo que querían saber por qué esas decisiones
se toman mal, especialmente cuando sabían cuáles eran las opciones correctas.

La conferencia en sí fue muy bien. Había varias docenas de personas en la audiencia, y se

involucraron y preguntaron todo el tiempo. Y luego, después, tenían tantas preguntas que me
quedé allí respondiéndolas durante horas. Había un hambre allí que no había apreciado hasta que
conocí a esos jugadores y sus familias, un deseo casi desesperado de entender cómo funciona el
cerebro. Habían visto cómo las cosas pueden salir mal y necesitaban una explicación,
particularmente una que pudiera explicar cómo podían ser seres conscientes que toman decisiones
y, sin embargo, sentirse atrapados. De alguna manera, esa conferencia científica sobre cómo
interactúan los múltiples sistemas de toma de decisiones los llegó a ellos. Entonces me di cuenta
de que tenía un libro que escribir.
En los últimos tres años, este libro ha evolucionado y crecido. Sin embargo, mi objetivo sigue siendo
explicar la ciencia de cómo tomamos decisiones. Por ello, una parte importante de este libro será identificar
1
qué preguntas quedan pendientes. Mi objetivo no es proporcionar un libro
de autoayuda para ayudarle a tomar mejores decisiones. No voy a decirle lo que debe hacer. Tampoco se
incluyen aquí las respuestas para curar la adicción o las malas decisiones. Debe consultar con sus propios
profesionales médicos para obtener tratamiento. Cada individuo es único y sus necesidades deben ser
atendidas por alguien que esté directamente familiarizado con él. Sin embargo, espero que este libro le
resulte esclarecedor. Espero que disfrute de su lectura. Ha sido tremendamente divertido escribirlo.

La estructura del libro

Uno de los hechos más notables que se han producido en las últimas décadas es la convergencia de
diferentes campos en lo que respecta a los mecanismos de toma de decisiones. Campos científicos tan
diversos como la psicología, la robótica, la economía, la neurociencia y los nuevos campos de la
neuroeconomía y la psiquiatría computacional han convergido en el reconocimiento de que la toma de
decisiones surge de una interacción compleja de múltiples subsistemas. De hecho, estos campos han
convergido en una categorización similar de las diferencias entre los subsistemas. En este libro,
exploraremos cómo esta convergencia explica la toma de decisiones que nosotros (como humanos)
hacemos.
He dividido este libro en cuatro secciones. La primera sección ( Las decisiones y el cerebro)
y El sistema de toma de decisiones ) expondrá el trabajo que se ha realizado sobre los mecanismos
básicos: ¿Qué es una decisión? ¿Cómo funciona el sistema de toma de decisiones del cerebro?
¿Cuáles son los componentes que conforman ese sistema de toma de decisiones? Y luego, en la tercera
y cuarta sección se explorarán las consecuencias de ese sistema.
Machine Translated by Google

Prefacio x

La primera sección consta de cinco capítulos, dos capítulos para preparar el terreno (1: ¿Qué es
una decisión? y 2: La historia del termostato ) y tres capítulos para presentar la neuroeconomía básica
,
de la toma de decisiones (3: La definición de valor, 4: Valor, euforia y 5: Riesgo y recompensa ). En la
resultados de que el segunda sección, comenzaremos con la señal DoItAgain , con los
sistema de toma de decisiones se compone de múltiples módulos o subsistemas (Capítulo 6), y luego
dedicaremos un capítulo a cada uno de los sistemas que lo componen (Capítulos 7 a 15).

En la tercera sección ( El cerebro con mente propia ), exploraremos las consecuencias de la

naturaleza física del cerebro, cómo se relacionan la mente y el cerebro, y cómo las vulnerabilidades en
el sistema de toma de decisiones pueden conducir a disfunciones, como la adicción (Capítulo 18), los
problemas con el juego (Capítulo 19) y el trastorno de estrés postraumático (Capítulo 20).

Finalmente, en la cuarta sección ( La condición humana ), exploraremos las cuestiones filosóficas

de lo que nos hace humanos (Capítulo 22), de la moralidad (Capítulo 23) y del libre albedrío y la
conciencia (Capítulo 24: El enigma de la robótica ) a la luz del nuevo trabajo sobre los sistemas de
toma de decisiones discutidos en las secciones anteriores.
He intentado escribir el libro de forma que pueda ser leído de principio a fin por un lector con
conocimientos básicos de neurociencia y de informática; sin embargo, algunos lectores pueden sentir
que desean una introducción más detallada a los conceptos que se tratan en este libro. Para esos
lectores, he incluido tres capítulos en un apéndice, que incluyen ¿Qué es el procesamiento de la
información? y ¿Cómo procesan la información las neuronas?
(Apéndice A), Cómo podemos leer esa información de las señales neuronales (Apéndice B), y Cómo
se almacenan los recuerdos (por contenido, no por índice, Apéndice C).
A lo largo del libro, cada afirmación está respaldada por citas. Estas citas se marcarán con
números en superíndice, que coincidirán con la lista en las notas bibliográficas, que luego harán
referencia a la lista real de citas. 2 Estos números no son notas finales
y no se utilizarán para hacer referencia a ningún texto adicional; están allí solo para respaldar las
afirmaciones del libro. En cambio, la información adicional y los debates que podrían distraer del
flujo del libro se colocarán en notas al pie, marcadas con letras superíndice.A
Cada capítulo comienza con un poema corto y termina con un conjunto de lecturas de seguimiento.
En mi opinión, los poemas son momentos de contemplación que pueden utilizarse para moldear la
perspectiva de uno al leer el capítulo. Como me dijo recientemente un amigo que se recupera de un
cáncer en su cama de hospital: “A veces necesitas la poesía para llegar al corazón de la ciencia”. Las
lecturas complementarias al final de cada capítulo son libros, artículos de revisión, puntos de partida
para quienes desean profundizar en un tema. Si bien las citas en superíndice se referirán a la literatura
principal, parte de la cual puede ser bastante difícil de entender, las lecturas complementarias
deberían ser comprensibles para cualquiera que lea este libro.

A
Prefiero las notas a pie de página a las notas finales porque permiten echar un vistazo al texto sin perder el
rumbo del libro. Generalmente incluiré tres tipos de información en las notas a pie de página: (1) comentarios entre
paréntesis que son demasiado largos para incluirse entre paréntesis (como la etimología y la ubicación de las
estructuras cerebrales); (2) chistes y anécdotas atrevidas que no puedo resistirme a incluir pero que interrumpirían
el flujo del libro si los incluyera en el texto principal; y (3) detalles técnicos cuando hay efectos sutiles de segundo
orden que deben notarse pero que son demasiado complicados para quienes no tienen los antecedentes
necesarios. El libro debería ser legible sin las notas a pie de página, pero espero que las notas a pie de página
agreguen una dimensión adicional para quienes desean más profundidad.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

EXPRESIONES DE GRATITUD

Cualquier proyecto de esta magnitud depende de muchas personas. Los resultados presentados en este
libro incluyen el trabajo de una gran cantidad de científicos que han trabajado en diversos campos durante
los últimos cien años. A lo largo de todo el libro, he hecho todo lo posible por reconocer y citar los artículos
en los que aparecieron por primera vez estas ideas. Estoy seguro de que he pasado por alto algunas y pido
disculpas a mis colegas por cualquier omisión.
Este trabajo nunca hubiera sido posible sin los increíbles y maravillosos estudiantes y
posdoctorados que han pasado por mi laboratorio, en particular Adam Johnson, Steve Jensen,
Matt Hijs van der Meer y Zeb KurthNelson, con quienes he trabajado directamente en estas ideas,
así como Neil SchmitzerTorbert, Jadin Jackson, John Ferguson, Anoopum Gupta, Beth Masimore,
Andy Papale, Nate Powell, Paul Regier, Adam Steiner, Jeff Stott, Brandy Schmidt y Andrew
Wikenheiser. También estoy en deuda con Kelsey Seeland y Chris Boldt, sin quienes mi laboratorio
no funcionaría como lo hace y no habría tenido la libertad de escribir este libro.

Muchas de las ideas que aquí se presentan han sido elaboradas en conversaciones con colegas,
por lo que debo agradecerles por las estimulantes discusiones que hemos tenido en conferencias y
talleres a lo largo de los años, entre ellos Peter Dayan, Read Montague, Larry Amsel, Nathaniel Daw,
Yael Niv, Warren Bickel, Jon Grant, Bernard Balleine, Dave Stephens, John O'Doherty, Antonio Rangel,
Cliff Kentros, Andre Fenton y muchos otros, demasiado numerosos para mencionarlos. Quiero
aprovechar este momento para agradecer a mis amigos y colegas que leyeron borradores de parte o
de todo este libro, en particular a Jan Dubinsky, Matthijs van der Meer y John Gessner, así como a mi
editora Joan Bossert.
Gran parte del trabajo presentado en este libro ha sido financiado por los Institutos Nacionales de
Salud, en particular por subvenciones para el estudio de la toma de decisiones del NIMH y el NIDA. Mi
primera incursión en la toma de decisiones fue financiada por una beca de la Fundación Sloan y por
una beca McKnight LandGrant de la Universidad de Minnesota. Los estudiantes fueron financiados por
becas de formación de la Fundación Nacional de Ciencias y los Institutos Nacionales de Salud. Este
trabajo habría sido imposible sin su generoso apoyo.

Finalmente, este libro está dedicado a mi esposa Laura, mi primera lectora, que leyó cada capítulo,
antes del primer borrador. , Después de eso, y luego otra vez, cuando el libro estuvo terminado,
¿quién ha soportado el tiempo y el estrés que este libro me impuso, quién inspira mi poesía y quién no
me permite salirme con la mía con nada menos que lo mejor que puedo hacer? Este libro, todo el
trabajo que he hecho, es para ella.

xiii
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

PRIMERA PARTE

LAS DECISIONES Y EL SUJETADOR EN

Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

¿Qué es una decisión?

Copos de nieve caen del techo, una

ardilla patina hasta detenerse

¡Salta hacia lo desconocido!

Para poder medir científicamente la toma de decisiones, definimos las decisiones

como “tomar una acción”. Existen múltiples sistemas de toma de decisiones
dentro de cada uno de nosotros. Las acciones que realizamos son consecuencia
de las interacciones de esos sistemas. Nuestra irracionalidad ocurre cuando
esos múltiples sistemas no están de acuerdo entre sí.

Como nos gusta pensar en nosotros mismos como criaturas racionales, nos gusta definir la decisión como la

deliberación consciente sobre múltiples opciones. Pero esto presupone un mecanismo que puede ser correcto o
no. Si somos criaturas tan racionales, ¿por qué tomamos decisiones tan irracionales? Ya se trate de comer esa
última papa frita que es solo una más de las que queríamos o decir algo que no deberíamos haber dicho en la
reunión de la facultad o las cosas que hicimos esa vez que estábamos borrachos en la universidad, todos hemos
dicho y hecho cosas de las que nos arrepentimos. Muchas novelas se basan en un personaje que tiene que
superar un miedo irracional. Muchos alcohólicos han jurado no beber, solo para ser encontrados unos días
después, en el bar, con una bebida en la mano.
Más adelante en este libro veremos que las decisiones que tomamos surgen de la interacción de múltiples

sistemas de toma de decisiones. Amamos porque tenemos reacciones emocionales que nacen de necesidades
sociales intrínsecas e impulsos evolutivos (el sistema pavloviano , capítulo 8).
Decidimos qué trabajo aceptar considerando los pros y los contras de las posibilidades imaginadas ( pensamiento
futuro episódico y el sistema deliberativo , capítulo 9). Podemos andar en bicicleta porque hemos entrenado
nuestro sistema de aprendizaje procedimental (capítulo 10), pero también puede resultar difícil romper malos
hábitos que hemos aprendido demasiado bien (capítulo 15). Veremos que estos son solo algunos de los sistemas
separables que podemos identificar. Todos estos diferentes sistemas de toma de decisiones conforman la
persona que eres.
La idea de que nuestras acciones surgen de componentes múltiples e identificables de forma separable tiene
una larga historia en psicología, que se remonta a Freud o antes, y ha ganado fuerza recientemente con las
teorías de la computación distribuida, la psicología evolutiva y la economía del comportamiento.
1
Obviamente, al final, hay un solo ser que realiza una acción, pero

3
Machine Translated by Google

4 Las decisiones y el cerebro

A veces resulta útil entender el ser en términos de sus subsistemas. La analogía que me gusta, y que
utilizaré varias veces en este libro, es la de un automóvil. El automóvil tiene un tren de transmisión, un
sistema de dirección y frenos. Los automóviles suelen tener varios sistemas para lograr el mismo objetivo
(el freno de pedal y el freno de emergencia/estacionamiento, o los motores eléctrico y de gasolina en un
híbrido como el Toyota Prius).
Al psicólogo Jonathan Haidt le gusta hablar de un jinete y un elefante como metáfora de las mentes
consciente e inconsciente que toman decisiones, 2 pero encuentro esta analogía inadecuada porque
separa el “yo” de los “otros” sistemas de toma de decisiones. Como reconoce Haidt al final de su libro,
usted es a la vez el jinete y el elefante.
El elefante. Cuando una estrella del fútbol habla de estar “en la zona”, no está hablando de estar fuera de
su cuerpo y dejar que otro ser tome el control; siente que está tomando las decisiones correctas. (De
hecho, está notando que su sistema de procedimientos/hábitos está funcionando perfectamente y está
tomando las decisiones correctas de manera rápida y fácil). Cuando estás caminando por un bosque
oscuro y comienzas a tener miedo y te sobresaltas al menor sonido, eso no es un animal que reacciona;
eres tú. (Es un ejemplo clásico del sistema de selección de acciones pavloviano). A veces estos sistemas
funcionan juntos. A veces funcionan con propósitos cruzados. En cualquier caso, todos siguen siendo tú .
“¿Me contradigo?”, pregunta Walt Whitman en su largo poema Song of Myself .
“Entonces me contradigo. Soy grande.
Contengo multitudes.”
¿Cómo podemos determinar cómo funcionan estos sistemas múltiples? ¿Cómo podemos determinar
cuándo funcionan juntos y cuándo tienen propósitos contrapuestos? ¿Cómo podemos identificar los
mecanismos de las multitudes de Whitman?
Para estudiar algo científicamente, necesitamos definir nuestra pregunta de manera que podamos
medirla y cuantificarla. Por lo tanto, necesitamos una medida de la toma de decisiones que podamos
observar, de modo que podamos comparar las predicciones que surgen de nuestras hipótesis con los
datos reales. Esta es la clave del proceso científico: debe haber una comparación con la realidad. Si la
hipótesis no se ajusta a esa realidad, debemos rechazarla, por mucho que nos guste.

Una opción es simplemente preguntar a la gente qué es lo que quiere. Pero, por supuesto, la idea de
que siempre hacemos lo que decimos que queremos implica suposiciones muy fuertes sobre cómo
tomamos decisiones, y cualquiera que se haya arrepentido de una decisión sabe que no siempre decidimos
hacer lo que queremos. Algunos lectores pueden estar en desacuerdo con esta afirmación, diciendo que
usted quería esa decisión cuando tomó la acción. El hecho de que se arrepienta de esa noche de
borrachera cuando tiene resaca por la mañana no significa que no quisiera todas esas bebidas la noche
anterior. Otros lectores pueden argumentar que una parte de usted quería esa decisión, incluso si otra
parte no. Llegaremos a una conclusión muy similar a esta, que hay múltiples módulos de toma de
decisiones, y que los miembros de las multitudes de Whitman no siempre están de acuerdo entre sí. Gran
parte de este libro tratará sobre cómo determinar quiénes son esas multitudes y qué sucede cuando no
están de acuerdo entre sí.

Como primer paso en esta identificación de las multitudes, estudios científicos cuidadosos han revelado
que muchas de las “decisiones” conscientes que creemos tomar son en realidad racionalizaciones
posteriores. 3 Por ejemplo, el momento en el que creemos que hemos decidido iniciar una
acción suele ser después de que la acción ya ha comenzado.
En lo que ahora se consideran estudios clásicos de la conciencia, Benjamin Libet pidió a las personas
que realizaran una acción (como golpear con un dedo cuando quisieran) mientras
Machine Translated by Google

¿Qué es una decisión? 5

Observaron un punto que se movía alrededor de un círculo. Se pidió a las personas que informaran de la posición
del punto cuando decidieran actuar. Mientras tanto, Libet y sus colegas registraron señales eléctricas del cerebro y
los músculos. Libet descubrió que estas señales precedían a la decisión consciente de actuar en varios cientos de
milisegundos. Tanto el cerebro como los músculos funcionan manipulando la electricidad, que podemos medir con
las tecnologías adecuadas. Con las matemáticas adecuadas, podemos descodificar esas señales y determinar lo
que está sucediendo dentro del cerebro. Libet descifró cuándo se podía determinar la acción a partir de señales en
las áreas motoras del cerebro y lo comparó con el momento en que la conciencia pensó que la acción había
ocurrido. Libet descubrió que la decisión consciente de realizar una acción se retrasaba, casi como si la conciencia
estuviera percibiendo la acción, en lugar de instigarla. Varios investigadores han sugerido que gran parte de la
conciencia es un proceso de control, que le permite realizar un seguimiento de las cosas e intervenir si hay problemas.

Gran parte de la maquinaria del cerebro se encarga de este tipo de rellenado, de hacer conjeturas acertadas
sobre el mundo. Nuestros ojos sólo pueden centrarse en una pequeña zona de nuestro campo visual a la vez.
Nuestros mejores sensores visuales son un área de nuestra retina que tiene una concentración de células adaptadas

al color y la especificidad en una ubicación llamada fóvea . Esta concentración de detectores en la fóvea

significa que podemos ver mucho mejor algo si enfocamos nuestros ojos en ello.
Nuestra visión se centra en una nueva zona del mundo visual cada tercio de segundo aproximadamente. Los viajes
entre los enfoques visuales se denominan movimientos sacádicos . Incluso cuando creemos que estamos centrando
nuestra atención en una pequeña ubicación, nuestros ojos están realizando cambios muy pequeños llamados
A
Si el mundo visual está alineado con nuestras microsacadas de modo que cambia cuando lo hacemos,
micromovimientos sacádicos . Las células se adaptan a la imagen constante y la imagen visual se “atenúa” y desaparece.
Esto significa que la mayor parte de nuestra comprensión del mundo visual se basa en la combinación e interpretación
de recuerdos visuales de corto plazo. Estamos infiriendo la forma del mundo, no observándolo.

En un caso sencillo y familiar para muchas personas, existe un pequeño lugar en nuestra retina por donde
deben pasar los axones de las células de salida para formar el nervio óptico que envía las señales visuales al resto
de nuestro cerebro. Esto nos deja con un “punto ciego” que debe ser llenado por la retina y el sistema de
B
procesamiento visual. Nuestro cerebro normalmente rellena el “punto
7
ciego” de los recuerdos y expectativas de los patrones que nos rodean.
De manera similar, no siempre nos damos cuenta de lo que realmente impulsa nuestro proceso de toma de
decisiones. Lo racionalizamos, completando nuestras razones desde perspectivas lógicas. Algunos de mis ejemplos
favoritos de esto provienen del trabajo de V. S. Ramachandran, 8 quien ha estudiado a pacientes con daño en partes
del cerebro que representan el cuerpo. Un paciente que está

A
El mundo visual se puede alinear con nuestras microsacadas siguiendo el movimiento de los ojos y
Cambiar la pantalla de un video muy rápidamente. Esto es posible con la tecnología informática moderna.

B Los cables (axones) de nuestro nervio óptico tienen que pasar a través de la retina porque esta está construida al revés, con las

células procesadoras arriba y las células detectoras de luz abajo. Las células procesadoras son generalmente transparentes, por lo que la

luz pasa a través de ellas y las células detectoras de luz pueden seguir viendo, pero en algún momento los axones tienen que abandonar

las células procesadoras para viajar al cerebro. No hay células detectoras de luz en el punto por donde pasan los axones, lo que deja un

punto ciego. Esto es una reliquia del pasado evolutivo de la especie humana. Los ojos no tienen por qué estar construidos de esta manera:

el ojo del pulpo, con una historia evolutiva diferente, está orientado correctamente, con las células detectoras de luz arriba y las células

procesadoras abajo. Por lo tanto, los pulpos no tienen un punto ciego que deba rellenarse.
6
Machine Translated by Google

6 Las decisiones y el cerebro

Una paciente que no puede levantar el brazo físicamente niega que tenga un problema y simplemente afirma que
no quiere hacerlo. Cuando se le hizo levantar el brazo estimulando directamente sus músculos, afirmó que había
cambiado de opinión y que había levantado el brazo porque quería, aunque no tenía control directo del brazo. En
una maravillosa historia (contada por Oliver Sacks en A Leg to Stand On ), un paciente afirma que su mano
derecha no es suya. Cuando se le confronta con el hecho de que hay cuatro manos sobre la mesa (dos suyas y
las dos del médico), el paciente dice que tres de las manos pertenecen al médico. “¿Cómo puedo tener tres
manos?”, pregunta el médico. “¿Por qué no? Tienes tres brazos”, responde el paciente.

En su libro ¿Está de broma, señor Feynman ?, el famoso físico Richard Feynman describió cómo fue que lo
hipnotizaron. Escribió que estaba seguro de que podía realizar la acción (en este caso, abrir los ojos) aunque lo
habían hipnotizado para que no lo hiciera, pero decidió no hacerlo para ver qué pasaba. Así que no lo hizo, que
era lo que le habían pedido que hiciera bajo hipnosis. Observe que ha racionalizado su decisión. Como reconoció
el propio Feynman, incluso si dijo "podría haber abierto los ojos", no lo hizo.

¿Entonces, qué fue lo que le hizo tomar esa decisión? ¿Fue algún efecto de la hipnosis en su cerebro o fue que
no quería hacerlo? ¿Cómo lo pudimos saber? ¿Podemos saberlo?

Muchos de los experimentos de los que vamos a hablar en este libro se han realizado con animales que
toman decisiones. Si vamos a decir que los animales toman decisiones, necesitamos tener una forma de
operacionalizar esa decisión: es difícil preguntarles a los animales qué piensan. Hay métodos que nos permiten
decodificar la información representada en partes específicas del cerebro, lo que podría interpretarse como un
medio para preguntarle a un animal qué piensa (véase el Apéndice B). Sin embargo, a diferencia de preguntar
a los humanos lingüísticamente, donde uno le pregunta al ser en general qué piensa, decodificar es preguntarle
a una estructura cerebral específica qué está representando. Por supuesto, se podría argumentar que asumir que
lo que la gente dice es lo que piensa supone que los humanos somos seres unificados. Como veremos a medida
que profundicemos en cómo se toman las decisiones, los humanos (al igual que otros mamíferos) somos mezclas
de muchos sistemas de toma de decisiones, no todos los cuales siempre están de acuerdo.

Uno con el otro.

Así como los experimentos de Libet sugieren que partes del cerebro pueden actuar sin conciencia, hay
representaciones en el cerebro que no pueden afectar el comportamiento.
En un notable experimento, Pearl Chiu, Terry Lohrenz y Read Montague encontraron señales en los cerebros de
fumadores y no fumadores que representaban no sólo el éxito de las decisiones tomadas, sino también lo que
podrían haber hecho si hubieran elegido mejor. 9 Este reconocimiento de lo que podrían haber hecho se llama
una hipótesis contrafactual .
(una imaginación de lo que podría haber sido) y permite un mejor aprendizaje. (Ahora se sabe que tanto las ratas
como los monos también pueden representar información de recompensa contrafáctica. Estas señales parecen
utilizar las mismas estructuras cerebrales que Chiu, Lohrenz y Montague estaban estudiando, y ser las mismas
estructuras involucradas cuando los humanos 10 ) Los contrafácticos mejoran el aprendizaje al permitir que uno
(en el ejemplo aprenda de posibilidades imaginadas. Por ejemplo, al ver a otra persona cometer un error. O
utilizado por Chiu, Lohrenz y Montague) "si hubiera sacado mi dinero del mercado de valores la semana pasada,
no habría perdido todo ese dinero cuando se desplomó".

Si bien las señales en los cerebros de ambos grupos reflejaban esta información contrafáctica, sólo la conducta
de los no fumadores tenía en cuenta esa información. Si queremos entender cómo se toman las decisiones y

por qué salen mal, vamos a necesitar una forma de

Machine Translated by Google

¿Qué es una decisión? 7

determinar no sólo las acciones realizadas por el sujeto sino también el procesamiento de información que
ocurre en su cerebro.
Ciertamente, la mayoría de los animales no humanos no tienen lenguaje, aunque puede haber algunos.
do
excepciones. Sin embargo, sería difícil preguntarles a las ratas, las palomas o los monos (todos los cuales
veremos tomar decisiones más adelante en el libro) qué quieren lingüísticamente. Dado que también es difícil
preguntarles a los humanos qué quieren realmente, evitaremos este problema del lenguaje por completo y
operacionalizaremos la toma de decisiones como una acción: la acción es una , porque tomar una
respuesta observable.
13
Esto es muy similar a lo que en economía del comportamiento se conoce como preferencias reveladas .
La teoría económica (y el nuevo campo concomitante de la neuroeconomía) generalmente supone que esas
preferencias reveladas mantienen un orden racional tal que si usted prefiere una cosa (por ejemplo, helado
de chocolate) a otra (por ejemplo, helado de vainilla), entonces siempre preferirá el helado de chocolate al de
vainilla si alguna vez se encuentra en la misma situación.
No haremos tal suposición.
De la misma manera, no queremos asumir que una persona que nos dice lo que quiere realmente refleja
las elecciones que una persona hará cuando se enfrente a la decisión real. 14
Teniendo en cuenta los datos que indican que nuestras observaciones conscientes del mundo son inferibles y
15
los datos que indican que nuestras explicaciones habladas son racionalizaciones, algunos investigadores han
sugerido que es mejor considerar nuestras explicaciones lingüísticas de nuestros deseos como el discurso de
un “secretario de prensa” que como las acciones de un ejecutivo.
16 Por lo tanto, en lugar de preguntar qué
quiere alguien, deberíamos medir las decisiones dándole a la gente opciones explícitas y pidiéndole que elija.
En los capítulos siguientes nos encontraremos con algunas de las rarezas descubiertas por estos experimentos.

A menudo, los investigadores ofrecen a las personas opciones hipotéticas. Resulta especialmente difícil
obtener financiación para ofrecer a las personas una elección real entre 10.000 y 100.000 dólares, o para
darles la posibilidad de elegir si quieren o no matar a una persona para salvar a cinco. En lugar de ello, se
pide a los sujetos que imaginen una situación y pretendan que es real. En la práctica, en los pocos casos en
que se los ha comparado directamente, las opciones de toma de decisiones hipotéticas y reales tienden a
17
coincidir estrechamente. Pero hay algunos ejemplos en los que las decisiones hipotéticas y
las reales divergen. Estos tienden a ser con recompensas o castigos que son sensoriales, inmediatos
y lo que más adelante reconoceremos como pavlovianos (Capítulo 8).
Un ejemplo clásico de esto lo llamo la parábola de las gominolas . Sarah Boysen y Gary Berntson
intentaron entrenar a los chimpancés para que eligieran la porción humilde. 19 Ofrecieron al sujeto
dos bandejas de gominolas. Si tomaba la bandeja más grande, recibía la más pequeña y la más grande se la
daba a otro chimpancé; sin embargo, si el chimpancé que decidía tomaba la bandeja más pequeña, recibía
la bandeja más grande y la más pequeña se la daba a otro chimpancé. Cuando se les presentaban símbolos
(números arábigos que previamente habían sido entrenados para asociar con números de gominolas), los
sujetos podían

C El grado en que los animales pueden adquirir lenguajes de nivel humano no está exento de controversias.
Como tampoco vamos a confiar en el lenguaje humano, 11 esta cuestión es irrelevante para nuestra cuestión de la
toma de decisiones. Para aquellos interesados en la cuestión del aprendizaje del lenguaje por parte de los animales,
recomiendo uno de los excelentes libros escritos por los diversos investigadores que han intentado enseñar lenguaje
a animales no humanos, como Daniel Fouts enseñando a Washoe el chimpancé, Penny Patterson enseñando a Koko
12
el gorila, Sue SavageRumbaugh enseñando a Kanzi el bonobo, o Irene Pepperberg enseñando a Alex el loro.
Machine Translated by Google

8 Las decisiones y el cerebro

Los animales que tenían la capacidad de elegir el grupo más pequeño, pero cuando las opciones eran caramelos
de goma físicos, no pudieron evitar coger el grupo más grande. Otros experimentos han descubierto que los
animales con mayor capacidad lingüística son más capaces de llevar a cabo estas conductas de autocontrol. 20
Esto puede ser similar a nuestra capacidad de convencernos a nosotros mismos de no hacer cosas que sentimos
que realmente queremos: "Sé que tengo ganas de fumar ese cigarrillo, pero no lo quiero. Realmente no lo quiero".

21 Poner un
Un experimento similar se conoce coloquialmente como el experimento del malvavisco : se coloca
un solo malvavisco frente a un niño sentado a la mesa de la cocina. Se le dice al niño que si el malvavisco sigue
ahí dentro cinco minutos después, se le agregará un segundo malvavisco. Luego, se abandona la habitación. Es
muy, muy difícil que los niños no alcancen el malvavisco. Es mucho más fácil para los niños esperar dos centavos
o dos fichas que dos malvaviscos. Analizaremos el experimento del malvavisco en detalle en el capítulo sobre
autocontrol (capítulo 15).

Los estudios sobre la toma de decisiones en psicología (como el experimento del malvavisco), así como los
estudios sobre economía conductual y el nuevo campo de la neuroeconomía, tienden a medir las opciones dentro

de la limitación de opciones discretas. En el mundo real, rara vez nos enfrentamos a un conjunto discreto de
opciones. Ya se trate de decidir cuándo batear para golpear una pelota de béisbol o decidir a dónde correr en un
patio de recreo, siempre estamos interactuando continuamente con el mundo. Las acciones que realizamos no
22
siempre son deliberativas y no Como veremos más adelante, algunos de los mecanismos que seleccionan la

siempre implican elecciones discretas.

¿Dónde nos deja entonces esto en nuestra búsqueda de una definición de toma de decisiones?
No supondremos que toda toma de decisiones sea racional, ni que toda toma de decisiones sea deliberativa, ni que
la toma de decisiones requiera lenguaje. En cambio, definimos la toma de decisiones como la selección de una
acción . Obviamente, muchas de las decisiones que tomamos (como empujar una palanca o presionar el botón de
encendido, por ejemplo, en una máquina de refrescos) son acciones reales, pero tenga en cuenta que incluso las
decisiones complejas siempre terminan en la realización de una acción.
Por ejemplo, comprar una casa implica firmar un formulario. Casarse implica hacer una declaración física (decir
"acepto"). Nos preocuparemos menos por los movimientos musculares físicos de la acción que por el proceso de
selección que decidió qué acción tomar. Sin embargo, definir la "toma de decisiones" como "selección de acciones"
nos obligará a observar directamente las decisiones tomadas. Nos permitirá preguntarnos por qué tomamos las
acciones reales que realizamos. ¿Por qué esas acciones no siempre coinciden con nuestras intenciones
declaradas? ¿Cómo elegimos esas acciones en lugar de otras acciones potenciales? ¿Cuáles son los sistemas
que seleccionan acciones y cómo interactúan esos sistemas con el mundo? ¿Cómo se descomponen? ¿Cuáles
son sus vulnerabilidades y modos de falla? De eso trata el resto de este libro.
Machine Translated by Google

El cuento del termostato

El escape del avión brilla sobre el asfalto.

Recuerdo la fuerza de los cisnes en el

lago del norte, con sus alas estirándose
hacia adelante y batiendo hacia atrás... la

aceleración nos empuja hacia nuestros

asientos y nos elevamos hacia el cielo.

Tu cerebro es una máquina de toma de decisiones, un ser complejo pero

físico. Como cualquier proceso físico, hay múltiples formas en las que las
decisiones pueden salir mal. Ser un ser físico no disminuye tu identidad,
pero puede explicar algunas de las decisiones irracionales que tomas.

La toma de decisiones que realizamos surge de los procesos físicos que ocurren en nuestro cerebro.
,
Como nuestro cerebro es algo físico, tiene vulnerabilidades que podríamos llamar “modos de fallo” en
el mundo de la ingeniería. Vemos estas vulnerabilidades en nuestra susceptibilidad a las malas
elecciones ( ¿De verdad necesitas un nuevo coche deportivo? ), en nuestra susceptibilidad a las
adicciones ( ¿Por qué no puedes dejar de fumar esos cigarrillos? ), en nuestra incapacidad para
controlar nuestras emociones o nuestros hábitos ( ¿Por qué te enojas tanto por cosas que no puedes
cambiar? ). Nos gustaría creer que somos criaturas racionales, capaces de aplicar la lógica, que
siempre elegimos lo que es mejor para nosotros. Pero cualquiera que haya observado sus propias
decisiones (o las de sus amigos) reconocerá que esto simplemente no es correcto. Somos máquinas
de toma de decisiones muy complejas, y a veces esos procesos de toma de decisiones nos dejan
perplejos. Entender cómo toma decisiones el cerebro nos ayudará a entendernos a nosotros mismos.
Para entender esas vulnerabilidades, necesitamos comprender el mecanismo de toma de decisiones en nuestro ce
Hoy en día, todos estamos familiarizados con máquinas complejas, incluso máquinas complejas
que toman decisiones. La máquina más simple que toma una decisión es el termostato: cuando hace
demasiado calor en la casa, el termostato enciende el aire acondicionado para enfriarla, y cuando hace
demasiado frío, el termostato enciende la calefacción para calentarla. Este proceso se llama
retroalimentación negativa : las acciones del termostato están inversamente relacionadas con la temperatura.

9
Machine Translated by Google

10 Las decisiones y el cerebro

Diferencia entre la temperatura de la habitación y la temperatura deseada (el punto de ajuste ).

Pero, ¿es realmente tan sencillo el proceso? Si analizamos el proceso de toma de decisiones
del termostato, nos damos cuenta de que incluso el simple proceso de toma de decisiones del
termostato no es tan sencillo.
El termostato tiene tres componentes clave para la toma de decisiones, a los que volveremos
una y otra vez en este libro. En primer lugar, percibe el mundo : el termostato tiene un sensor
que detecta la temperatura. En segundo lugar, determina lo que hay que hacer : compara ese
sensor con el punto de ajuste y necesita aumentar la temperatura porque hace demasiado frío,
necesita disminuir la temperatura porque hace demasiado calor o no necesita hacer nada porque
la temperatura es la adecuada. Por último, realiza una acción : enciende la calefacción o el aire
acondicionado.
En la literatura sobre inteligencia artificial, durante gran parte de la década de 1980 hubo una
discusión sobre si un termostato podía tener una “creencia”. 1 En esencia, una creencia es
una representación (potencialmente incorrecta) del mundo. Es evidente que un termostato que
funciona necesita una representación de la temperatura objetivo para poder tomar medidas que
reflejen la temperatura del mundo exterior. Pero ¿podemos decir realmente que el termostato
“reconoce” la temperatura del mundo exterior? La clave para responder a esta pregunta es que
el termostato no toma medidas en función de la temperatura del mundo, sino de su representación
interna de la temperatura del mundo. Observe que la representación interna puede diferir de la
temperatura real de la habitación. Si el sensor está equivocado, el termostato podría creer que la
habitación está más caliente o más fría de lo que realmente está y tomar la medida equivocada.

Uno de los puntos clave de este libro es que conocer cómo funciona el cerebro nos permite
una mejor percepción de lo que ocurre cuando algo va mal. Vivo en Minnesota. En pleno invierno,
puede hacer mucho frío fuera. Imagínate que te despiertas una mañana y descubres que tu
dormitorio está frío. Algo va mal. Pero decir simplemente que el termostato está roto no te
ayudará a solucionar el problema. Necesitamos identificar el problema, diagnosticarlo .
eso, por así decirlo.

Tal vez algo no funciona bien con la percepción del termostato. Tal vez el sensor esté roto y
esté percibiendo la temperatura incorrecta. En este caso, el termostato podría pensar que la casa
está bien aunque haga demasiado frío. (Observe la importancia de la creencia aquí: la diferencia
entre la representación interna del termostato y la temperatura real puede tener un gran impacto
en lo bien que el termostato toma su decisión). Tal vez el punto de ajuste esté configurado en la
temperatura incorrecta. Esto significa que el termostato está funcionando correctamente: ha
movido correctamente la temperatura de su casa al punto de ajuste, pero eso no es lo que usted
quería. O tal vez hay algo incorrecto con las acciones disponibles para el termostato.
Si la calefacción está rota, el termostato puede estar enviando la señal de “calienta la casa”, pero
la casa no se calentaría correctamente. Cada uno de estos problemas requiere una solución
diferente. Así como hay muchas razones potenciales por las que tu dormitorio está demasiado
frío y saber cómo funciona un termostato es fundamental para entender cómo solucionarlo,
cuando los fumadores dicen que realmente quieren dejar de fumar, pero no pueden, necesitamos
saber dónde ha fallado el proceso de toma de decisiones de cada individuo o no podremos
ayudar. Antes de poder identificar dónde ha fallado el proceso de toma de decisiones, vamos a
tener que entender cómo las diferentes partes del cerebro trabajan juntas para tomar decisiones.
Muchos lectores objetarán en este punto que las personas son mucho más complicadas que
los termostatos. (Y lo somos.) Muchos lectores entonces concluirán que las personas no son
Machine Translated by Google

La historia del termóstato 11

Máquinas. En la época en que la retroalimentación negativa, como el termostato, era el mecanismo

mecánico más complejo que tomaba decisiones, era fácil descartar la retroalimentación negativa por
considerarla un modelo demasiado simple para comprender a las personas. Sin embargo, como veremos
más adelante en el libro, ahora conocemos mecanismos mucho más complicados que pueden tomar
decisiones. ¿Son estos mecanismos más complicados capaces de explicar la toma de decisiones
humana? (Sostendré que sí lo son). Esto deja abiertas algunas preguntas difíciles: ¿Podemos ser
máquinas y seguir siendo conscientes? ¿Podemos ser máquinas y seguir siendo humanos?

El concepto de máquinas conscientes que toman decisiones impregna la ciencia ficción moderna:
ción, incluidos los droides C3P0 y R2D2 en Star Wars, los datos de Android de Star Trek:
La próxima generación, Los desesperados Replicantes de Blade Runner de Ridley , y el
Scott, los emocionalmente perturbados Cylons de Battlestar Galactica . Star Trek: La Nueva
Generación dedicó un episodio entero ( La medida de un hombre ) a la cuestión de cómo el
hecho de que Data fuera una máquina afectaba su capacidad de decidir por sí mismo si
permitir o no que lo desmantelaran. En el episodio, el juez concluye el juicio con un discurso
que aborda directamente esta cuestión: "¿Data es una máquina? Sí. ¿Es propiedad de la Flota Estelar? N
Todos hemos estado dando vueltas alrededor de la cuestión básica: ¿Data tiene alma? No sé si la
tiene. No sé si la tengo yo. Pero tengo que darle la libertad de explorar esa cuestión por sí mismo.
Es la decisión de este tribunal que el teniente comandante Data tiene la libertad de elegir.
2
Analizaremos en detalle las complejas cuestiones del yo y de la
conciencia al final del libro ( El enigma de la robótica , capítulo 24), después de haber
analizado los mecanismos de la toma de decisiones. Mientras tanto, mi objetivo es
convencerlos de que podemos comprender los mecanismos de nuestro proceso de toma
de decisiones sin perder la libertad de elegir.
No quiero que tomen el proceso real del termostato como la clave de la historia aquí, más de lo que
tomaríamos los aviones a reacción como buenos modelos de cómo vuelan los cisnes. Y, sin embargo,
tanto los aviones como los cisnes vuelan a través de fuerzas físicas generadas por el flujo de aire sobre
sus alas especialmente diseñadas. Aunque las alas de las aves están hechas de hueso, músculo y plumas,
mientras que las alas de los aviones son de metal, tanto para las aves como para los aviones, la
sustentación se genera por el flujo de aire sobre las alas, y el flujo de aire se genera por la velocidad a
través del aire. Si podemos entender lo que permite que un avión de 30 toneladas vuele, tendremos una
mejor comprensión de cómo puede volar un cisne de 30 libras. Aunque el impulso hacia adelante a través
del aire se genera de manera diferente, tanto las aves como los aviones vuelan a través de interacciones
físicas con el aire. Utilizaremos métodos análogos para comprender los procesos de toma de decisiones
para identificar y solucionar problemas en los termostatos y en nosotros mismos, porque ambos utilizan
procesos de toma de decisiones computacionales identificables.
Una buena manera de identificar dónde se ha estropeado un sistema (como un termostato)
es un proceso llamado “diagnóstico diferencial”, como en ¿Cuáles son las preguntas que
diferenciarán los posibles diagnósticos? Mi ejemplo favorito de esto es el programa CarTalk de la
Radio Pública Nacional, en el que un par de mecánicos de automóviles formados en el MIT (Tom
y Ray Magliozzi) diagnostican problemas de coches. Cuando alguien llama con un problema, lo
primero que comentan son los aspectos básicos del problema. (Cualquiera que haya escuchado
CarTalk sabrá que lo primero que comentan Tom y Ray es el nombre de la persona, de dónde es
la persona que llama y algunos chistes completamente ajenos. Pero una vez que se ponen a
hablar de coches, siguen un proceso muy claro de diagnóstico diferencial). Una llamada típica
podría comenzar con la persona que llama proporcionando una descripción del problema: “Oigo
un sonido desagradable cuando estoy conduciendo”. Y luego Tom y Ray se pondrán manos a la obra: harán p
Machine Translated by Google

12 Las decisiones y el cerebro

El sonido: “¿Qué es ese sonido? ¿De dónde viene? ¿Se hace más rápido a medida que vas más rápido?
¿Sigue ocurriendo cuando el motor está encendido pero el coche no se mueve?” Cada pregunta limita el
conjunto de posibles problemas. Al hacer la serie de preguntas correctas, uno puede ir avanzando
progresivamente hasta identificar qué es lo que está mal en el coche. Si pudiéramos organizar estas
preguntas en una serie de reglas, entonces podríamos escribir un programa de computadora para resolver
nuestros problemas con el coche. (Por supuesto, entonces no escucharíamos todos los chistes de CarTalk .
Si esto es bueno o malo es cuestión de gustos.)
En la década de 1980, el campo de la inteligencia artificial desarrolló “sistemas expertos” que codificaron
cómo organizar este tipo de reglas de preguntas y respuestas para realizar cálculos diferenciales. En ese
diagnóstico. 3 momento, los sistemas expertos fueron aclamados como la respuesta a la inteligencia:
Podrían tomar decisiones tan bien como (o mejor que) los expertos. Pero resulta que la mayoría de los
humanos no toman decisiones utilizando diagnósticos diferenciales. En muchos campos (incluida, por
ejemplo, la medicina), gran parte del entrenamiento consiste en intentar enseñar a las personas a tomar
decisiones según estas reglas altamente racionales. 4 Sin embargo, el hecho de que a las personas
les resulte difícil tomar decisiones basándose en diagnósticos diferenciales basados en reglas no significa
que los seres humanos no tengan un mecanismo para tomar decisiones. De hecho, los críticos se quejaron
de que los sistemas expertos desarrollados por la inteligencia artificial no estaban abordando la verdadera
cuestión de qué significa ser “inteligente” mucho antes de que se supiera que los seres humanos no
funcionaban de esa5 manera.
La gente creía que entendíamos cómo funcionan los sistemas expertos y que, por lo
tanto, no podían ser inteligentes. Un compañero de clase en la universidad me dijo una vez que “nunca
desarrollaríamos una inteligencia artificial. En cambio, reconoceríamos que los humanos no somos
inteligentes”. Uno de los objetivos de este libro es argumentar que podemos reconocer los mecanismos de
la toma de decisiones humana sin perder la capacidad de asombro ante la maravilla que es la inteligencia
humana.
Algunos lectores se quejarán de que las personas no son máquinas; tienen objetivos, tienen planes,
tienen personalidades. Como somos criaturas sociales y gran parte de nuestra inteligencia está dedicada a
comprendernos unos a otros, tenemos tendencia a atribuirle capacidad de acción a cualquier objeto que se
6
comporte de manera compleja. Muchos de mis amigos le ponen nombre a
sus coches y hablan de su personalidad. Mi hijo le puso a nuestro nuevo sistema de navegación GPS “Dot”.
Cuando le preguntamos por qué le puso ese nombre al GPS (la voz es definitivamente de una mujer), dijo:
“Para que podamos quejarnos con ella cuando se pierda: ‘¡Maldita seas, Dot!’”.
Un navegador GPS tiene objetivos (que hemos programado, pero que son objetivos al fin y al cabo). La
computadora interna de Dot utiliza su conocimiento de los mapas y su cálculo de la ubicación actual para
hacer planes para alcanzar esos objetivos. Incluso puedes decirle a Dot si prefieres que los planes incluyan
más autopistas o más caminos panorámicos rurales. Si Dot estuviera programada para preferir autopistas o
caminos panorámicos rurales, diríamos que tiene una personalidad clara. De hecho, me gustaría tener algo
de la personalidad de Dot: cuando nos perdemos una salida, Dot no se queja ni maldice, solo dice
"recalculando" y planifica una nueva ruta hacia su objetivo.

La afirmación de que las computadoras pueden tener objetivos y que las diferencias en la forma en que
alcanzan esos objetivos reflejan su personalidad sugiere que los objetivos y los planes son fáciles de
construir y que la personalidad es simplemente una diferencia en las variables de comportamiento y
preferencias subyacentes. Explicamos las máquinas complejas pensando que son como las personas. ¿Es
justo darle la vuelta a eso y explicar a las personas como máquinas complejas?
Machine Translated by Google

La historia del termóstato 13

En este libro, voy a argumentar que la respuesta a esta pregunta es “sí”: tu cerebro es
,
una máquina de toma de decisiones, aunque muy compleja. Tú eres esa máquina de toma
de decisiones. Esto no significa que no seas consciente. Esto no significa que no seas tú .
Pero puede explicar algunas de las cosas irracionales que haces.
Comprender cómo funciona el sistema de toma de decisiones humano tiene enormes
implicaciones para entender quiénes somos, qué hacemos y por qué hacemos lo que hacemos.
Los científicos estudian el cerebro, estudian la toma de decisiones y estudian las máquinas. Al
reunir estas tres cosas, comenzaremos a tener una idea de nosotros mismos. En este libro,
analizaré lo que sabemos sobre cómo funciona el cerebro, lo que sabemos sobre cómo
tomamos decisiones y lo que sabemos sobre cómo esa máquina de toma de decisiones puede
fallar en ciertas condiciones para explicar la irracionalidad, la impulsividad e incluso la adicción.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

La definición de valor

Estrellas de diamante en un círculo de oro

declara tu amor con dos

meses de salario

El valor mide cuánto está uno dispuesto a pagar, intercambiar o trabajar por una

recompensa o a trabajar para evitar un castigo. El valor no es intrínseco a un objeto,

sino que debe calcularse de nuevo cada vez. Esto produce inconsistencias, en las que

diferentes formas de medir el valor pueden producir diferentes ordenamientos de las

preferencias de uno.

¿Qué es el “valor”? ¿Qué significa valorar algo? En las teorías psicológicas, el valor se considera
como aquello que reduce las necesidades o que alivia las perspectivas negativas 1 —cuando se
tiene hambre, la comida tiene valor; cuando se tiene sed, el agua tiene valor. El dolor señala una
situación negativa que debe aliviarse para sobrevivir. En economía, el concepto de preferencias
reveladas dice que valoramos las cosas que elegimos y tomamos decisiones para maximizar el
valor. 2 Aunque se trata de una definición circular, la utilizaremos más adelante para ayudarnos a entender cómo funciona
el proceso de toma de decisiones. En el mundo de la robótica y la simulación por ordenador, donde se han desarrollado

muchos de los mecanismos que veremos más adelante, el valor es simplemente un número r para la recompensa o r para

el castigo. 3 Los modelos de robótica y de

informática simplemente intentan maximizar r (o minimizar –r ).

En muchos experimentos que estudian la toma de decisiones, el valor se mide en términos de dinero.

Pero, por supuesto, el dinero sólo tiene valor verdadero en términos de lo que puede comprar. Los economistas a menudo se
4

Nos dicen que el dinero es una ficción acordada: estoy dispuesto a venderte esta manzana por un trozo de papel verde que

ambos acordamos que vale 1 dólar porque confío en que luego podré usar el papel para comprar algo que quiero. La

afirmación de que el dinero sólo tiene valor en términos de lo que puede comprar tampoco es del todo cierta: el dinero

también puede tener valor como símbolo de lo que implica para nuestro lugar en la red social. 5 Ésta es una de las razones

por las que los deportistas profesionales extremadamente bien pagados luchan por un dólar extra en sus salarios

multimillonarios: quieren ser conocidos como el "receptor abierto mejor pagado", porque esa identificación conlleva un valor

social. El dinero y el valor son conceptos complejos que interactúan de maneras difíciles.

15
Machine Translated by Google

16 Las decisiones y el cerebro

Parte del problema es que no se puede simplemente preguntar a la gente cuánto valora esto. No
tenemos unidades para medirlo. En cambio, el valor se mide generalmente en lo que la gente está
dispuesta a dar por algo y en las decisiones que toma. 6 Este es el concepto llamado preferencias
reveladas : al examinar sus decisiones, podemos decidir qué valora.
En teoría, esto es muy sencillo: uno se pregunta ¿ cuánto pagará por esta taza de café? El precio que
pagará es el valor de la taza de café. Si medimos cosas al mismo tiempo, en el mismo experimento, no
deberíamos tener que preocuparnos por la inflación o los cambios en el valor del dinero en sí.

El problema es que las personas son inconsistentes en sus decisiones. En un famoso experimento,
Daniel Kahneman y sus colegas Jack Knetsch y Richard Thaler dividieron a sus sujetos en dos grupos:
a un grupo se le preguntó cuánto dinero pagarían por una taza de café de la Universidad de Cornell de
6 dólares (en 1990) y al otro grupo se le dio primero la taza de café y luego se le preguntó cuánto
dinero aceptarían por ella. El primer grupo estaba dispuesto a pagar mucho menos en promedio (3
dólares) de lo que el segundo grupo estaba dispuesto a aceptar por ella (7 dólares). Esto se llama el
efecto de dotación y es una preferencia por las cosas que ya posees.
7

Simplemente formular las decisiones en términos de victorias o derrotas cambia lo que la gente elige .
Lo interesante de esto es que, incluso cuando se nos muestra la irracionalidad, la sensación es que
todavía es correcta. Este efecto fue descubierto por primera vez por Daniel Kahneman y Amos Tversky,
quienes hicieron este descubrimiento sentados en una cafetería en Israel, preguntándose qué harían
en determinadas situaciones. Cuando se dieron cuenta de que estaban tomando decisiones irracionales,
llevaron sus preguntas a los estudiantes de sus clases universitarias y midieron, cuantitativamente,
qué proporción de los que tomaban cada decisión en cada condición.
9
En el caso clásico de su artículo de 1981 publicado en la revista Science :

Imaginemos que Estados Unidos se prepara para el brote de una enfermedad asiática poco
común, que se espera que mate a 600 personas. Se han propuesto dos programas
alternativos para combatir la enfermedad. Supongamos que la estimación científica exacta
de las consecuencias de los programas es la siguiente:
Problema 1: Si se adopta el programa A, se salvarán 200 personas. Si se adopta el
programa B, hay una probabilidad de 1/3 de que se salven 600 personas y una probabilidad
de 2/3 de que no se salve a nadie. ¿Cuál de los dos programas preferiría?

Problema 2: Si se adopta el programa C, morirán 400 personas. Si se adopta el

programa D, hay una probabilidad de 1/3 de que no muera nadie y una probabilidad de 2/3
de que mueran 600 personas. ¿Cuál de los dos programas preferiría?

Una lectura cuidadosa de las dos condiciones muestra que el Programa C es idéntico al Programa B,
El programa, mientras que el Programa D es idéntico al Programa B. Sin embargo, el 72% del primer grupo eligió
A y el 28% eligieron el programa B , el , Mientras que sólo el 22% del segundo grupo eligió pro
programa C y el 78% eligieron el programa D. Kahneman y Tversky interpretan esto como que
somos más sensibles a las pérdidas que a las ganancias: preferimos arriesgarnos a no ganar algo
que a perder algo. Esto es claramente parte de la historia, pero yo argumentaré que hay una
cuestión más profunda aquí. Argumentaré que el "valor" es algo que calculamos cada vez, y que el
proceso de cálculo no siempre llega a la misma respuesta "racional".
Machine Translated by Google

La definición de valor 17

Cálculos de valores ilógicos

Lo más interesante de estos resultados (que son muchos) es que incluso cuando son ilógicos (como el ejemplo
de la enfermedad mencionado anteriormente), a menudo siguen sonando correctos.
Hay otros ejemplos en los que podemos ver que las decisiones son irracionales y no suenan correctas cuando
nos las señalan, pero que los humanos definitivamente demuestran cuando se ponen a prueba.
Los mejores ejemplos de la mayoría de estos provienen del mundo de la publicidad y el marketing.
Una persona va a una tienda de electrónica a comprar un televisor y encuentra tres televisores en oferta,
uno de 100 dólares, otro de 200 dólares y otro de 300 dólares. Imaginemos que los tres televisores tienen
características diferentes, de modo que estos tres televisores tienen precios razonables. Es mucho más
probable que la gente compre el televisor de 200 dólares que cualquiera de los otros dos. Si, por el contrario,
la persona va a la tienda y encuentra tres televisores en oferta, el mismo televisor de 200 dólares, el mismo
televisor de 300 dólares y ahora un televisor más lujoso de 400 dólares, es más probable que compre el
televisor de 300 dólares. En el primer caso, la persona está diciendo que el televisor de 200 dólares es una
mejor oferta que el de 300 dólares, pero en el segundo caso, la persona está diciendo que el televisor de 300 dólares es la
Aunque les han ofrecido los mismos televisores por los mismos precios, la decisión ha cambiado dependiendo
de si hay un televisor de 100 dólares o uno de 400 en la mezcla. Esto se llama aversión a lo extremo y es un
componente de un proceso más general llamado encuadre .
En resumen, el conjunto de opciones disponibles cambia la valoración que se hace de ellas. Esto es
completamente irracional y (a diferencia de los otros ejemplos anteriores) parece poco razonable (al menos
para mí). Sin embargo, es uno de los resultados más fiables en marketing y probablemente se ha utilizado
10
desde los primeros mercados en la antigüedad hasta la era digital moderna.
Los productos que aparecían en los anuncios solían compararse entre sí. Tylenol decía que era mejor que
la aspirina y CocaCola decía que era mejor que la Pepsi. Recuerdo un anuncio de RC Cola con dos equipos
opuestos peleándose por qué bebida preferían, CocaCola o Pepsi, mientras una tercera persona sentada al
margen bebía una RC Cola, fuera de la refriega, sonriendo. Los anuncios de hoy rara vez mencionan a la
competencia.
11
porque una de las heurísticas que utilizamos es simplemente si reconocemos el nombre o no.
De modo que, aunque RC Cola intentaba comunicar que CocaCola y Pepsi eran lo mismo,
mientras que RC Cola era diferente, lo que la gente entendió del anuncio fue un recordatorio de
que todo el mundo bebía CocaCola y Pepsi. El simple hecho de mencionar el nombre recuerda a
la gente que existe y refuerza la decisión de elegirla. La familiaridad con una marca aumenta la
probabilidad de que uno la elija.
Mientras escribo esto, es temporada electoral. En todo mi vecindario, la gente ha colocado carteles a favor
de sus candidatos. Los carteles no dicen nada sobre los candidatos. A menudo, ni siquiera indican el partido
al que pertenecen los candidatos. Por lo general, solo se incluye el nombre del candidato y, a veces, un
llamado a "votar por" el candidato. ¿Qué información obtengo al ver un cartel que no dice nada más que "Vote
por X"? Supongo que uno puede necesitar que le recuerden que debe votar, pero entonces, ¿por qué el cartel
incluye "por X"? (Una de mis vecinas tiene un gran cartel hecho a mano que coloca cada temporada electoral
que solo dice "¡VOTE!"). Es cierto que uno puede tener una idea de la agrupación de candidatos a partir de las
personas que colocan varios carteles: dado que me gusta la persona X para representante estatal, ver que
todas las personas con la persona X también tienen a la persona Y para fiscal del condado, mientras que todas
las personas que tienen al oponente de la persona X tienen a la persona Z para fiscal del condado, podría
sugerirme que me gustaría a la persona Y en lugar de la persona Z para el cargo.
Machine Translated by Google

18 Las decisiones y el cerebro

fiscal del condado. Pero mucha gente solo tiene una señal de salida. Todo lo que eso me dice es que a
mucha gente le gusta la persona X. ¿Por qué saber que a mucha gente le gusta algo sugeriría que a
mí también me gusta?

En realidad, hay tres cosas que están haciendo estas empresas de un solo signo. En primer lugar, están
aumentando mi familiaridad con ese nombre. Al igual que con los productos, el simple hecho de conocer el nombre
aumenta la probabilidad de votar por alguien. En segundo lugar, si a mucha gente le gusta una película, es más
probable que sea una buena película que una que todos odiaron. Utilizando la misma heurística, si a todo el
mundo le gusta un candidato, ¿no es más probable que ese candidato sea una buena opción? Y en tercer lugar,
nos gusta estar en el equipo ganador. Si todos los demás van a votar por alguien, es probable que gane. Por
supuesto, se supone que debemos votar en función de quién creemos que es una mejor opción para gobernar, no
de quién es el más popular. Pero está bastante claro que mucha gente no vota de esa manera.

Estos efectos se producen porque en realidad no calculamos el valor real de las cosas, sino que nos permiten
Utilizamos reglas generales, llamadas heurísticas., hacer conjeturas bastante acertadas sobre cómo las valoramos.

12 Si te gustan todas las opciones, elegir la del medio es una buena opción que te dará una
buena relación calidadprecio. Si estás tomando una decisión, la familiaridad es una buena opción. (Es probable
que algo que te resulte familiar sea algo que ya hayas visto antes. Si lo recuerdas, pero no recuerdas que fuera
malo, ¿qué tan malo podría haber sido?)
Algunos economistas han argumentado que, desde el punto de vista evolutivo, las heurísticas son mejores
que tratar de calcular el valor real de las cosas, porque calcular el valor lleva tiempo y las heurísticas son lo
13
suficientemente buenas como para que Pero muchas de estas decisiones no óptimas que tomamos...
podamos salir adelante. Las decisiones están llevando tiempo. Saber que los programas A y C son los mismos
y que los programas B y D son los mismos en el ejemplo de la gripe de Kahneman y Tversky no nos hace
cambiar de opinión. Esto me hace sospechar que está sucediendo algo más. No es que las heurísticas sean
más rápidas y nos estemos conformando con lo "suficientemente bueno". Sospecho que estos efectos tienen
que ver con la forma en que calculamos el valor. No podemos determinar cómo calculan los humanos el valor a menos que

Podemos medirlo. Así que, de nuevo, volvemos a la cuestión de cómo medimos el valor.

Valor de medición

En el caso de los animales, no podemos preguntarles cuánto valoran algo; sólo podemos ofrecerles algo y
determinar cuánto están dispuestos a pagar por ello. Por lo general, esto se mide en términos de la cantidad de
esfuerzo que un animal está dispuesto a realizar para obtener la recompensa. 14 ¿Cuántas veces está dispuesto
a presionar la palanca el animal para obtener cada recompensa?
Como alternativa, podemos darle al animal una elección directa entre dos opciones: 15 ¿Preferiría
el animal dos bolitas de comida con sabor a manzana o una bolita de comida con sabor a naranja?
¿Preferiría tomar jugo o agua? También podemos determinar qué cantidad de una opción debe ofrecerse para
que el animal cambie: si al animal le gusta más el sabor a manzana que el de naranja, ¿seguiría prefiriendo la
mitad de la cantidad de manzana que la misma cantidad de naranja?
Por último, también podemos medir las consecuencias negativas que un animal está dispuesto a soportar. Por
16
para obtener una recompensa. lo general, esto se mide colocando un efecto negativo (una pequeña descarga o un
plato caliente) entre el animal y la recompensa, que tiene que cruzar para llegar a la recompensa. (Es importante
señalar que cruzar la descarga o el plato caliente depende completamente del animal. Puede elegir no cruzar el
castigo si siente que la recompensa no es lo suficientemente valiosa). Un experimento común es equilibrar una
recompensa menos atractiva con una recompensa menos atractiva.
Machine Translated by Google

La definición de valor 19

17
una recompensa más atractiva que se otorga sólo después de un retraso. Como los animales suelen tener hambre

(o sed) cuando realizan estos experimentos, no quieren esperar la recompensa.

De esta manera, la demora se convierte en un castigo muy simple y medible: ¿cuánto tiempo esperará el animal por la
recompensa?

Por supuesto, los humanos también somos animales y todos estos experimentos funcionan bien en
18 Cómo
Humanos: ¿Cuánto esfuerzo haría un fumador para conseguir una calada de cigarrillo? ¿Cuánto dinero darías

por esa taza de café? 19 ¿Qué consecuencias negativas soportaréis para

21
alcanzar vuestra recompensa? 20 ¿Esperaréis un ¿Cuánto tiempo esperarás para obtener esa recompensa mayor?
22
castigo menor, sabiendo que está próximo?
Estas cuatro formas de medir el valor se reducen a observaciones cuantificables, lo que las hace viables
experimentalmente (y científicamente). Los economistas, que estudian a los seres humanos, suelen utilizar opciones

hipotéticas (“¿Qué harías si...?”) en lugar de circunstancias reales, que, como veremos más adelante, pueden no acceder

a los mismos sistemas de toma de decisiones. Ha sido difícil probar animales con opciones hipotéticas (porque las
opciones hipotéticas son difíciles de construir sin lenguaje), pero hay algunas pruebas de que los chimpancés con

entrenamiento lingüístico esperarán más tiempo por recompensas descritas por símbolos que por recompensas reales

presentadas inmediatamente. 23 (¿Recuerdas a los chimpancés y las gominolas?). Esto, una vez más, sugiere que el
lenguaje cambia la maquinaria de toma de decisiones.

Las pruebas más generales de recompensas hipotéticas en animales se han visto limitadas por nuestra capacidad de entrenar

a los animales para que trabajen a cambio de fichas. Los experimentos recientes de Daeyeol Lee y sus colegas, en los que se

consiguió que los monos trabajaran a cambio de fichas, pueden abrir nuevas posibilidades, pero los experimentos críticos aún

no se han realizado. 24
Una de las formas más comunes de medir la disposición a pagar por algo es un procedimiento llamado ratio

progresivo : el sujeto (sea humano o no) tiene que presionar una palanca para obtener una recompensa, y cada vez que
recibe la recompensa, el número de veces que tiene que presionar la palanca para obtenerla aumenta, a menudo de

forma exponencial. La primera recompensa cuesta una pulsación, la segunda dos, la tercera cuatro, la cuarta ocho, y así

sucesivamente. Muy pronto, el sujeto tiene que presionar la palanca mil veces para obtener una recompensa más.
Finalmente, el animal decide que la recompensa no vale tanto esfuerzo y deja de presionar la palanca. Esto se llama

punto de quiebre .

Las cosas que parecen más valiosas para un animal tienen puntos de ruptura más altos
que las cosas que parecen menos valiosas. Los animales hambrientos trabajarán más duro para conseguir
comida que los animales saciados. 25 Los animales adictos a la cocaína trabajarán más duro para conseguir comida.

cocaína que para la comida. 26 Un colega mío (Warren Bickel, ahora en Virginia Tech) me contó de un sujeto experimental

(humano) en uno de sus experimentos que tiró de una pequeña palanca hacia atrás y hacia adelante decenas de miles
de veces en el transcurso de dos horas para obtener una bocanada de nicotina.

Se sabe desde hace mucho tiempo que las drogas no tienen un valor infinito. Cuando se les da la opción de elegir

entre drogas y otras opciones, tanto los adictos humanos como los animales que se autoadministran drogas A disminuirán

la cantidad de droga que consumen, ya que se vuelve más cara en relación con las otras opciones.
27
Los medicamentos muestran lo que los economistas llaman elasticidad :

cuanto más caros son, menos personas los consumen. Por eso, una forma de reducir el tabaquismo en una población es

aumentar los impuestos sobre los cigarrillos.

A La literatura sobre experimentación animal generalmente no está dispuesta a llamar a los animales “adictos” y, en cambio,
se refiere a sus acciones conductuales como “autoadministración de drogas”. Como veremos más adelante en el libro, los animales
se autoadministran las mismas drogas que los humanos, y los animales que se autoadministran drogas muestran la mayoría de los
mismos comportamientos que los humanos que se autoadministran drogas.
Machine Translated by Google

20 Las decisiones y el cerebro

La elasticidad mide cuánto disminuye la decisión de hacer algo en respuesta a aumentos en el costo. Los
lujos son altamente elásticos; los no lujos son altamente inelásticos. A medida que aumentan los costos de ir
al cine o a un partido de béisbol, la probabilidad de que la gente vaya disminuye rápidamente. Por otro lado,
incluso si el costo de los alimentos aumenta, la gente no está dispuesta a dejar de comprar alimentos. Algunos
economistas han argumentado que una buena definición de adicción es que las cosas a las que somos adictos
son inelásticas. Esto les permite decir que Estados Unidos es "adicto al petróleo" porque dependemos tanto de
la conducción que nuestro uso del automóvil es generalmente inelástico al precio del petróleo. Sin embargo,
nuevamente nos enfrentamos a una irracionalidad interesante. La elasticidad del uso del automóvil no es
lineal28 : aumentar el precio de la gasolina de 1 dólar por galón a 2 dólares tuvo poco o ningún efecto en el
número de millas recorridas, pero cuando un galón de gasolina cruzó la marca de los 3 dólares, hubo una
caída repentina y dramática en el número de millas recorridas en 2005.
De repente, la gente empezó a decir: “Eso ya no vale la pena”. Por supuesto, la gente se acostumbró a ver
gasolina a 3 dólares el galón y el número de kilómetros recorridos comenzó a aumentar nuevamente.
Esta irracionalidad es donde el intento de medir el valor se vuelve interesante. En un conjunto reciente de
experimentos, Serge Ahmed y sus colegas descubrieron que, aunque el punto de quiebre para la cocaína era
mucho más alto que para el agua endulzada, cuando se les daba la opción entre cocaína y agua endulzada,
casi todos los animales elegían la endulzada 29 (para que los lectores no piensen que esto es algo especial
agua. sobre la cocaína, los mismos efectos ocurren cuando se examina a animales que se autoadministran
heroína 30 ). Medir el valor por cuánto estaba dispuesto a pagar el animal indicaba que la cocaína era más
valiosa que el agua endulzada (la cocaína tenía un punto de quiebre más alto que el agua endulzada), pero
medir el valor dándoles a los animales una opción indicaba que el agua endulzada era más valiosa.

(Ellos eligieron sistemáticamente el agua endulzada en lugar de la cocaína.) Las dos medidas dieron resultados
completamente diferentes en cuanto a cuál era más valiosa.
Uno de mis ejemplos favoritos de esta irracionalidad es un tratamiento para la adicción en el que a los
adictos vienen a la clínica y 31 Si los
adictos se les ofrecen vales para mantenerse alejados de las drogas.
proporcionan una muestra de orina o sangre limpia, que demuestre que han permanecido sobrios
durante los últimos días, reciben un vale para algo pequeño: el alquiler de una película o un certificado
de regalo. Incluso los vales muy pequeños pueden tener efectos dramáticos. Lo interesante de esto es
que aumentar el costo de una droga en $3 tendría muy poco efecto en la cantidad de droga que toma
un adicto (porque las drogas son inelásticas para los adictos), pero proporcionar una opción de vale de
$3 puede ser suficiente para mantener a un adicto limpio, recto y sobrio. Algunas personas han
argumentado que esta es una de las razones por las que Alcohólicos Anónimos y sus primos de los 12 pasos funcio
Proporciona una opción (asistir a reuniones y recibir elogios por mantenerse sobrio) que funciona como un
32
vale; es una recompensa social que puede proporcionar una alternativa al consumo de drogas.
Entonces, ¿por qué es tan difícil medir el valor? ¿Por qué somos tan irracionales en relación con el valor?
Voy a argumentar que el valor es difícil de medir porque el valor no es algo intrínseco a un objeto.

B Ahmed y sus colegas utilizaron sacarina en el agua en lugar de azúcar porque la sacarina no tiene
valor nutritivo directo pero de sabor dulce tanto para ratas como para humanos.

C Las reuniones de Anónimos (AA, Narcóticos Anónimos, Jugadores Anónimos, etc.) y sus primos de los doce pasos también

incluyen elementos adicionales que parecen acceder a componentes importantes de la toma de decisiones. Un ejemplo es la
presencia de un “patrocinador” (alguien a quien se puede llamar las 24 horas del día, los 7 días de la semana), que ofrece una opción

de bajo costo para alejar a una persona de la opción de tomar drogas de alto valor. Las líneas telefónicas de ayuda al suicidio también

funcionan de esta manera, ofreciendo una opción de muy bajo costo (una llamada telefónica) que puede acortar un camino peligroso.
Machine Translated by Google

La definición de valor 21

En primer lugar, en este libro voy a argumentar que existen múltiples sistemas de toma de decisiones,
cada uno de los cuales tiene su propio método de selección de acciones, 33 lo que significa que hay múltiples
valores que se pueden asignar a cualquier elección dada. En segundo lugar, en los experimentos deliberativos
34
que hemos estado analizando, tenemos que calcular el valor de las opciones disponibles cada vez.
(Incluso reconocer que hay opciones disponibles puede ser un proceso complejo que involucra memoria y
cálculo.) El valor de una cosa depende de tus necesidades, deseos y expectativas, así como de la situación
en la que te encuentras. Al formular la pregunta de diferentes maneras, podemos guiar la atención de las
personas hacia diferentes aspectos de una pregunta y cambiar su valoración de la misma. En parte, esta
dependencia de la atención se debe al hecho de que no sabemos qué es importante. Una minivan puede
llevar a toda la familia, pero el Prius híbrido tiene mejor rendimiento de combustible y ese BMW convertible se
ve más atractivo. Es difícil compararlos.
Esto significa que determinar el valor real de algo depende de muchos factores, de los cuales solo algunos
se relacionan con el objeto en sí. Más adelante veremos que el valor puede depender de lo cansado que
estés, de tu estado emocional y de tu disposición a deliberar sobre las opciones disponibles.
35
Incluso se puede manipular modificando señales no relacionadas, como en el caso
tenga más , de números no relacionados (¡como su dirección!) que pueden hacer que el efecto ancla
probabilidades de converger hacia un valor más alto o más bajo, más cercano a ese número. 36
Los economistas sostienen que deberíamos medir el valor por la recompensa que esperamos
obtener, teniendo en cuenta la probabilidad de que realmente obtengamos la recompensa, y las
oportunidades de inversión y los riesgos esperados. 37 Si tratáramos de explorar todas las
posibilidades e integrar todo esto, podríamos sentarnos eternamente dándole vueltas a las
posibilidades. Esto nos lleva al concepto de racionalidad limitada , introducido por Herb Simon en la
década de 1950, que sugiere que el cálculo lleva tiempo, que a veces es mejor llegar a la respuesta
rápidamente siendo menos completo sobre el cálculo completo, y que a veces un trabajo bastante
bueno es suficiente. la mayor 38 En lugar de ello, utilizamos heurísticas, pequeños algoritmos que funcionan mejor.
parte del tiempo.
El problema con esta teoría es que incluso cuando se nos da suficiente tiempo, seguimos usando estas
heurísticas. Los economistas y psicólogos que defienden la racionalidad limitada (como Gerd Gigerenzer 39 )
sostienen que la evolución nunca nos da tiempo. Pero si el problema fuera el tiempo, uno esperaría que cuanto
más tiempo se le diera a uno, más racional sería. Esto no es lo que se ve. La gente no cambia de opinión
acerca de tomar la televisión de valor medio si se le da más tiempo; de hecho, se vuelve más racional .

40
Es probable que elija la televisión intermedia, no menos, con más tiempo.
Elegimos el televisor del medio en el ejemplo de los tres televisores porque uno de los algoritmos que
utilizamos cuando queremos comparar las opciones disponibles de inmediato es encontrar el del medio. Otro
ejemplo es que tendemos a redondear los números reconociendo los dígitos. $3,99 parece mucho menos que
41
$4,00. Piense en su “disposición a pagar” $3,75 por galón de gasolina en relación con $3,50 por galón. Si
ambas opciones están disponibles, obviamente, irá a la gasolinera que la vende a $3,50. Pero si sube de
$3,50 a $3,75 de un día para otro, ¿realmente deja de comprar gasolina? Ahora, imagine que el precio sube
de $3,75 a $4,00. De repente, parece que la gasolina se ha vuelto demasiado cara. Vimos algo similar en la
máquina de refrescos que está cerca de mi oficina. Cuando el costo subió de 75 centavos a $1, la gente siguió
comprando refrescos. Pero un día subió de 1 dólar a 1,25 dólares y la gente dijo: "No vale la pena" y dejaron
de comprar. (Ahora cuesta 1,50 dólares y nadie compra refrescos allí nunca más). A veces el precio cruza una
línea que simplemente no podemos soportar más.
Machine Translated by Google

22 Las decisiones y el cerebro

Parte de esto se debe a los mecanismos por los cuales categorizamos las cosas. Las cantidades
enteras de dólares atraen nuestra atención y es más probable que las escojamos. En un experimento
reciente, Kacey Ballard, Sam McClure y sus colegas preguntaron a las personas qué preferirían, $7 hoy
o $20 en una semana. 42 (Esta es una pregunta llamada descuento por demora , que examinaremos en
detalle más adelante en nuestro capítulo sobre impulsividad [Capítulo 5]). Pero luego pidieron a los
sujetos que decidieran entre $7.03 hoy y $20 en una semana. Las personas tenían más probabilidades
de elegir $20 sobre $7.03 que $20 sobre $7 incluso. En un maravilloso control, luego pidieron a los sujetos
que decidieran entre $7 hoy y $20.03 en una semana. Esta vez, las personas tenían más probabilidades
de elegir $7. No hay manera de que estas decisiones sean racionales, pero tienen sentido cuando nos
damos cuenta (1) de que tomar la decisión requiere determinar el valor de las dos opciones nuevamente
cada vez y compararlas, y (2) que usamos heurísticas que prefieren cantidades iguales en dólares para
D
compararlas.
El valor es un concepto importante para comprender la toma de decisiones, pero nuestro
cerebro tiene que calcular cuánto valoramos una elección. Ese cálculo se basa en la heurística.
y algoritmos simples que funcionan bastante bien la mayor parte del tiempo pero que pueden
ser irracionales bajo ciertas condiciones. ¿Cómo determinamos físicamente el valor? ¿Cuáles
son los mecanismos neurofisiológicos? Esto nos lleva a las diferencias entre el placer, el dolor y
la señal de "hacerlo de nuevo".

Libros y artículos para lectura adicional • Daniel

Ariely (2008). Predictably Irrational: The Hidden Forces that Shape Our Decisions . Nueva York:
HarperCollins. • Daniel Kahneman
(2011). Th inking, Fast and Slow . Nueva York: Farrar, Strauss y
Giroux.
• Scott Plous (1993). La psicología del juicio y la toma de decisiones . Nueva York:
Universidad McGrawHill.

D
No se sabe por qué la gente prefiere cantidades pares en dólares. Tal vez sea más fácil calcular cantidades pares en dólares. Tal vez

la gente desconfíe de las cantidades impares porque les preocupa que haya una diferencia de precio entre las gasolineras estadounidenses

truco que se está haciendo (como el 9 extra) y las que no. Tal vez la gente pueda medir las cantidades pares en dólares con mayor
c/ 10
facilidad, lo que puede llamar su atención. Cualquiera sea la heurística, la gente prefiere las cantidades pares en dólares.
43
Machine Translated by Google

Valor, euforia y la señal de "hacerlo otra vez"

Al pie de la colina del hombre ,

muerto, el trineo volcado en un
montículo de nieve, la euforia ilumina su rostro.
¡Hagámoslo de nuevo!

El placer y el valor son cosas diferentes. Se puede tener placer sin valor
y valor sin placer. Se manifiestan mediante diferentes sustancias
químicas en el cerebro. En particular, el cerebro contiene una señal para
“mejor de lo esperado”, que se puede utilizar para aprender a predecir el
valor. La falta de recompensa esperada y la falta de castigo esperado
son procesos separados (decepción, alivio) que requieren mecanismos
neuronales adicionales.

Euforia y disforia
Se suele suponer que el placer es nuestra interpretación de las cosas que tenemos que volver a hacer.
“La gente busca el placer y evita el dolor”. Si bien esto suele ser cierto, una mejor descripción es que
la gente busca cosas que reconoce que tendrán un alto valor. Como veremos a continuación, el placer
es disociable del valor.
Aunque el dicho es “placer y dolor”, el dolor no es lo opuesto al placer. El dolor es en realidad un
sistema sensorial, como cualquiera de los otros sistemas sensoriales (visual, auditivo, etc.). 1
El dolor mide el daño a los tejidos y las cosas que pueden dañarlos. Incluye receptores específicos
que se proyectan hasta las estructuras sensoriales del mesencéfalo, que a su vez se proyectan hasta
las áreas de interpretación cortical. La sensación de dolor depende de la activación cortical en
respuesta a los sensores de dolor, pero esto también es cierto para los demás sistemas sensoriales.
La retina de los ojos detecta fotones, pero no los vemos; vemos los objetos que se interpretan a partir
de los fotones. El placer, en cambio, no es una sensación, sino una evaluación de una sensación.
griega εύ del griego φορíα ( phoria , que significa “soporte” o “sensación”) y Euforia , la raíz
( eu , que significa “bueno”), es probablemente una palabra mejor que “placer” para la señal cerebral
que estamos discutiendo. Y, por supuesto, euforia tiene un antónimo claro en disforia , que significa
“malestar”, que deriva de la raíz griega δυσ ( dis , malo). Los términos

23
Machine Translated by Google

24 Las decisiones y el cerebro

La euforia y la disforia representan cálculos en el cerebro de qué tan bueno o malo es algo.

Diferencias entre euforia y refuerzo

Al observar a los animales moverse hacia una recompensa, los primeros psicólogos se sentían
incómodos al atribuir emociones al animal, diciendo que "quería la recompensa" o que sentía "placer" al
obtener la recompensa. En cambio, definieron algo que hacía que el animal fuera más propenso a
acercarse a ello como refuerzo (porque reforzaba las acciones del animal).
En los experimentos de la década de 1950 se empezó a identificar que también en los seres humanos
existía una diferencia entre la euforia y el refuerzo. En esa década se descubrió que un electrodo
colocado en una zona determinada del cerebro (llamada haz prosencéfalo medial) producía, al ser
estimulado, un refuerzo casi perfecto. 2 Los animales con estos estímulos

renunciarían a la comida, al sexo y al sueño para seguir presionando palancas para producir esta
estimulación cerebral.

A partir de esto, el haz prosencéfalo medial pasó a conocerse popularmente como “el centro del
placer”. 3 Pero incluso en estos primeros experimentos, la diferencia entre euforia y refuerzo se estaba

haciendo evidente. Robert Heath y sus colegas implantaron varios electrodos estimulantes en el cerebro
de un paciente (para el tratamiento de la epilepsia) y luego le ofrecieron al paciente diferentes botones
para estimular cada uno de los electrodos. Al estimularlo presionando un botón, el paciente informó
euforia orgásmica. Al estimularlo con el segundo botón, el paciente informó una leve incomodidad. Sin
embargo, el paciente continuó presionando el segundo botón una y otra vez, mucho más que el primero.
La euforia y el refuerzo son diferentes.
4

Resulta que la clave para el refuerzo de la estimulación del haz prosencéfalo medial es un
5
neurotransmisor cerebral llamado dopamina . La dopamina se construye químicamente en
A
a partir de precursores una pequeña zona del cerebro ubicada en lo profundo de la base del mesencéfalo.
B
llamados área tegmental ventral y sustancia negra .

A El término farmacológico “precursores” se utiliza para identificar las moléculas que se convierten en la molécula en estudio. 6
Las células son, en cierto sentido, fábricas químicas que convierten moléculas en otras moléculas,

utilizando moléculas especializadas llamadas enzimas . Por ejemplo, la sustancia química levodopa (Ldopa) es un precursor de
la dopamina, lo que significa que si tuvieras levodopa adicional en tu sistema, tus células tendrían más componentes básicos con
los que fabricar más dopamina, y descubrirías que tus células tendrían más dopamina para usar. Por eso la levodopa constituye
un buen tratamiento para la enfermedad de Parkinson, ya que la enfermedad de Parkinson es, de hecho, una disminución de la
producción de dopamina en ciertas áreas del cerebro. 7
B El área tegmental ventral se llama así porque se encuentra ventral (cerca de la base del cerebro) en el tegmentum (que
en latín significa “cubierta”), un área que cubre el tronco encefálico. Substantia nigra en latín significa “materia negra”, llamada así
porque contiene melatonina, que hace que el área se vea negra en un corte histológico.
8
La melatonina es una sustancia química que el cuerpo utiliza para señalizar el componente nocturno de los ciclos día/noche.
Por eso, a veces se utiliza para restablecer los problemas del ritmo circadiano. Interactúa con la dopamina, en particular con la
liberación de dopamina en el cerebro, lo que significa que las manipulaciones de la melatonina (por ejemplo, para el jetlag) pueden
9
afectar el aprendizaje y la cognición. Por eso la farmacología es tan compleja: manipular una cosa a menudo produce muchos
otros efectos.
Machine Translated by Google

Valor, euforia y la señal de "hacerlo de nuevo" 25

Una teoría temprana de la dopamina fue que era la representación del placer en el cerebro. 10
Estimular el haz medial del prosencéfalo hace que las células dopaminérgicas liberen su 11
para (Recuerde que estos electrodos estimulantes fueron [incorrectamente] dimensionados
estimular el "centro del placer"). En estudios con animales, bloquear la dopamina Aunque no se
refuerzo bloqueado. 12 pudo demostrar defi nitivamente que los animales sintieran "placer",
la suposición fue que el refuerzo en los animales se tradujo en placer en los humanos. La mayoría
de las drogas de abuso producen una liberación de dopamina en el cerebro. 13 Y, por supuesto, la
mayoría de las drogas de abuso producen euforia, al menos en el uso do Dado que algunos de los

temprano. Aunque los mayores efectos farmacológicos de las drogas de abuso son sobre la
dopamina, se asumió que la dopamina era la señal de "placer". Esta teoría resultó ser errónea.
En un notable conjunto de experimentos, Kent Berridge de la Universidad de Michigan estableció
15
Para probar esta teoría de que la dopamina indicaba placer, midió Primero desarrolló una forma de
la euforia y la disforia en animales y observó sus expresiones faciales.
La idea de que los animales y los humanos comparten expresiones faciales fue propuesta por primera
vez por Charles Darwin en su libro La expresión de las emociones en el hombre y los animales . Berridge
y sus colegas utilizaron cámaras enfocadas de cerca a las caras de los animales, en particular las ratas,
para identificar que los sabores dulces (como el azúcar o la sacarina) iban acompañados de un lamido
de los labios, mientras que los sabores amargos (como la quinina) iban acompañados de una proyección
de la lengua, que coincidía con la clásica cara de "puaj" que todos los padres han visto en sus hijos
obligados a comer verduras.
Lo interesante es que Berridge y sus colegas (en particular Terry Robinson, también de la Universidad
de Michigan) pudieron manipular estas expresiones, pero no con manipulaciones de la dopamina. Las
manipulaciones de la dopamina modificaban si un animal trabajaba para conseguir una recompensa, si
aprendía a buscarla o si se acercaba a ella, pero si la recompensa se colocaba en la boca del animal o
incluso justo delante de él, se la comía y mostraba las mismas expresiones faciales. Lo que sí cambió
las expresiones faciales fueron las manipulaciones del sistema opioide del animal . El sistema opioide
es otro conjunto de neurotransmisores del cerebro que, como veremos, son muy importantes para la
toma de decisiones. Son imitados por los opiáceos: opio, morfina, heroína. Berridge y Robinson sugirieron
que existe una distinción entre “querer algo” y “gustarlo”. La dopamina afecta al deseo, mientras que los
opioides afectan al gusto.

Opiáceos

El sistema opioide endógeno incluye tres tipos de señales y receptores opioides en el núcleo accumbens,
16
el hipotálamo, la amígdala y otras áreas relacionadas.
Los neurocientíficos los han denominado con tres letras griegas (mu [μ], kappa [κ] y delta [δ]). Cada uno
de estos receptores tiene un par de sustancias químicas endógenas (llamadas ligando) que se unen a él
( endorfinas asociadas con los receptores opioides μ, dinorfina asociada con los receptores opioides κ y
encefalinas asociadas con los receptores opioides δ).
Los trabajos actuales sugieren que la activación de los receptores opioides μ indica euforia, y la activación
de los receptores opioides κ indica disforia. La funcionalidad de los receptores opioides δ

do
No todas las drogas de las que se abusa producen euforia. La nicotina, por ejemplo, suele producir un efecto muy disfórico al
14
principio del consumo, aunque es una de las drogas que más refuerza el efecto.
Machine Translated by Google

26 Las decisiones y el cerebro

El papel de los receptores opioides μ en la analgesia (supresión del dolor), el alivio de la ansiedad y la inducción del deseo

de consumir drogas es menos claro, pero parece estar involucrado en la analgesia (supresión del dolor), el alivio de la

ansiedad y la inducción del deseo de consumir drogas. Las sustancias químicas que estimulan los receptores opioides μ

(llamados agonistas ) son generalmente gratificantes, reforzadores y euforizantes. El agonista clásico de los receptores

opioides μ es la adormidera, particularmente después de que se refina en morfina o heroína. Los agonistas de los
receptores opioides μ se autoadministran de manera confiable cuando se les da la oportunidad, ya sea por humanos u

otros animales. Por el contrario, las sustancias químicas que bloquean los receptores opioides μ (llamados antagonistas )

son aversivas y disfóricas e interfieren con la autoadministración. Por el contrario, los agonistas de los receptores opioides
κ también son aversivos y disfóricos.

Cuando Kent Berridge y sus colegas manipularon el sistema opioide en sus animales, descubrieron que podían

cambiar las respuestas faciales de los animales a cosas positivas (dulces) y negativas (amargas). La estimulación de los

receptores opioides κ cuando los animales eran alimentados con la solución dulce conducía a la cara de asco, mientras

que la estimulación de los receptores opioides μ cuando los animales eran alimentados con la solución amarga conducía

a lamerse los labios. Esta hipótesis también está respaldada por manipulaciones introspectivas en humanos. Se ha

demostrado que la naltrexona, un antagonista opioide general, bloquea la sensación de placer al comer azúcar: los

sujetos dicen que pueden sentir el dulzor, pero no les "importa".

Si el placer o la euforia en el cerebro es realmente la activación de los receptores opioides μ, entonces este es un

gran ejemplo de la importancia de reconocer nuestra naturaleza física. La euforia no es una construcción mental divorciada
del sistema neuronal físico; se ejemplifica como un efecto físico en nuestros cerebros. Eso significa que una sustancia

química que accede a ese efecto físico (en este caso, los receptores opioides μ) puede crear euforia directamente. Esto

también plantea un concepto al que volveremos una y otra vez en este libro: la idea de un modo de vulnerabilidad o de

fracaso . No desarrollamos receptores opioides μ para tomar heroína; desarrollamos receptores opioides μ para que

pudiéramos reconocer cosas en nuestras vidas que tienen valor y, por lo tanto, nos dan placer. Pero la heroína estimula

los receptores opioides μ directamente y produce sentimientos de euforia. La heroína se aprovecha de un potencial modo

de fallo de nuestro cerebro: nos engaña para que sintamos euforia cuando no deberíamos sentirla. Al menos, así lo hace

hasta que el cuerpo se acostumbra y reduce el receptor opioide μ, lo que hace que el consumidor necesite consumir cada

vez más heroína para lograr la misma euforia, hasta que, finalmente, ni siquiera dosis masivas de heroína producen

euforia, sino que solo alivian la disforia persistente que queda.

Reforzamiento

Así pues, si la euforia y la disforia son los receptores opioides, ¿qué es el refuerzo y cuál es su
gemelo negativo, la aversión ? Según las definiciones científicas originales propuestas por primera
vez por los teóricos del aprendizaje animal (por ejemplo, por John Watson, Ivan Pavlov y Edward
Thorndike en las primeras décadas del siglo XX, y Clark Hull y BF Skinner en los años 1940 y
1950), el refuerzo es el proceso por el cual una recompensa (como comida para un animal
hambriento) aumenta la respuesta, mientras que la aversión es el proceso 18 (Observe cómo se
disminuye la respuesta. operacionalmente, en define esta definición por el cual una penalización
términos de fenómenos conductuales directamente observables. En la siguiente sección,
analizaremos el mecanismo de toma de decisiones e iremos más allá de estas simples limitaciones
conductuales. Por ahora, contentémonos con observar el comportamiento).
Machine Translated by Google

Valor, euforia y la señal de "hacerlo de nuevo" 27

Cuando se plantea en términos de refuerzo, la pregunta es: ¿cuándo una recompensa refuerza
una conducta? En la década de 1960, Leon Kamin demostró que un estímulo reforzaba una conducta
solo si otro estímulo no la había reforzado ya. 19 A esto lo llamó

bloqueo porque el primer estímulo “bloqueó” al segundo. En su forma más simple, si entrenamos a
un animal para que empujara una palanca para obtener una recompensa en respuesta a un tono y
luego tratamos de entrenar al animal para que respondiera tanto al tono como a una luz presentados
juntos, la luz nunca se asociaría con la recompensa. Podemos comprobarlo preguntando si el animal
presiona la palanca en respuesta a la luz solamente. No lo hará. Por el contrario, si hubiéramos
comenzado el entrenamiento con el tono y la luz al mismo tiempo (es decir, si no hubiéramos
entrenado previamente al animal con el tono), entonces habría aprendido a responder tanto al tono
como a la luz cuando se presentaban juntos. El aprendizaje ocurre solo cuando algo ha cambiado.

En 1972, Robert Rescorla y Allan Wagner propusieron una teoría matemática basada en la idea
de que el refuerzo tenía que ver con la sorpresa y la previsibilidad. 20 Propusieron que
un animal aprendía a predecir que iba a recibir una recompensa, y que lo hacía basándose en la
diferencia entre la expectativa y la observación. La luz era bloqueada por el tono porque el tono ya
predecía por completo la recompensa. Esta teoría está respaldada por versiones más complicadas
de la tarea de bloqueo de Kamin, donde la recompensa se cambia durante el entrenamiento con tono
21
+ luz. Si la recompensa o el castigo entregados son
mayores después del tono + luz que después del tono solamente, entonces el animal aprenderá a
asociar la recompensa modificada con la luz. Si la recompensa entregada es menor después del tono
+ luz que después del tono solamente, entonces el animal aprenderá que la luz es un predictor “negativo”.
La prueba de esto se complica: se necesita una tercera señal (por ejemplo, un sonido diferente): se
entrena al animal para que responda a la tercera señal, luego se presenta la tercera señal con la luz
y el animal responde menos porque la luz predice que el animal recibirá menos recompensa de la
esperada con las otras señales por sí solas. El aprendizaje también puede reaparecer si cambian
otras cosas, como la recompensa real otorgada (manzanas en lugar de pasas), incluso cuando se
controla el valor de la recompensa (asegurándose de que el animal trabajaría a niveles similares para
ambas recompensas).
En la década de 1980, dos científicos informáticos, Richard Sutton y Andy Barto, propusieron una
nueva teoría matemática llamada aprendizaje de refuerzo por diferencia temporal , que se basaba en
parte en el trabajo de Rescorla y Wagner, pero también en trabajos anteriores en teoría de control e
D de la década de 1950, en particular la de Richard Bellman. 22 Bellman
“investigación de operaciones”.
demostró originalmente que se puede aprender una estrategia óptima midiendo la diferencia entre el
valor observado y el valor esperado y aprendiendo a tomar medidas para reducir esa diferencia.
Sutton y Barto reconocieron la similitud entre el trabajo de investigación de operaciones de Bellman y
el modelo de psicología de RescorlaWagner. Derivaron un algoritmo que era matemáticamente lo
suficientemente potente como para poder usarse para entrenar robots y otros sistemas de control.

La teoría de control utiliza ecuaciones para determinar cómo cambiar las variables en respuesta a estímulos para obtener los efectos deseados.

El termostato (retroalimentación negativa) que vimos al principio del libro suele ser el primer ejemplo que se utiliza en los libros de texto de teoría de

control. El control de crucero de su automóvil y la estabilidad que mantienen los aviones de combate actuales se derivan de mecanismos de la teoría

de control moderna.

Investigación de operaciones es el término que se utiliza a menudo para los departamentos universitarios que estudian estas cuestiones.
Machine Translated by Google

28 Las decisiones y el cerebro

Había dos diferencias importantes entre las ecuaciones de Sutton y Barto y la teoría de
Rescorla y Wagner. En primer lugar, Rescorla y Wagner asumían que las predicciones
sobre la recompensa se derivaban de señales individuales. Por el contrario, las decisiones
en la teoría de Sutton y Barto se basaban en categorizaciones de la situación del mundo (a
la que llamaban el “estado” del mundo). 23;E
, Sutt en y
En segundo lugar, mientras que la teoría de Rescorla y Wagner aprendió a predecir la recompensa,
el sistema de aprendizaje de Barto aprendió a predecir el valor . 24 Cada situación potencial estaba
asociada a un valor. Las acciones del agente (el programa informático o el animal) y los
acontecimientos del mundo podían cambiar la situación. Una vez conocido el valor esperado
de cada situación, el agente podía decidir lo mejor que podía hacer (tomar la acción que
condujera a la situación con el valor esperado más alto). La clave fue que Suttton y Barto
demostraron que se podía aprender la función de valor (cuál era el valor de cada situación)
F
al mismo tiempo que se tomaban acciones.
Sutt y Barto llamaron a esto la arquitectura del actorcrítico. , porque requería dos
componentes: un actor que tomara acciones basadas en la estimación actual de la función
de valor y un crítico que comparara la estimación actual de la función de valor con los
resultados observados. El crítico calculaba la diferencia entre el valor que realmente se
obtuvo y el valor que se esperaba obtener, lo que Sutton y Barto llamaron error de
predicción de valor y etiquetaron como delta (δ), a partir de la analogía con el uso común
en física y matemáticas del término Δ (delta) que significa “diferencia ” .

Error de predicción de valores

El concepto de error de predicción de valor (δ) se entiende más fácilmente con un ejemplo.
Imagina que hay una máquina de refrescos en el pasillo de tu oficina y que se supone que
el refresco cuesta 1 dólar. Introduces tu dólar en la máquina y obtienes dos refrescos.

Prefiero utilizar el término situación en lugar del término típico de la informática estado (o el término preferido
por la psicología: conjunto de estímulos ). El estado se utiliza en muchas otras literaturas para referirse a cosas
como "estado interno" (como estar bajo la influencia de una droga o no estar bajo la influencia de la droga), por lo
que términos sobrecargados como estado pueden ser confusos. Aunque muchos experimentos de psicología animal
utilizan un solo estímulo, mire a su alrededor: ¿cuál es el estímulo que impulsa su comportamiento? Actualmente
estoy escuchando música y viendo salir el sol sobre la nieve afuera de mi casa, tengo los pies en pantuflas peludas,
pero tengo frío en los tobillos: ¿cuál de estos estímulos es importante? Como veremos en el Capítulo 12, cómo
identificamos los estímulos importantes es un componente crítico del sistema de toma de decisiones, por lo que
simplemente decir estímulo es incompleto. Sin embargo, convenientemente, si , estímulo, y la situación toda
empieza con S, quisiéramos escribir ecuaciones (como suelen hacer los científicos), no tenemos que cambiar nuestras
variables.

F Existe una compensación entre exploración y explotación . Si sólo se elige la mejor opción, se pueden
perder oportunidades. Si se sale a explorar, se pueden cometer errores. Para nuestro análisis, supondremos que
se ha explorado lo suficiente como para no quedar atrapado en una situación en la que se conoce una buena
respuesta, pero aún no se ha encontrado la mejor. Analizaremos en profundidad la disyuntiva entre exploración y
explotación en un capítulo propio (Capítulo 14).
Uno de los problemas de la ciencia de la toma de decisiones es que se nutre de muchos campos, cada uno de los
GRAMO

cuales tiene su propia terminología. El δ que se utiliza en informática para representar el error de predicción de valores no
está relacionado con el δ que se utiliza para diferenciar los tipos de receptores opioides.
Machine Translated by Google

Valor, euforia y la señal de "hacerlo de nuevo" 29

En lugar de uno, cualquiera que sea la razón, este resultado fue mejor de lo , la diferencia
esperado (la diferencia entre lo que observó y lo que esperaba es positiva) y es probable
que aumente su disposición a poner dinero en esta máquina. Si, por el contrario, pone su
dólar y no obtiene nada, entonces δ es negativo y es probable que disminuya su
disposición a poner dinero en esta máquina. Si, como se esperaba, pone su dólar y
obtiene su refresco, sus observaciones coinciden con sus expectativas, δ es cero y no
necesita aprender nada sobre esta máquina de refrescos. Observe que todavía obtiene
los nutrientes (tal como son) del refresco. Todavía obtiene el placer de beber el refresco.
Todavía sabe qué acciones realizar para obtener un refresco de la máquina de refrescos.
Pero no necesita aprender nada más sobre la máquina.
En lo que todavía considero uno de los descubrimientos más notables en neurociencia, a principios de
la década de 1990, Wolfram Schultz y sus colegas descubrieron que las ráfagas transitorias de activación
en las neuronas de dopamina aumentan con aumentos inesperados en valor, disminuyen con disminuciones
inesperadas en valor y generalmente siguen las señales de predicción de error propuestas por Rescorla y
25
momento (finales de la década de 1980 y principios de la década Wagner y por Sutton y Barto. En ese
de 1990), la dopamina se conocía principalmente como una señal de recompensa o placer (¡recuerde, esto
es incorrecto!) en la literatura sobre comportamiento animal y como una señal habilitadora motora en la
literatura sobre la enfermedad de Parkinson.
yo

Schultz estaba estudiando la dopamina en animales que estaban aprendiendo a hacer asociaciones de
estímulos con recompensas, con la expectativa de que luego estudiaría su papel en la enfermedad de
Parkinson. El primer paso fue examinar la activación de las células dopaminérgicas en respuesta a la dopamina.

La enfermedad de Parkinson fue identificada por primera vez en el siglo XIX por James Parkinson, quien escribió una monografía

llamada Un ensayo sobre la parálisis temblorosa . No es poco común en las sociedades modernas, pero las descripciones que
26
coinciden con la enfermedad de Parkinson se remontan a Por ejemplo, existe una descripción en la medicina ayurvédica india:

tiempos antiguos. En algunos textos se decía que probablemente se trataba de la enfermedad de Parkinson, y se trataba con una

planta medicinal que ahora se sabe que contiene levodopa (un tratamiento moderno común para la enfermedad de Parkinson).

Durante la mayor parte del siglo XX, se ha pensado que la enfermedad de Parkinson era una disfunción del sistema motor: la mayoría

de los pacientes con Parkinson muestran una incapacidad para iniciar el movimiento (acinesia) o una ralentización del inicio del

movimiento (bradicinesia). 27 Por ejemplo, los pacientes con la enfermedad desarrollan problemas de postura y temblores en las

extremidades tanto antes como durante el movimiento. Sin embargo, la enfermedad de Parkinson no es un trastorno de los músculos

o del sistema motor en sí: hay situaciones en las que un paciente con Parkinson puede reaccionar sorprendentemente bien. 28 Esto

se muestra muy bien en la película Awakenings , donde Rose puede caminar hasta la ventana una vez que las baldosas del piso
están pintadas de blanco y negro. Más adelante en este libro veremos que esto se debe a la naturaleza intacta de otros sistemas de

toma de decisiones en pacientes con Parkinson. Todavía se desconoce si se deben a reacciones emocionales (salir corriendo de una

habitación durante un incendio, capítulo 8), a secuencias de acción reflexiva simples y almacenadas durante mucho tiempo (sorpresa

por una pelota lanzada y "¡Atrapa!", capítulo 10) o a la presencia de señales visuales explícitas (líneas en el piso que permiten el

acceso a los sistemas deliberativos, capítulo 9). 29

30
¿Cómo se ven los efectos?
Neurofisiológicamente, la enfermedad de Parkinson se debe a la pérdida de neuronas dopaminérgicas.

Los problemas de pérdida de dopamina en la enfermedad de Parkinson están relacionados con la dopamina como señal δ compleja.

La señal δ observada por Schultz y sus colegas está relacionada con cambios rápidos en la descarga de dopamina (ráfagas, llamadas

señalización fásica ). Las células dopaminérgicas también se activan a una tasa de referencia regular (llamada descarga tónica ). 31

La relación entre las ráfagas fásicas, la descarga tónica, la enfermedad de Parkinson y la toma de decisiones es 32 y todavía se

varias hipótesis, pero se sabe que la toma de decisiones está alterada en la enfermedad de Parkinson. desconocen

Se ha sugerido que los niveles tónicos de dopamina desempeñan un papel en el reconocimiento del movimiento de
35
las situaciones (motivación, Capítulo 13) y en la dinamización del mismo (este capítulo, a continuación, y el Capítulo 12).
Machine Translated by Google

30 Las decisiones y el cerebro

En estos primeros experimentos, Schultz y sus colegas descubrieron que las neuronas dopaminérgicas
respondían siempre que el animal sediento recibía una recompensa de jugo. Pero en este primer experimento,
la recompensa se entregaba en momentos aleatorios; cuando Schultz y sus colegas proporcionaron una señal
que predecía la recompensa, para su sorpresa, las neuronas dopaminérgicas ya no respondían a la
recompensa. En cambio, las células respondían a la señal que predecía la recompensa. 36

Estos resultados experimentales se unificaron con el trabajo teórico de Read Montague, Peter Dayan y
Terry Sejnowski, quienes demostraron que las neuronas de recompensa inesperada reportadas por Wolfram
Schultz y sus colegas eran exactamente la señal “delta” δ que necesitaba el algoritmo de aprendizaje de
diferencia temporal de Sutt on y Barto. Durante tres años (1995, 1996 y 1997), publicaron tres artículos que
sugerían que los datos de las células dopaminérgicas de los monos coincidían con las señales de error de
predicción de valores necesarias para la teoría del aprendizaje de refuerzo de diferencia temporal.
37

Para entender realmente cómo la dopamina sigue la señal delta, uno puede preguntarse por qué las
neuronas dopaminérgicas aumentan su respuesta a la señal. Antes de la señal, el animal no tiene ninguna
expectativa inmediata de recompensa. (Por lo que sabe, la sesión del día está a punto de terminar). Está en
una situación de bajo valor. Cuando se le muestra la señal al animal, se da cuenta de que pronto recibirá una
recompensa, por lo que ahora está en una situación de mayor valor. El cambio de “esperar” de bajo valor a
“recibir recompensa” de alto valor es un cambio inesperado en valor y produce una señal delta de “mejor de
lo esperado”. Si el animal ha aprendido que un estímulo de instrucción predice la señal, diciendo que una
señal llegará pronto, entonces la señal de dopamina aparecerá en la señal de instrucción anterior en lugar de
en la señal (porque la señal de instrucción es ahora el aumento inesperado en valor). Si la señal no llega, se
produce una disminución de dopamina porque la señal era esperada pero no se entregó y se produce una
disminución inesperada del valor.

Experimentos posteriores han demostrado que la señal sigue muy bien la señal de error de predicción
del valor δ. Si la recompensa era mayor que la señal predicha, las neuronas dopaminérgicas aumentan la
respuesta nuevamente, mientras que si la recompensa no se entregó cuando se esperaba, las neuronas
dopaminérgicas disminuyen la respuesta. Las neuronas dopaminérgicas tienen una pequeña tasa de activación
de referencia de unos pocos picos por segundo. Las respuestas positivas implican una ráfaga de picos,
mientras que las respuestas negativas implican un cese de los picos.
38 Esto permite que las neuronas dopaminérgicas envíen señales tanto de “mejor que lo esperado”
como de “peor que lo esperado”. La dopamina incluso rastrea las señales de error de predicción de valores en
los paradigmas de bloqueo de Kamin.
39 Estos resultados se han replicado desde entonces en ratas, monos y seres
humanos. 40

Refuerzo y aversión, decepción y alivio.

En los modelos informáticos, las penalizaciones se escriben generalmente como recompensas negativas y la
aversión como refuerzo negativo. Sin embargo, los ejemplos de “peor de lo esperado” utilizados en los datos
experimentales descritos anteriormente no son en realidad castigos ni producen aversión real. Más bien, son
ejemplos de decepción : la falta de entrega de una recompensa esperada. 41 Cuando los investigadores han
Machine Translated by Google

Valor, euforia y la señal de "hacerlo de nuevo" 31

Al examinar eventos aversivos reales, la respuesta de la dopamina a esos eventos resultó ser muy
42;yo
complicada.
Como veremos más adelante, la aversión y la decepción son en realidad fenómenos diferentes y
no pueden funcionar mediante un mecanismo compartido. Algunos investigadores han sugerido que
existe otra señal neurotransmisora análoga a la dopamina que puede servir como señal de aversión
(en paralelo a la señal de refuerzo de la dopamina), 47 pero nadie la ha encontrado (todavía) .
Las respuestas a los castigos (como alejarse de estímulos dolorosos) implican
un circuito neuronal diferente al de las respuestas a las recompensas positivas, en parte porque las
54
respuestas al castigo son un circuito evolutivamente más antiguo. Aprender a no hacer algo...
Aprender a hacer algo (aversión) utiliza un conjunto diferente de sistemas neuronales que aprender a
hacer algo (refuerzo). 55

I
En la actualidad, es muy controvertido hasta qué punto la teoría del error de predicción de valores (δ) explica los datos sobre

la dopamina. Parte del problema es que todos los experimentos requieren un comportamiento, el comportamiento de los mamíferos

es un proceso complejo y, a menudo, necesitamos realizar simulaciones por computadora del comportamiento en sí para determinar

cómo se vería una señal de error de predicción de valores en un experimento de comportamiento determinado.

Por ejemplo, Sham Kakade y Peter Dayan demostraron que si se proporcionan al agente dos señales, una positiva y otra

neutral, y las señales sensoriales de las dos señales son similares, entonces se pueden ver “efectos de generalización” donde hay

una señal δ positiva ilusoria al estímulo neutral que es seguida rápidamente por una señal δ negativa menos de lo esperado.
43
Imagínese dos puertas, una que conduce a la comida y

otra que no. Al oír el sonido de una puerta al abrirse, podría mirar hacia las dos puertas y recibir una señal δ positiva, pero luego,

cuando se dé cuenta de que la puerta neutra (sin recompensa) es la que se abrió, se sentirá decepcionado (lo que le dará una señal

δ negativa).

Como otro ejemplo, Patryk Laurent ha demostrado que un agente con recursos sensoriales limitados es evoEsencialmente,

Es lógico pensar que una señal de orientación positiva es útil incluso para eventos potencialmente aversivos. Esta 44
señal de orientación permite al agente hacer más de lo esperado para evitar esos eventos aversivos.

Ambos ejemplos proporcionarían señales complejas de dopamina a los eventos aversivos, lo que explicaría algunas de las

señales de dopamina observadas en los eventos neutrales y aversivos. Sin embargo, hacen predicciones específicas sobre cómo

debería responder la dopamina a esos eventos. Schultz y sus colegas han descubierto que la reacción prevista, menor de lo
45
esperado, ocurre después de la generalización de las señales de dopamina. Aunque el

La hipótesis de Laurent no ha sido probada explícitamente, pero podría explicar las señales de respuesta muy rápidas observadas
46
por Peter Redgrave y sus colegas.
Algunos investigadores han sugerido que la serotonina podría desempeñar el papel de señal negativa (aversiva), 48 pero

experimentos recientes han demostrado que ese no es el caso. 49 Otro candidato potencial interesante
es la norepinefrina (llamada noradrenalina en Europa). La norepinefrina es una modificación química de la dopamina, lo que la

convierte en su precursora. En los invertebrados, el análogo de la noradrenalina,

octopamina, actúa como señal de error positiva, mientras que la dopamina actúa como señal de error negativa. 51

Todas estas moléculas (serotonina, noradrenalina, octopamina y dopamina) son muy similares en su estructura
52
molecular, lo que las convierte en candidatas plausibles, dado el proceso de copia y modificación que a menudo se
observa en la evolución.

Además, algunos trabajos recientes muy interesantes han descubierto que las neuronas de otra estructura
neuronal, la habénula (que se proyecta hacia las neuronas dopaminérgicas en el área tegmental ventral), aumentan
su activación con la aversión y disminuyen su activación con el refuerzo. 53 Todavía no está claro si estas neuronas
de la habénula son las neuronas de aversión buscadas durante mucho tiempo o si son parte del cálculo cerebral de
δ . Recuerde, δ es un término matemático. La dopamina refleja δ , por lo tanto, el cerebro calcula δ . . . de alguna
manera.
Machine Translated by Google

32 Las decisiones y el cerebro

objeto proporcionado evaluación efecto falta de entrega

Figura 4.1 Proporcionar algo positivo (una recompensaque

, produce euforia ) produce
refuerzo , mientras que la no entrega de una recompensa esperada conduce a la decepción .
De manera similar, proporcionar algo negativo (un castigo , que conduce a la disforia ) produce
aversión, Mientras que la falta de cumplimiento de un castigo esperado conduce al alivio .

Desde el comienzo de los experimentos de aprendizaje con animales, se sabe que el proceso
de reconocer que una señal ya no predice una recompensa no significa que el animal haya olvidado
la asociación. 56 Esto se remonta a Pavlov y a sus famosos perros,
que aprendieron a asociar las campanas con la comida. Una vez que los perros habían aprendido a
salivar en respuesta a la campana (anticipando la comida), cuando no se les presentaba la comida,
mostraban frustración y enojo, y buscaban la comida. Sin embargo, con el tiempo reconocieron que
la campana ya no implicaba comida y aprendieron a ignorarla. Sin embargo, si se les daba comida
nuevamente solo una vez después de que sonara la campana, inmediatamente comenzaban a
salivar en busca de comida la próxima vez. Como el aprendizaje fue mucho más rápido después
que antes, Pavlov sabía que el perro no había olvidado la asociación original.
Esto significa que debe haber un segundo proceso. En la literatura, este proceso suele ser
K
Se llama extinción porque la falta de recompensa entregada ha “extinguido” la respuesta.
De hecho, con la aversión se producen exactamente los mismos efectos. Si se entrena a un animal
para que asocie una señal con un acontecimiento negativo (por ejemplo, una descarga eléctrica) y
esta asociación se extingue (al proporcionarle la señal sin la descarga), se le puede recordar la
asociación (un par de señal + descarga) y la respuesta reaparecerá sin necesidad de más entrenamiento.
La decepción no es el olvido del refuerzo y el alivio no es el olvido de la aversión. Dado que tanto el
refuerzo como la aversión tienen procesos secundarios correspondientes (decepción y alivio), la
decepción no puede ser el mismo proceso que la aversión y el alivio no puede ser el mismo proceso
que el refuerzo. Véase la figura 4.1.

Mecanismos neuronales de extinción

Hasta el momento, los científicos no están completamente seguros de cuáles son los mecanismos
neuronales que subyacen al proceso secundario de extinción que sigue a la decepción o al alivio.
Existen dos teorías importantes para explicar este proceso secundario. Una es que existe un
segundo proceso de inhibición específico, de modo que las neuronas de esta área secundaria
57
inhiben a las neuronas del área de asociación primaria.
Se sabe, por ejemplo, que las sinapsis de la
amígdala son fundamentales para el aprendizaje inicial de una asociación aversiva (las lesiones de
la amígdala impiden tales asociaciones, la creación de tales asociaciones cambia los patrones de
disparo en la amígdala y la creación de tales asociaciones ocurre con y depende de la plasticidad
sináptica en la amígdala). Sin embargo, las neuronas en la corteza prefrontal central (la corteza
infralímbica en la rata, la corteza cingulada anterior central en el ser humano)

K
El uso de la palabra extinción para este proceso es desafortunado porque no tiene relación con el
decir, el fin de una especie.
término evolutivo extinción , es
Machine Translated by Google

Valor, euforia y la señal de "hacerlo de nuevo" 33

Las neuronas comienzan a activarse después de la extinción y se proyectan a neuronas inhibidoras en la

amígdala, que detienen la activación de las células de asociación originales. Yadin Dudai y sus colegas
descubrieron recientemente que en los humanos, estas áreas se activan cuando las personas con fobia a
las serpientes muestran coraje y superan su miedo para realizar una tarea en la que atraen a la serpiente
hacia sí. 58 Sin embargo, esta teoría implica que solo hay un nivel de recursión:

que sólo se puede tener una asociación y un cese de esa asociación.

La otra teoría parte del supuesto de que no se te proporciona una definición de la situación en la que
te encuentras, sino que tienes que inferir esa situación a partir de las pistas disponibles.
59 Mire a su alrededor: hay millones de señales. ¿Cuántas de ellas son importantes para
su capacidad de aprender de este libro? A mi alrededor, ahora mismo, estoy mirando ventanas, árboles,
una taza de café vacía, ardillas persiguiéndose unas a otras. Hay un sonido de pájaros, un carbonero, un
cuervo. Hay un estruendo de coches en la distancia. Hay una sensación de la silla en la que estoy sentado,
el calor de mi computadora portátil (que se calienta incómodamente cuando trabajo en ella demasiado
tiempo). ¿Cuáles de estas señales son importantes? La mayoría de los experimentos con animales se
realizan en entornos muy limitados con pocas señales obvias, excepto los tonos y las luces que se asocian
con las recompensas y las penalizaciones. Los animales no evolucionaron para vivir en estos entornos
vacíos.
Esta segunda teoría dice que antes de poder asociar una situación con una recompensa o una
penalización, es necesario definir el conjunto de estímulos que identificarán esa situación. Cualquier
definición de situación prestará atención a algunas señales que están presentes en el entorno e ignorará
otras. Nosotros (mis colegas Adam Johnson, Steve Jensen y Zeb KurthNelson y yo) llamamos a este
proceso “reconocimiento de la situación” y sugerimos que la decepción y el alivio producen un
estrechamiento de la definición de la situación de modo que el agente comience a prestar atención a
señales adicionales y comience a diferenciar la nueva situación de la anterior.
60 Cuando los animales ya no reciben recompensas ni castigos (es
decir, se sienten decepcionados o aliviados), comienzan a “buscar la señal” que diferencie las dos
situaciones. 61
Imaginemos la máquina de refrescos de la que hablamos cuando
nos topamos por primera vez con la señal de error de predicción de valor δ. Si ponemos dinero en ella y no
sacamos nada, no olvidaremos que si ponemos dinero en una máquina de refrescos podemos conseguir
refrescos; buscaremos qué es diferente en esa máquina. Quizá haya una luz que diga “fuera de servicio” o
“fuera de stock”. Quizá la máquina esté apagada. Una vez que identifiquemos la diferencia, nuestra
definición de la situación de disponibilidad de la máquina de refrescos habrá cambiado y podremos ir a
buscar una máquina de refrescos que funcione.
La segunda teoría sugiere que las señales adicionales que proporciona la corteza prefrontal
proporcionan dimensiones adicionales sobre las cuales categorizar la situación.
Proporciona explicaciones para una serie de fenómenos específicos observados en la literatura sobre la
extinción. Por ejemplo, hay amplia evidencia de que la extinción tiene que ver con el reconocimiento de
contingencia de un cambio. 62 Los animales muestran una extinción mucho más lenta después de una
entrega de recompensa variable (probabilística) que después de una contingencia de recompensa regular
(estar seguro de obtener siempre la recompensa). Si a un animal se le proporciona una recompensa solo
la mitad del tiempo después de la señal, aún aprenderá a responder, pero será más lento en detenerse
cuando la recompensa ya no se entregue. Por otro lado, si siempre se le proporciona una recompensa,
entonces dejará rápidamente de responder cuando la recompensa ya no se entregue. Sin embargo, no se
trata simplemente de una cuestión de contar, porque, como se muestra en la Figura 4.2, si hay un patrón,
entonces incluso con solo una probabilidad del 50/50 de obtener una recompensa, uno puede determinar
fácilmente el patrón, y los animales dejan de responder tan pronto como el patrón se interrumpe.
Machine Translated by Google

34 Las decisiones y el cerebro

RRRRRRRRRRNNNNNNNNNN

RRNNRRRNNNNNNNNNNN

RNNRNRNRNNNNNNNNNN

Figura 4.2 Secuencias de recompensa y castigo. Imagínese que es un sujeto de un

experimento que se enfrenta a una de estas secuencias de entrega de recompensa. (R significa
que obtiene la recompensa y N significa que no la obtiene). Imagínese que ve la secuencia de
izquierda a derecha. (Trace con el dedo para obtener una secuencia). ¿Cuándo dejaría de responder?
Pruebe cada línea por separado. Probablemente se encontrará intentando predecir si obtendrá
una recompensa o no. Cuando las observaciones ya no coincidan con sus predicciones, es cuando
reconocerá un cambio.

Como vimos en el capítulo 3, el “valor” es algo complejo. Hemos visto en este capítulo cómo el
cálculo del valor y el aprendizaje para predecir el valor dependen de múltiples sistemas que
interactúan entre sí. Hay un sistema que mide el placer de una cosa (euforia), un sistema que
aprende la utilidad de repetir acciones (refuerzo) y un sistema que reconoce el cambio (decepción).
Paralelamente, están los sistemas de disforia, aversión y alivio. Como veremos en los próximos
capítulos, estos componentes del aprendizaje del valor forman las bases de múltiples sistemas de
toma de decisiones que interactúan para impulsar nuestras acciones. El hecho de que haya
múltiples sistemas interactuando dificulta la detección y la definición real del valor.

Libros y artículos para lectura adicional • Kent

C. Berridge y Terry E. Robinson (2003). Análisis de la recompensa. Tendencias en

Neurociencias, 26, 507–513 .
• P. Read Montague (2006). ¿Por qué elegir este libro? Nueva York: Penguin. •
Wolfram Schultz (1998). Señal de recompensa predictiva de las neuronas dopaminérgicas.
Journal of , 1–27 .
Neurophysiology, 80. • A. David Redish, Steve Jensen, Adam Johnson y Zeb KurthNelson (2007).
Reconciliación de los modelos de aprendizaje de refuerzo con la extinción y renovación conductual:
implicaciones para la adicción, la recaída y el juego problemático. Psychological Review, 114 784– ,
805.

• Richard S. Sutt y Andy G. Barto (1998). Aprendizaje por refuerzo: una introducción .
Cambridge, MA: MIT Press .
Machine Translated by Google

Riesgo y recompensa

"
“Carpe diem ”, dicen,
pero no tienes un día,
tienes un momento,
un momento para dudar...
o actuar.

Definir la toma de decisiones en términos de selección de acciones crea el

potencial de tomar decisiones que son ilógicas desde una perspectiva basada
en valores. El sistema de toma de decisiones de los mamíferos incluye
múltiples componentes de toma de decisiones, que pueden producir conflictos
entre las opciones de acción.

Un adolescente pisa a fondo el acelerador mientras recorre las sinuosas curvas de una carretera arbolada; el
coche patina en cada giro, apenas conteniendo la aceleración. Un estudiante universitario gasta miles de
dólares en ropa y no tiene suficiente dinero para pagar el alquiler. Un alcohólico pasa por el bar de camino a
casa. “Solo una copa”, dice. Horas después, sus hijos vienen a llevarlo a casa. Un bombero se queda
paralizado un momento ante un edificio en llamas, pero luego reúne coraje y corre hacia el interior del edificio
para poner a salvo a un niño. Cada uno de estos ejemplos es un caso comúnmente citado de conflicto entre
sistemas de toma de decisiones.
El adolescente busca un equilibrio entre la emoción de la velocidad y el riesgo de perder cualquier futuro
potencial que pueda tener. La estudiante universitaria gasta el dinero ahora por el beneficio a corto plazo de
tener ropa e ignora (u olvida) el beneficio a largo plazo de quedarse en su departamento.
El alcohólico arriesga su familia, su felicidad y, a menudo, su trabajo y su sustento por el placer simple e
inmediato de una bebida. (Por supuesto, el problema es que una bebida se convierte en dos y luego en tres y
luego en más.) El bombero debe superar las reacciones emocionales de miedo que le dicen "no entres ahí".
Todos estos son conflictos entre sistemas de toma de decisiones.

Conducta de búsqueda de riesgos

En términos coloquiales, el riesgo implica la posibilidad de una pérdida frente a posibles ganancias (nuestro
adolescente hipotético está arriesgando su vida conduciendo demasiado rápido). En economía, el término riesgo

35
Machine Translated by Google

36 Las decisiones y el cerebro

Se define como la variabilidad en el resultado 1 —el mercadode valores tiene más riesgo que una cuenta de ahorros

asegurada por la FDIC. Esta es una forma de incertidumbre, y ahora se sabe que existen representaciones de riesgo e
incertidumbre en nuestros cerebros. 2 Como analizaremos en profundidad

en el Capítulo 14, existen diferencias entre la variabilidad esperada (una probabilidad conocida, como la posibilidad de

que llueva), la variabilidad inesperada (una sorpresa, como cuando algo que funcionaba de repente se rompe) y la
variabilidad desconocida (ambigüedad, cuando sabes que no conoces las probabilidades). Los animales gastarán energía
para traducir la variabilidad desconocida en variabilidad esperada y para reducir la variabilidad esperada.
3

Imagina que eres un animal que entras en un nuevo entorno. No sabes qué peligros acechan ahí fuera ni qué recompensas hay disponibles. Antes de poder ponerte a salvo de

esos peligros y de poder obtener esas recompensas, tienes que explorar el entorno .

mento. Imagina que has explorado parte del entorno. Ahora tienes una opción: ¿hacerlo?
¿Te quedas y utilizas las recompensas que ya has encontrado o vas en busca de otras mejores?
Los animales tienden a ser reacios al riesgo cuando se trata de ganancias y a buscarlo cuando se trata de pérdidas.
Ésta es la fuente de la diferencia en el ejemplo de la gripe asiática del Capítulo 3: expresado en términos de salvar vidas,

la gente elige la opción segura, pero expresado en términos de pérdidas, la gente elige la opción más segura. Pero esta
5
Opción arriesgada. tampoco es toda la historia, porque el riesgo y la recompensa interactúan entre sí.

Exploración e incertidumbre.
6
Curiosamente, el comportamiento más arriesgado tiende a darse entre los adolescentes.
Los adolescentes se encuentran en esa transición de la dependencia a la independencia. Los seres humanos pasan

primero por una etapa de juventud en la que reciben protección y formación. En la etapa posterior de la adolescencia,
los seres humanos salen a explorar para ver cuáles son los parámetros del mundo. A medida que van saliendo de la
adolescencia, los seres humanos tienden a asentarse y a ser menos propensos a correr riesgos.
Esta capacidad de aprender los parámetros del mundo después de un largo período de entrenamiento hace que los
humanos sean particularmente flexibles en su capacidad de interactuar con el mundo.

Una pregunta interesante es, entonces, ¿qué es lo que impulsa a la exploración? Los animales, incluidos los
humanos, tienen una curiosidad innata que nos impulsa a explorar el mundo. Pero, como dice el proverbio, “la curiosidad

mató al gato”. Explorar es peligroso. Una evaluación justa de los peligros podría llevarnos a no estar dispuestos a correr
riesgos. Sin embargo, en promedio, las personas tienden a subestimar los peligros y a ser demasiado optimistas sobre
lo desconocido, 7 lo que tiende a impulsar la exploración, al tiempo que mantiene un comportamiento inteligente en las
partes del mundo que conocemos. (Recuerde, “la hierba siempre es más verde al otro lado de la colina”, excepto cuando
llega allí y no lo es).

¿En qué sentido es entonces que el adolescente que va a toda velocidad por una carretera es un ejemplo de exploración que

supera a la explotación? Es poco probable que nuestro adolescente hipotético vaya a toda velocidad por una carretera no transitada.

Cuando los animales exploran un nuevo territorio, tienden a viajar muy lentamente, observando todo lo que los rodea. 8

Pero nuestro adolescente hipotético está poniendo a prueba sus límites, intentando descubrir
qué tan buenos son sus tiempos de reacción, qué tan rápido puede ir manteniendo al mismo tiempo el control del auto.
Si el adolescente sobreestima sus habilidades o subestima la probabilidad de encontrarse con un automóvil que viene
en sentido contrario en esa carretera oscura y sinuosa a esa hora de la noche, las consecuencias pueden ser trágicas.
A lo largo de este libro veremos que la personalidad implica diferencias en los parámetros que subyacen al sistema
de toma de decisiones. Aquí tenemos dos parámetros y una interacción: ¿Qué tan curioso eres? ¿Qué tan optimista
eres ante lo desconocido? ¿Qué tan dispuesto estás a arriesgarte a cambio de esas nuevas respuestas? (Los
adolescentes, por supuesto, son conocidos por ambas propiedades: conductas de riesgo impulsadas por la curiosidad y
el optimismo excesivo).
Pero cada individuo, tanto en la juventud como en la edad adulta, tiene una visión diferente de estos 9 y, por lo tanto,

cada uno de nosotros tiene su propio nivel de búsqueda de riesgos y optimismo excesivo, parámetros,
Machine Translated by Google

Riesgo y recompensa 37

nuestro propio umbral de qué riesgos toleraremos y qué tan mal estimamos esos riesgos.
Equilibrar el riesgo y la recompensa puede ser la diferencia entre el éxito y el fracaso, y encontrar el equilibrio
adecuado no siempre es fácil.

Esperando una recompensa

¿Qué preferirías tener, $10 hoy o $10 en una semana? Salvo en algunas situaciones realmente
extrañas, prácticamente todo el mundo querría los $10 hoy. Esto significa que $10 en una semana
valen menos para ti que $10 hoy. Decimos que las recompensas entregadas en el futuro tienen
descuento . 10
Lógicamente, descontar recompensas futuras tiene sentido porque pueden suceder cosas
entre ahora y entonces; esperar al futuro es arriesgado. 11 Si te atropella un autobús o
ganas la lotería o el mundo explota en una guerra termonuclear, esos 10 dólares en una semana ya no valen
tanto como antes.
12
10$ hoy también se pueden invertir, Por lo tanto, en una semana, podrías tener más de 10 dólares.
Por supuesto, esto también funciona con recompensas no monetarias (comida, compañeros, etc.). 13 Para un
animal hambriento, la comida ahora vale mucho más que la comida de una semana. Si te mueres de hambre
ahora, la comida de la semana que viene no será tan valiosa. Y, por supuesto, a largo plazo, la comida de ahora
dará lugar a un cuerpo más fuerte, más energía y más capacidad para encontrar comida más adelante.
Por lo tanto, las recompensas actuales valen más que las futuras. Si le hacemos a la gente una serie de
preguntas sobre dinero ahora o dinero después ( ¿qué preferiría tener, 9 dólares ahora o 10 la semana que
viene? ), podemos determinar el valor real de 10 dólares en una semana. Si graficamos esto como una función
de la demora, podemos derivar una curva de descuento y medir cómo disminuye el valor con la demora.
14

Por supuesto, no podemos hacerles esta pregunta a los animales, pero podemos ofrecerles la opción de
elegir entre una pequeña cantidad de comida ahora y una gran cantidad de comida más tarde. 15 Por ejemplo,
en un experimento típico, a una rata, un mono o una paloma se le ofrecen dos opciones (palancas 16 o caminos
que conducen a un lugar donde hay comida 17 ): tomar la primera opción proporciona una bolita de comida
inmediatamente, pero tomar la segunda opción proporciona más bolitas de comida (digamos tres) después de un retraso.
Observando las elecciones del animal, podemos determinar nuevamente la curva de descuento.
Si el descuento se debiera simplemente a la inflación o a la capacidad de invertir dinero,
18
Espere que siga una función exponencial del tiempo. Disminuye En una función exponencial, el valor
B
en el mismo porcentaje cada unidad de tiempo. Si fuera una función Entonces, si su función de descuento
exponencial con una vida media de un año, estaría igualmente satisfecho con $5 ahora y $10 en un año o $2,50
ahora y $10 en dos años. Curvas de descuento exponencial

A
Podemos preguntarles, pero es poco probable que nos den una respuesta significativa.
B
Ejemplos de funciones exponenciales son las cuentas bancarias y el crecimiento de la población. Cuando un banco
dice que te pagará un porcentaje de interés cada año, la cantidad total de dinero en tu cuenta aumentará en ese porcentaje
cada año. Como el dinero vuelve a tu cuenta, estás multiplicando efectivamente tu cuenta de ahorros por un número mayor
que 1 cada año. Incluso un número pequeño puede acumularse rápidamente: una tasa de interés del 5% se duplicará en 15
años. Aquí, estamos hablando de decaimiento exponencial, que es como multiplicar el valor por un número un poco menor
que 1 cada año.
Un buen ejemplo de desintegración exponencial es la desintegración de material radiactivo: después de un número
determinado de años, la mitad del material se habrá desintegrado. De ahí proviene el término vida media . Por ejemplo, el
plutonio238 tiene una vida media de 88 años. Por lo tanto, si tienes una libra de plutonio238, después de 88 años, tendrás
media libra. Después de otros 88 años (176 años en total), tendrás un cuarto de libra, etc.
Machine Translated by Google

38 Las decisiones y el cerebro

tienen una propiedad muy útil, que es que son autosimilares: tus elecciones ahora son las mismas que
harías dentro de un año.
Pero ni los humanos que responden cuestionarios ni los animales que presionan palancas muestran
curvas de descuento exponencial. 19 De hecho, los humanos que responden cuestionarios, los animales
que presionan palancas para obtener comida y los humanos que presionan palancas para obtener comida muestran
una curva de descuento que se describe mejor como una función hiperbólica , que cae muy rápidamente pero
luego se vuelve más plana con el tiempo.

Cualquier curva de descuento no exponencial (incluidas las hiperbólicas) mostrará una inversión de
propiedad llamada inversión de preferencias, preferencias en la que las opciones cambian según su contexto
20
Pregúntate qué temporal. Puede convencerse de que usted también muestra una inversión de preferencias.
preferirías tener, ¿10 dólares hoy o 11 dólares en una semana? Luego pregúntate qué preferirías tener,
¿10 dólares en un año o 11 dólares en un año y una semana? Cada persona tiene un punto de reversión
diferente, por lo que es posible que tengas que encontrar un conjunto de números ligeramente diferente
para ti, pero casi con toda seguridad podrás encontrar un par de números tales que no esperes ahora,
sino que esperes el año que viene. Observa que esto no tiene ningún sentido racional. Hoy, dices que
no vale la pena esperar ese dólar extra, pero dentro de un año, cuando te enfrentes a lo que en realidad
es la misma elección, dices que esperarás. Presumiblemente, si te preguntas qué pasará el año que
viene, dirás que no vale la pena esperar: habrás cambiado de opinión y habrás invertido tus preferencias.
Aunque esto es irracional, a la mayoría de la gente le parece correcto.
Éste es el error que comete nuestra hipotética estudiante extravagante, que dice que preferiría gastar
el dinero ahora en la recompensa inmediata (ropa nueva) en lugar de esperar a recibir la recompensa
mayor (pagar el alquiler) más adelante. De hecho, cuando sus padres le pregunten al comienzo del año
escolar si va a pagar el alquiler o comprar ropa nueva, es probable que les diga (supondremos que
honestamente) que va a pagar el alquiler. Este cambio (entre querer pagar el alquiler antes y comprar
ropa) es un ejemplo de la inversión de preferencias de la que estamos hablando.

La inversión de preferencias también puede observarse en la dirección opuesta. Esto podría llamarse el efecto
, a la tira cómica Cathy de Cathy Guisewite, que tiene como tema habitual la incapacidad de Cathy
Cathy, en honor
do
para resistirse a los dulces con alto contenido de azúcar, como los caramelos de Halloween o la tarta de cumpleaños.
(En el panel 1, Cathy dice que esta vez no comerá el pastel, pero en el panel 3, cuando se enfrenta al
pastel real, la encontramos comiéndolo). Desde la distancia, el chocolate está descontado y tiene poco
valor y se prefiere el valor a largo plazo de mantener su dieta, pero cuando el chocolate está
inmediatamente disponible, se descuenta menos y la pobre Cathy toma la decisión equivocada.
En parte, el dilema de Cathy proviene de una interacción entre sistemas de toma de decisiones: desde la
distancia, un sistema quiere seguir con su dieta, pero desde cerca, otro sistema se esfuerza por conseguir el pastel.
Ésta es la parábola de las gominolas que vimos en el capítulo 1: es difícil rechazar la recompensa física que tienes
delante a cambio de una recompensa abstracta. Una posible explicación del éxito de la Gestión de Contingencias
22
(que más adelante ofrece recompensas concretas a los adictos por mantenerse limpios de drogas) en la
modificación de la adicción y la conducta es que ofrece una opción alternativa concreta, que permite al sujeto optar
por otras opciones en lugar de la droga.
23

Desde una perspectiva positiva, la inversión de preferencias también permite un fenómeno interesante
llamado precompromiso, en el que una persona o un animal organiza las cosas de manera que no sea...

El azúcar C procesada es mucho más dulce que la mayoría de los alimentos que hemos evolucionado para comer, por lo que es una sustancia que

sobreestimula los sistemas sensoriales, lo que hace que la ingesta sea particularmente difícil de controlar. 21
Machine Translated by Google

Riesgo y recompensa 39

Si se le da la opción en el futuro, 24 por ejemplo, un alcohólico que sabe que beberá si va al bar puede
decidir no pasar por allí en coche. Desde la distancia, hace una elección, sabiendo que tomará la elección
equivocada si se le da la oportunidad más adelante. Si nuestra hipotética estudiante extravagante es
inteligente y se conoce bien a sí misma, entonces podría guardar el dinero en una cuenta de depósito en
garantía prepagada que sólo puede utilizarse para el alquiler. Los dos yoes (el estudiante al principio del
año escolar que quiere pagar el alquiler y el estudiante a mitad de año que quiere comprarse ropa) están en
conflicto entre sí. 25
Si es inteligente, puede comprometerse de antemano cuando es una estudiante ahorrativa y prematura para
evitar desperdiciar el dinero cuando sea una estudiante extravagante y tardía. A medida que exploremos los
componentes reales del sistema de toma de decisiones, descubriremos que el compromiso previo implica
una interacción entre la deliberación (capítulo 9) y el autocontrol (capítulo 15).
26 La capacidad de comprometernos de antemano con una opción en lugar de otra sigue siendo una de las
herramientas

más poderosas de nuestro arsenal para la toma de decisiones. 27

Detener una acción prepotente

La interacción entre múltiples sistemas de decisión también puede producir conflictos directamente.
Solo algunos de los múltiples sistemas de toma de decisiones que impulsan las acciones se reflejan en
nuestra consideración de la conciencia. Esto significa que puede haber acciones que nos lleven a
preguntarnos: “¿Por qué hice eso?”.
Otros ejemplos de conflicto (como el del bombero) se producen cuando un sistema quiere acercarse o
huir de un estímulo y otro componente le dice que se quede quieto. 28 En el capítulo 6, veremos que hay
componentes emocionales que dependen de la amígdala (una estructura cerebral límbica profunda
involucrada en fenómenos simples de aproximación y retirada de señalesrespuesta 29 ), componentes de
acción aprendida que dependen de los ganglios basales (otras estructuras neuronales que 30 ), y
de aprendizaje previo: la corteza componentes deliberativos que dependen de los pares situaciónacción
cerebral y el hipocampo (estructuras cognitivas que permiten la imaginación de posibilidades futuras 31 ).
Cuando estos tres sistemas seleccionan acciones diferentes, tenemos un conflicto.
Los experimentos clásicos con ratas y otros animales han estudiado un proceso simple llamado
condicionamiento del32 En un
miedo . experimento típico, se colocaría una rata en una caja y, a intervalos
irregulares, se tocaría un tono y luego la rata recibiría una descarga eléctrica suave. En los experimentos En
modernos, la descarga nunca es suficiente para lastimar al animal, sólo lo suficiente para que sea
desagradable. Se pueden realizar experimentos similares en humanos, donde reciben una descarga eléctrica
suave después
33 de
Lo una
que señal.
sucede es que la rata comienza a temer el tono que predice que se aproxima una
descarga. Los humanos describen explícitamente el temor a la descarga inminente y describen lo
desagradable que es la expectativa de una descarga. De hecho, Greg Berns y sus colegas descubrieron
que el temor a esperar una descarga era tan desagradable que las personas optaban por tener una descarga.

D
Es importante señalar que tanto los experimentos con animales como con humanos están muy regulados. Para
garantizar que estos experimentos sean humanitarios y seguros, los científicos deben obtener el permiso del IRB (comité
de revisión interna, para experimentos con humanos) de la universidad o del IACUC (comité interno de cuidado y uso de
animales, para experimentos con animales). Ambos comités incluyen científicos, profesionales médicos (veterinarios para
animales, médicos para humanos) y miembros de la comunidad local (que a menudo incluyen activistas de los derechos
de los animales en los comités del IACUC). Si el comité no cree que el experimento sea humanitario, seguro y que
probablemente sea importante desde el punto de vista científico, entonces el experimento no puede seguir adelante.
Machine Translated by Google

40 Las decisiones y el cerebro

Las ratas no pueden, por supuesto, decirnos que tienen miedo y están nerviosas por el shock, pero se
quedan paralizadas de miedo y se asustan más en respuesta a un evento inesperado. Si estás tenso,
esperando un shock, entonces un ruido fuerte te hará saltar. Las ratas hacen lo mismo.

Esto nos lleva al condicionamiento del miedo al tono, en el que una rata aprende a esperar una descarga
después de que se reproduce un tono. El condicionamiento del miedo puede entonces extinguirse
proporcionando posteriormente a la rata el tono pero sin la descarga. Como vimos en el capítulo anterior, la
extinción conductual implica una nueva actividad en la corteza infralímbica que se proyecta hacia abajo
35
hasta la amígdala e inhibe la respuesta de miedo aprendida.
Esto coincide con el estudio de Yadin Dudai sobre el coraje que se mencionó en el capítulo anterior:
Dudai y sus colegas estudiaron a humanos que superaban su miedo a las serpientes. 36
La visión de la serpiente desencadenó el sistema emocional (pavloviano) que tenía una reacción innata
ante la serpiente (“¡Huye!”), mientras que el sistema deliberativo tuvo que superar esa acción prepotente.
Como se dice en muchas películas y novelas, el coraje no es la falta de miedo, sino la capacidad de
superar ese miedo. El hecho de que ahora conozcamos los mecanismos neuronales que subyacen al
coraje no disminuye lo que es el coraje.

Resumen
En esta primera parte del libro, hemos definido la cuestión de la toma de decisiones en términos de
selección de acciones, identificamos que no podemos simplemente decir que estamos evaluando
opciones e identificamos que hay múltiples sistemas que impulsan la selección de acciones dentro de los mamíferos.
En la siguiente parte, quisiera abordar la cuestión de qué son estos sistemas múltiples de toma de
decisiones y cómo interactúan entre sí. Más adelante (en la tercera parte del libro), abordaremos sus
vulnerabilidades y lo que éstas significan para los problemas de toma de decisiones, como la adicción y
el trastorno de estrés postraumático.

Libros y artículos para lectura adicional

• George Ainslie (2001). Breakdown of Will . Cambridge, Reino Unido: Cambridge University Press. •
Robert Kurzban (2010). Why Everyone (Else) is a Hypocrite . Princeton, NJ: Princeton
Prensa Universitaria .
• Uri Nili, Hagar Goldberg, Abraham Weizman y Yadin Dudai (2010). No temas: Actividad de los circuitos
frontales y temporales en momentos de valentía en la vida real. Neuron, 66
, 949–962 .

mi
Hace unos meses tuve una experiencia similar con mi pecera: una de las bombas submarinas me
daba una descarga cada vez que metía la mano en el agua. Tuve que hacer un gran esfuerzo de
voluntad para meter la mano en el agua y recuperar la bomba dañada.
F
En su novela épica Dune, Frank Herbert define a la humanidad como la capacidad de mantener tu mano en una caja de dolor, rechazando
los sistemas de selección de acción reflexivos y pavlovianos que quieren retirar la mano, porque el sistema deliberativo sabe que la mujer que te está

probando te matará con su alfiler envenenado en el cuello si lo haces. 37

Machine Translated by Google

SEGUNDA PARTE

EL SISTEMA DE TOMA DE DECISIONES

Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Sistemas de toma de decisiones múltiples

La trompeta de Miles
sincopa el ritmo del tambor, se
eleva como voces burbujeantes
en un estanque turbio, flota
como burbujas de jabón perdidas en el aire,
desvaneciéndose en las nieblas de la mañana.

Existen múltiples sistemas neuronales que impulsan la toma de decisiones, cada

uno de los cuales tiene diferentes propiedades computacionales que lo hacen más
adecuado para impulsar la selección de acciones en diferentes condiciones.
Identificaremos cuatro sistemas de selección de acciones: reflejo, pavloviano,
deliberativo y procedimental. Junto con los sistemas motores, perceptivos, de
categorización de situaciones y de apoyo motivacional, estos conforman el sistema
de toma de decisiones.

Imagínate la primera vez que conduces hacia el trabajo. Probablemente mirarías un mapa y planificarías la mejor ruta.
Durante el viaje, prestarías especial atención a las señales de tráfico y a los puntos de referencia.
Pero si recorres la misma ruta todos los días durante semanas, meses o años, la ruta se vuelve automática. Ya no
requiere la misma cantidad de atención y puedes pensar en otras cosas: el examen que tienes que hacer, el partido de
fútbol de tus hijos esa noche, lo que vas a preparar para la cena. Y, sin embargo, llegas al trabajo. De hecho, puede
volverse tan automático que conduces hasta el trabajo sin querer.
A

La primera vez que utilicé esta analogía, había regresado para dar una charla al laboratorio donde había realizado
mi trabajo posdoctoral en Tucson, Arizona. Me estaba quedando en la casa de huéspedes de mis antiguos mentores.
Cuando trabajé en su laboratorio (durante unos tres años), vivía en el lado este de la ciudad, en el lado sur, cerca de la
base aérea. Ellos también vivían en el lado este de la ciudad, pero al norte, junto a las montañas. Así que la primera
parte del trayecto en coche desde el laboratorio hasta su casa fue la misma que la primera parte de lo que había sido
mi habitual viaje a casa durante años. Y, aunque era plenamente consciente de este problema que acababa de plantear
en mi charla de esa mañana, giré hacia el sur cuando llegué a la esquina y no me di cuenta de mi error hasta que giré
hacia la calle en la que solía vivir.

43
Machine Translated by Google

44 El sistema de toma de decisiones

Como veremos más adelante en esta sección, estos dos procesos (el proceso de planificación consciente,
que exige atención y está basado en mapas, y el proceso automático, que requiere poca atención, está basado
en secuencias y es una rutina) en realidad reflejan dos sistemas diferentes que procesan la información sobre
1
la decisión de maneras fundamentalmente diferentes y dependen de diferentes estructuras cerebrales.
Los científicos que estudian la toma de decisiones han identificado al menos cuatro procesos separados de selección
de acciones:

• Un sistema cableado que reacciona rápidamente a los peligros y eventos directos detectados de
inmediato. Éstos son los reflejos , genéticamente cableados en la médula espinal, el sistema nervioso
periférico y el tronco encefálico central.
• Un sistema que predice resultados y reacciona de una manera preprogramada genéticamente a esos
resultados. Computacionalmente, lo que se aprende en este sistema es una relación causal hipotética
entre las señales y los resultados. Las acciones no se aprenden, se “liberan” como respuestas
apropiadas al resultado esperado. A lo largo de este libro, me referiré a esto como el sistema de
selección de acciones pavloviano .
• Un sistema que delibera sobre las decisiones, que requiere muchos recursos, pero también es capaz de
realizar una planificación compleja y es flexible. Lo llamaré el sistema deliberativo.
sistema, pero también se ha descrito como aprendizaje dirigido a objetivos , como toma de decisiones
basada en modelos , como el sistema de acciónresultado y como la navegación local o de lugar.
2
sistema de ción.
• Un sistema que simplemente aprende la mejor acción a tomar en una situación dada. Una vez
que se almacena esa asociación, el proceso de decisión es muy simple, pero es inflexible.
Me referiré a esto como el sistema de selección de acción procedimental , ya que está muy
involucrado en las secuencias motoras aprendidas (procedimientos), pero también se lo ha
denominadosistema de acción almacenada en caché de , estímulo , y navegación de taxones
3
respuesta y hábito .

Estos cuatro sistemas son generalmente suficientes para explicar la selección de acciones en el cerebro
B
de los mamíferos; Sin embargo, cada uno de ellos tiene sutilezas internas que abordaremos a medida que
examinemos cada sistema por separado. Además, sus interacciones producen sutilezas que no son
directamente obvias a partir de sus componentes computacionales individuales.
Para que estos sistemas funcionen en el mundo real, necesitamos varios sistemas de apoyo
adicionales. En este momento, no está claro si estos sistemas de apoyo son componentes
separados que se comparten entre los sistemas de toma de decisiones, o si hay versiones
separadas de cada uno, de modo que cada sistema de toma de decisiones tiene su propia copia
de cada sistema de apoyo. Alternativamente, estos sistemas de apoyo podrían ser sistemas
completos por derecho propio, con sus propios componentes internos. Finalmente, es posible
que los sistemas de apoyo correspondan de alguna manera a algún aspecto de uno o más de los
sistemas de toma de decisiones. Sin embargo, también pueden ocurrir fallas en los sistemas de apoyo, 5 y

B
Algunos científicos han sugerido un quinto sistema basado en el recuerdo de un único acontecimiento del 4
pasado (“Funcionó la última vez, tal vez vuelva a funcionar”). Sin embargo, no está claro si se trata de un
sistema diferente o de un caso especial del sistema deliberativo que veremos a continuación y exploraremos en
profundidad en el Capítulo 9. Las estructuras cerebrales implicadas en este quinto sistema parecen ser las
mismas que intervienen en el sistema deliberativo.
Machine Translated by Google

Sistemas de toma de decisiones múltiples 45

Será necesario incluirlos para completar nuestra descripción del mecanismo de toma de decisiones.

• En primer lugar, por supuesto, se necesita un sistema de control motor que produzca los
movimientos musculares, los efectores que mueven el cuerpo y realizan la acción real. Como
las cuestiones que se abordan en este libro se refieren principalmente a la selección de la acción,
no a la acción en sí, no dedicaremos mucho tiempo al sistema de control motor espinal, excepto
para decir que las acciones generalmente se almacenan como procesos más complejos que
mover un solo músculo.
• En segundo lugar, se necesitan sistemas perceptivos que reciban e interpreten las señales
sensoriales básicas para determinar qué información llevan esas señales. Estos sistemas
necesitan reconocer objetos y sus propiedades básicas ( ¿Qué es? ¿Dónde está? ). Discutiremos
esto en términos de la detección de características y la integración de información. • Además,
sin embargo, se necesita un sistema que reconozca cuáles son las señales importantes en las que
basar la decisión, ya sea en términos de señales externas en el mundo o señales internas
relacionadas con el cuerpo. Aunque muchas literaturas científicas de toma de decisiones se
refieren a este proceso como "identificación de estímulos", creo que ese término nos lleva a
imaginar que las reacciones se realizan a un solo estímulo, mientras que claramente estamos
reconociendo múltiples estímulos e integrándolos en un reconocimiento de la situación en la que
nos encontramos. Por lo tanto, me referiré a esto como el sistema de
reconocimiento de situaciones . • Finalmente, se necesita un sistema que codifique las metas y
deseos de uno. Este sistema dependerá de las necesidades internas (evolutivas) de cada uno,
pero también deberá mediar entre objetivos, necesidades y deseos conflictivos. Por razones
obvias, me referiré a esto como el sistema motivacional .

Aunque me referiré a estos diferentes aspectos de la toma de decisiones como "sistemas", no quiero
que los tomen como módulos diferentes y separados. Un buen ejemplo de lo que quiero decir con el
término "sistema" son los motores eléctricos y de gasolina de los nuevos automóviles híbridos (como el
Toyota Prius): el automóvil puede ser impulsado por el motor eléctrico o por el motor de gasolina, pero
ambos motores comparten el mismo tren de transmisión y el mismo pedal del acelerador. Algunas partes
son compartidas y otras son separadas. Al final, sin embargo, el objetivo de ambos sistemas de motor
es hacer que el automóvil se mueva. Y el automóvil aún requiere un sistema de dirección adicional para
guiarlo en el curso correcto. De manera similar, lo que importa para la evolución es el comportamiento
del organismo en sí, no los sistemas separados de toma de decisiones. Los sistemas de toma de
decisiones son separados en el sentido de que requieren un procesamiento de información diferente e
involucran estructuras neuronales superpuestas, pero también diferentes, aunque todos interactúan para
producir comportamiento. Nos resultará útil separar estos sistemas como un primer paso en nuestro
análisis, pero necesitaremos volver a su interacción para comprender el comportamiento (y sus modos de falla).
Aunque nos gusta pensar en nosotros mismos como un único tomador de decisiones con un único
conjunto de deseos, todos tenemos experiencias en las que estos múltiples sistemas pueden entrar en
conflicto entre sí. La razón por la que evolucionaron los sistemas múltiples es que cada uno de ellos
tiene ventajas y desventajas, y cada uno es mejor en algunas tareas y peor en otras. Si uno puede
seleccionar con éxito qué sistema será mejor en cada momento, puede obtener las ventajas de cada
uno y disminuir las desventajas de cada uno. Hablaremos más adelante sobre lo que se sabe acerca
del mecanismo por el cual mediamos entre estos sistemas, pero todavía hay mucho debate en la
comunidad científica sobre cómo exactamente ocurre esa mediación.
Machine Translated by Google

46 El sistema de toma de decisiones

Los cuatro sistemas de selección de acciones

Reflejos

Nuestros reflejos son los sistemas de toma de decisiones más simples que tenemos. Los científicos que
estudian la toma de decisiones a menudo descartan el reflejo como un sistema que no permite tomar
decisiones porque es demasiado simple. Pero, según nuestra definición de toma de decisiones como la
selección de una acción, tenemos que incluir un reflejo como una decisión. Debido a que los reflejos
interactúan con los demás sistemas de toma de decisiones, descubriremos que es útil incluirlos en
nuestra taxonomía de sistemas de toma de decisiones.
Tomemos como ejemplo el reflejo. Si tu mano toca algo lo suficientemente caliente como para
quemarlo (por ejemplo, la llama de una vela), retiras la mano rápidamente. Esto es algo que un animal
quiere hacer lo más rápido posible. Si nos tomáramos el tiempo de pensar: “Eso está caliente. ¿Debería
retirar la mano?”, la llama nos habría dañado los dedos. De manera similar, no tenemos tiempo para
aprender a retirar la mano del fuego; la evolución quiere que eso suceda correctamente la primera vez.
Podemos pensar en los reflejos como operaciones simples (acciones que se seleccionan en reacción a
condiciones específicas) que se han aprendido a lo largo del tiempo evolutivo, pero que una vez
aprendidas dentro de una especie, quedan programadas en un individuo determinado. Estas cuestiones
gemelas del tiempo que lleva calcular una respuesta y el tiempo que lleva aprender la respuesta correcta
son ventajas y desventajas críticas de cada uno de los sistemas de selección de acciones.

La prueba de que un reflejo es realmente una decisión se puede ver en su interacción con el
Sistemas de selección de acciones. En Lawrence de Arabia, de David , otro. Hay una escena famosa.
Lean , donde TE Lawrence, interpretado por Peter O'Toole, espera a que la cerilla se queme hasta
los dedos. Su compañero la prueba y se queja de que le duele. "Por supuesto", responde Lawrence,
"pero el truco es no preocuparse por el dolor". Es posible anular la selección de acciones
predeterminada de Reflex con un sistema diferente, más consciente. Esta interacción entre
múltiples sistemas como parte importante de cómo tomamos decisiones es algo a lo que volveremos
varias veces en este libro.

El sistema pavloviano de selección de acciones

La selección de acciones pavloviana también es computacionalmente simple en el sentido de que sólo puede
producir acciones que han sido aprendidas a lo largo de una escala de tiempo evolutiva (a menudo llamadas
respuestas incondicionadas ), 6 pero difiere del sistema de selección de acciones reflexivas en que aprende .

do
He luchado para encontrar la terminología correcta para utilizar en este primer sistema capaz de aprender.
Los mecanismos computacionales que subyacen al primer sistema son muy claros, pero necesitamos un término para ello.
(En un momento estuve tentado de llamarlo “Sistema X” para evitar todo el bagaje histórico asociado con el término “pavloviano”). Históricamente, se ha

asumido que el aprendizaje en los animales (incluidos los humanos) surge de dos sistemas diferentes, uno cuando no se requiere ninguna acción para

obtener la recompensa (pavloviano) y otro cuando se requiere acción (instrumental). 7

En los experimentos originales de Pavlov, se producía el sonido (la “campana”) y luego aparecía la comida. El perro
no tenía que hacer nada para conseguir la comida, por lo que se identificó como el primer sistema, que se denominó
“pavloviano”. Si, por el contrario, el perro tenía que empujar una palanca con la pata después de que sonara la campana
para conseguir comida, eso sería “instrumental”.

(continuado)
Machine Translated by Google

Sistemas de toma de decisiones múltiples 47

El sistema pavloviano aprende estímulos que predicen resultados, pero no aprende las acciones a
tomar ante esos resultados. 14 El aprendizaje pavloviano recibe su nombre de Ivan
Pavlov (18491936), el gran neurocientífico ruso. Supuestamente, Pavlov hizo sonar una campana
antes de alimentar a un perro y descubrió que el perro aprendió a salivar al son de la campana en
anticipaciónD a la comida.

Al describir el aprendizaje pavloviano, los científicos a menudo describen los estímulos como
“liberadores de acciones específicas”. 19 En la teoría clásica del aprendizaje animal, hay un estímulo
incondicionado (la comida que se le presenta al perro de Pavlov), una respuesta incondicionada
(salivación) y un estímulo condicionante (la campana). En el aprendizaje pavloviano, la respuesta
incondicionada cambia con el tiempo del estímulo incondicionado al estímulo condicionante. Las
interpretaciones del aprendizaje pavloviano tienden a ignorar el componente de selección de acción del
aprendizaje, lo que sugiere que la respuesta incondicionada es simplemente una herramienta para
identificar una asociación entre el estímulo condicionante y el estímulo incondicionado. 20

Estas interpretaciones se basan en parte en que el mismo entrenamiento que hace que los animales
adopten la respuesta incondicionada después de ver la señal de entrenamiento (selección de acción
pavloviana) también hace que los animales sean más propensos a adoptar otras acciones no entrenadas
que saben que alcanzarán el estímulo incondicionado (como si tuvieran una mayor motivación para
alcanzar ese estímulo incondicionado). 21 Este es un proceso llamado transferencia pavloviana a
instrumental , que examinaremos en profundidad cuando lleguemos a nuestro análisis de la motivación,
más adelante. Datos recientes sugieren que los dos efectos (liberación de la respuesta incondicionada) son:

Ahora sabemos que estos sistemas son más complicados: por ejemplo, el término tradicional “instrumental” incluye tanto los

sistemas deliberativos como los procedimentales, que seleccionan acciones utilizando procesos computacionales muy diferentes,
8 y el aprendizaje pavloviano en realidad trata sobre la selección de acciones apropiadas para la señalresultado.
9
expectativas. Además, estos dos sistemas de aprendizaje interactúan en un proceso llamado “de pavloviano a instrumental”.
transferencia”, 10 que identificaremos con el sistema de apoyo motivacional (más adelante).
Como veremos en nuestra discusión en profundidad de los sistemas pavlovianos (Capítulo 8), este sistema “pavloviano” Sin
Está relacionado con los instintos básicos de supervivencia y con las emociones. 11 embargo, ninguno de esos términos captura todos los

problemas computacionales, y ambos tienen su propio bagaje histórico asociado con ellos: el comportamiento animal tiene que
ver con el éxito genético, no con la supervivencia, 12 y la relación directa entre lo que llamamos el sistema de selección de acción
pavloviano y la emoción es controvertida. 13 Por lo tanto, utilizaré el término “selección de acción pavloviana” a lo largo de este
libro como un sustituto de un término mejor para este primer sistema de selección de acción basado en el aprendizaje.

D. Pavlov fue el primer ganador del premio Nobel de Medicina en 1904, pero sorprendentemente para mucha gente hoy en
día, no lo ganó por los estudios del aprendizaje por los que lo conocemos hoy, sino por su trabajo sobre la digestión y la salivación.
15 Después de su premio Nobel, se sintió lo suficientemente famoso como para arriesgarse a trabajar en el aprendizaje, iniciando
una tradición de ganadores del premio Nobel que pasaron de temas médicos no relacionados a la psicología y la neurociencia.
Otros ejemplos incluyen a Francis Crick 16 (19162004, premio Nobel en 1962 por el ADN) y Gerry Edelman 17 (1929, premio
Nobel en 1972 por los anticuerpos en el sistema inmunológico), quienes se dedicaron a trabajar en la conciencia después de ganar

sus premios.
Como sucede con la mayoría de las descripciones populares del proceso científico, la historia que se enseña en las clases
de introducción a la ciencia, según la cual Pavlov tenía una hipótesis explícita que luego puso a prueba, contradice el verdadero
18
proceso de descubrimiento en la ciencia. De hecho, Pavlov estaba trabajando en los mecanismos de la Como parte de su

digestión. Para la investigación con animales, tuvo que poner al perro en un arnés que estaba contrapesado por un peso pesado.
Cuando se le soltó el peso, Pavlov notó que el perro comenzaba a salivar. Pavlov se dio cuenta de que algo interesante estaba
sucediendo y decidió perseguirlo.
Machine Translated by Google

48 El sistema de toma de decisiones

de respuestas incondicionadas a estímulos condicionados [selección de acción pavloviana] y un aumento de la

motivación evidenciado por un aumento de las acciones realizadas por otros sistemas [transferencia pavloviana a
instrumental]) son disociables. Se ven afectados de forma diferente por diferentes lesiones de la estructura cerebral
y por diferentes manipulaciones farmacológicas.
22 La relación entre la selección de acción pavloviana y los
sistemas motivacionales es todavía una cuestión abierta que los científicos están estudiando activamente.

Sin embargo, no debemos olvidar que el animal, de hecho, está realizando una acción. Interpretaciones
recientes sugieren que el aprendizaje pavloviano desempeña un papel en un sistema de selección de acciones, en
el que las respuestas incondicionadas son acciones aprendidas a lo largo de una escala de tiempo evolutiva. 23
Imagínese vivir en la sabana, donde hay leones que podrían cazarlo. Puede aprender que el susurro en la maleza
predice que un león lo acecha y puede aprender a huir del susurro de la hierba, pero no tiene la oportunidad de
aprender a huir del león: debe hacerlo bien la primera vez. El sistema de selección de acciones pavloviano puede
aprender que el susurro en la hierba es un león que lo acecha, lo que lleva al miedo y a correr, pero no puede
aprender que la respuesta correcta es hacer saltos de tijera.

Una excelente manera de entender el sistema pavloviano es el fenómeno de los rastreadores de señales.
24
y rastreadores de Imagínese que se colocan ratas en un entorno con un sistema de liberación de alimentos.
objetivos . puerto y una luz, separados por una distancia pequeña pero significativa. La luz se enciende, y unos
momentos después llega comida al puerto de comida. La conexión entre la luz y la comida es independiente de lo
que haga la rata: la luz simplemente predice que la comida estará disponible. Lo correcto para la rata es ir al puerto
de comida cuando se enciende la luz. (Esto sería "seguimiento de objetivos"). Sin embargo, algunas ratas van a la
luz durante el intervalo intermedio y la roen. Todavía van a la comida cuando se les entrega la comida, pero han
perdido tiempo y energía yendo primero a la luz. (Esto sería "seguimiento de señales"). De hecho, si una rata
rastreadora de señales ha tenido suficiente experiencia con la asociación luzcomida, y dejas de darle comida si la
rata va a la luz y se la das solo si la rata va directamente al puerto de comida, la rata tiene un problema terrible para
dejar de ir a la luz.

25 La asociación pavloviana es demasiado

fuerte.
El pensamiento actual sugiere que la selección de acción pavloviana está relacionada con lo que reconocemos, aunque la relación

La categorización de las respuestas 26 específica entre la selección de acción pavloviana y la selección de acción pavloviana es incierta.
emocionales, la acción y la emoción etiquetada lingüísticamente es controvertida. 27 Algunos autores han sugerido
que las respuestas emocionales son acciones pavlovianas que modifican las respuestas internas (frecuencia
cardíaca, salivación, etc.). 28 Otros han sugerido que las cosas que etiquetamos como emociones son un proceso
de categorización aplicado a estas respuestas internas. En el Apéndice C se puede encontrar
un análisis de los procesos de categorización en los cerebros de los mamíferos (incluidos los humanos).
Volveremos a las relaciones entre la selección de acción pavloviana y la emoción en el Capítulo 8.

Aunque es flexible en cuanto a los estímulos a los que puede reaccionar, el conjunto de acciones disponibles
para el sistema de selección de acciones pavloviano es muy limitado. Las respuestas pavlovianas solo pueden
transferir una simple “respuesta incondicionada” a un estímulo anterior. Esto lo hace más flexible que los reflejos
simples, pero el sistema de selección de acciones pavloviano no puede realizar una acción arbitraria en respuesta
a un estímulo arbitrario. Para eso, necesitamos una maquinaria de toma de decisiones más compleja, como los
sistemas deliberativo o procedimental.
Machine Translated by Google

Sistemas de toma de decisiones múltiples 49

Deliberación

El sistema deliberativo es más flexible. Puede tomar cualquier acción en cualquier situación, pero es
un sistema computacionalmente costoso. En los seres humanos, la deliberación implica planificación y
consiste en una investigación consciente del futuro. Esto es particularmente útil para decisiones
importantes que se toman una sola vez, donde no se pueden probar las opciones individuales varias
veces para determinar el valor de cada una.

Por ejemplo, un amigo mío pasó el último mes decidiendo entre dos universidades que le habían hecho
ofertas de trabajo. Cada una de ellas tenía ventajas y desventajas. No era una decisión que pudiera tomar
diez veces, observar cuáles eran las respuestas cada vez y luego aprender lentamente a tomar la opción
correcta. Obviamente, no era una decisión con una acción que evolucionara a lo largo de generaciones.
mi
En cambio, tuvo que imaginarse a sí mismo
en esos dos futuros: ¿Cómo sería la vida en la Universidad Uno? ¿Cómo sería la vida en
F
¿Universidad Dos? A través de su experiencia de vida y de la discusión con sus colegas, trató de calcular
las consecuencias de su decisión. A partir de esa compleja deliberación, elaboró lo que creía que era la
mejor opción.
30
Este es un proceso llamado pensamiento futuro episódico . Volveremos a la cuestión del pensamiento
episódico sobre el futuro en capítulos posteriores, pero el concepto es que, cuando se intenta planificar un
acontecimiento futuro complejo, es necesario reunir recuerdos y experiencias de muchas fuentes para
imaginar cómo podría ser el futuro potencial. Al imaginarnos a nosotros mismos en ese acontecimiento
futuro, podemos determinar si es algo que queremos que suceda o algo que queremos evitar. Como
veremos, tanto el hipocampo como la corteza prefrontal participan de manera crítica en el pensamiento
31;G
episódico sobre el futuro.
Una pregunta crítica que ha plagado la psicología durante años es: ¿los animales también deliberan?34
No podemos preguntarle a una rata en qué está pensando, pero podemos decodificar información a partir de
señales neuronales. Si sabemos qué información está representada por un conjunto de células, entonces
podemos decodificar esa información a partir de la actividad en esas células. (Véase el Apéndice B para una
discusión de la tecnología actual y los métodos que permiten la decodificación de señales neuronales).

mi
Creo que es bastante improbable que “aceptar el trabajo en la Universidad Uno” pueda estar codificado en los genes de una persona.

Es evidente que esta cuestión no se puede resolver mediante reflejos. De manera similar, aunque ésta no es ciertamente una decisión que

el sistema de selección de acciones pavloviano pueda tomar (no puedo imaginar que “firmar en la línea de puntos” sea una respuesta

genéticamente codificada para ningún resultado), se podría argumentar que el sistema pavloviano influyó en su decisión, porque se sintió

atraído a un lugar u otro. Sospecho que hay participación pavloviana cuando alguien dice: “Quiero volver a esa universidad porque está en

mi ciudad natal donde crecí y quiero volver a casa” (o “Nunca volveré a esa universidad porque está en mi ciudad natal donde crecí”, ¡lo cual

también he escuchado!). En cualquier caso, la decisión final de ir a un nuevo trabajo o no es una que casi con certeza involucra al sistema

de toma de decisiones deliberativo.

F
Esta es una de las ventajas del lenguaje humano: podemos mejorar nuestra predicción a partir de la observación.
conversaciones y discusiones con otros.

G A menudo se habla del hipocampo como un elemento fundamental para la memoria episódica , es decir, para los recuerdos de

acontecimientos pasados de la vida. 32 El papel del hipocampo en la imaginación del futuro (pensamiento episódico sobre el futuro) sugiere

una hipótesis particularmente interesante sobre el papel del hipocampo en los recuerdos del pasado: tal vez no recordemos el pasado, tal

vez en realidad imaginemos nuestro pasado. Tal vez estemos usando el sistema que evolucionamos para imaginar el futuro cuando tratamos

de recordar estos acontecimientos pasados. Esta puede ser una explicación de por qué nuestros recuerdos de acontecimientos pasados son
33
tan frágiles y tan fácilmente manipulables.
Machine Translated by Google

50 El sistema de toma de decisiones

señales.) El hipocampo es una parte fundamental del pensamiento episódico sobre el futuro en los seres humanos. 35
En las ratas, la información representada en las células del hipocampo es, en primer lugar, la ubicación del animal en
un entorno (se conocen como células de lugar ). 36 A partir de la actividad de estas células, podemos decodificar la
ubicación representada en un momento determinado por las células. 37 Por lo tanto, si una rata imaginara estar en
otro lugar del entorno, deberíamos poder decodificar esa imaginación observando el conjunto de células activas del
hipocampo. 38
Las ratas parecen, sin duda, deliberar sobre sus opciones. Cuando se encuentran ante una opción difícil o que ha
cambiado recientemente (por ejemplo, en una intersección en T de un laberinto), a veces se detienen y giran primero
hacia un lado y luego hacia el otro. 39 Cuando Karl Muenzinger y su alumna Evelyn Gentry observaron por primera
vez este comportamiento en 1931, lo llamaron “ensayo y error indirecto” porque pensaron que la rata estaba probando
las posibilidades indirectamente.
De la misma manera que mi amigo se imaginaba a sí mismo en sus dos futuros trabajos para tratar de decidir entre
ellos, la rata se imaginaba a sí misma eligiendo entre las dos opciones. Estas ideas fueron desarrolladas por Edward
Tolman en los años 1930 y 1940, quien demostró que estos procesos indirectos de ensayo y error ocurrían cuando
nosotros mismos deliberamos sobre las opciones y argumentó explícitamente que los animales estaban representando
yo
el futuro conscientemente.
Por desgracia, Tolman no tenía una forma matemática de explicar sus ideas y fue atacado porque “no predijo lo
que haría la rata”. El psicólogo Edwin Guthrie, en un artículo de revisión de 1937, se quejaba de que “en lo que
respecta a la teoría, la rata se queda sumida en sus pensamientos”. Tolman no tenía un ordenador moderno y no
42
tenía lenguaje para decir “sí, la Tolman, sin embargo, escribía antes de la invención del mod
rata se queda sumida en sus pensamientos porque está haciendo un cálculo complejo”. En nuestro mundo moderno,
todos hemos experimentado la idea de la complejidad computacional: los algoritmos tardan en procesarse. Cuando
nuestros ordenadores buscan un archivo en un directorio. Cuando un sitio web tarda en cargarse. Cuando un oponente
informático en un juego tarda en responder. No nos resulta tan extraño que un ordenador esté “perdido en sus
pensamientos”. Y, de hecho, Tolman (siguiendo a Muenzinger y Gentry) había observado directamente a las ratas
detenerse en esos puntos de elección, presumiblemente “perdidas en sus pensamientos”.

Además, por supuesto, Tolman y sus colegas no tenían las herramientas neurofisiológicas que tenemos ahora.
Así como los humanos con daño en el hipocampo no pueden imaginar el futuro, también las ratas con daño en el
43
En los hipocampo ya no se detienen en los puntos de elección, ni
44
eventos de “ensayo y error vicarios”, ¿muestran tanto Ahora podemos decodificar representaciones
ensayo y error vicarios? de lugar a partir de conjuntos registrados de neuronas del hipocampo
(Apéndice B). Cuando hicimos esto en mi laboratorio, descubrimos que durante esos eventos de
“ensayo y error vicarios” pausados, la representación del hipocampo se adelantó al animal,
primero hacia una posible elección futura, luego hacia la otra. 45 Así como mi amigo estaba
imaginando cómo sería aceptar un trabajo u otro, también la rata estaba imaginando qué
sucedería si fuera corriendo por el camino de la izquierda o por el camino de la derecha.

H Si los animales son conscientes o no es, por supuesto, una gran pregunta que depende en parte de la
pregunta: ¿Qué es la conciencia ?
40 Cuando daba charlas sobre nuestros datos de ensayo y error indirectos, me
gustaba responder a la inevitable pregunta sobre si las ratas estaban deliberando conscientemente sobre el futuro
diciendo que pensaba que era el mismo proceso que los humanos, pero que “ni Tolman ni yo usaríamos nunca la
palabra 'conciencia'”. Un día, después de oírme dar una de estas charlas, Adam Johnson me entregó el libro de
texto de Tolman de 1932 y me mostró la sección titulada “El ensayo y error indirecto es una prueba de la
conciencia en la rata”. 41 Por ahora, digamos simplemente que la cuestión de la conciencia es difícil.

Volveremos a ello al final del libro (Capítulo 24).

Machine Translated by Google

Sistemas de toma de decisiones múltiples 51

Una observación importante que hicimos fue que estas representaciones eran secuenciales, coherentes y
seriales. Eran secuenciales en el sentido de que consistían en una secuencia de células que se activaban en el
orden correcto siguiendo un camino. Eran coherentes en el sentido de que las secuencias consistían en
representaciones precisas de lugares que se encontraban por delante del animal. Y eran seriales en el sentido
de que iban por un camino y luego por el otro, no por ambos. Nuestras ratas realmente estaban imaginando el
futuro .

Una cosa es imaginar el futuro, pero ¿cómo lograron nuestras ratas evitar perderse en sus pensamientos?
¿Cómo tomaron nuestras ratas la decisión? El siguiente paso en la deliberación es la evaluación.
Nuestra rata necesita ir más allá de decir “si voy a la izquierda obtendré bolitas de comida con sabor a plátano”
y decir “y las bolitas de comida con sabor a plátano son buenas”. Dos estructuras involucradas en la evaluación
son el cuerpo estriado ventral y la corteza orbitofrontal. Ambas estructuras están involucradas en la motivación

y a menudo son disfuncionales en la adicción a las drogas y otros síndromes con problemas de motivación.
47
Además, el estriado ventral recibe información directa de
la formación hipocampal. 48 El funcionamiento de la corteza orbitofrontal está modulado por la integridad del
hipocampo. 49 ¿Qué hacían estas estructuras cuando el hipocampo representaba estos
futuros potenciales?
Así como podemos registrar conjuntos neuronales del hipocampo y decodificar la representación espacial,
podemos registrar conjuntos neuronales del cuerpo estriado ventral o de la corteza orbitofrontal y decodificar
representaciones relacionadas con la recompensa. Descubrimos que tanto las células relacionadas con la
recompensa del cuerpo estriado ventral como las del cuerpo orbitofrontal (células que normalmente responden
cuando el animal recibe una recompensa) mostraron una actividad adicional en el punto de elección donde el
50
Se estaba produciendo ensayo vicario y Muenzinger, Gentry y Tolman estaban completamente en lo cierto: cuando
un error. Estas ratas se detienen y miran hacia adelante y hacia atrás en los puntos de elección, están probando
indirectamente las opciones potenciales, buscando en el futuro y evaluando esas posibilidades.
El sistema de toma de decisiones deliberativas tiene muchas ventajas. Es extremadamente flexible. Saber
que ir a la izquierda puede darte comida con sabor a plátano no te obliga a ir a la izquierda. Puedes tomar una
decisión sobre a qué universidad ir, qué trabajo aceptar, a qué ciudad mudarte, sin tener que pasar años
probando. Saber que una empresa te ha hecho una oferta de trabajo no te compromete a aceptarla. Pero la
deliberación es computacionalmente costosa. Se necesitan recursos y tiempo para calcular esas posibilidades
futuras potenciales. Si te enfrentas a la misma situación todos los días y la acción apropiada es la misma cada
vez, entonces no hay razón para perder ese tiempo replanificando y reevaluando esas opciones: simplemente
aprende cuál es la opción correcta y tómala.

Selección de acciones procedimentales

El sistema procedimental es, a primera vista, mucho más simple: simplemente necesita reconocer la situación
y luego seleccionar una acción o secuencia de acciones almacenadas. 51 Esta es la teoría

clásica de estímulorespuesta de la selección de acciones. El sistema de selección de acciones procedimental

difiere de los otros tres sistemas. A diferencia de los reflejos cableados, el sistema procedimental puede
aprender a realizar cualquier acción. Al igual que el sistema pavloviano, puede aprender a trabajar a partir de

I
Es importante señalar que nuestras ratas solo representaban el futuro inmediato. Si esto es episódico, es un pensamiento
Pensar en el futuro, 46 futuro de un futuro inmediato que solo está a unos pocos segundos de distancia. Los humanos pueden
imaginar el futuro dentro de días, meses, años, incluso siglos.
Machine Translated by Google

52 El sistema de toma de decisiones

El aprendizaje procedimental asocia acciones con situaciones. Puede tomar la acción rápidamente porque
simplemente está buscando qué acción tomar, pero como simplemente está buscando cosas, no tiene la
flexibilidad para cambiar fácilmente si es necesario.

Para ver la distinción entre los sistemas Deliberativo y Procedimental, podemos imaginar una rata
entrenada para empujar una palanca para recibir bolitas de comida con sabor a fruta. Una vez que la rata ha
aprendido la tarea (empujar la palanca, obtener comida con sabor a fruta), cuando la rata es colocada
nuevamente en la caja experimental, empujará la palanca y comerá la comida. Podemos imaginar dos posibles
mecanismos de aprendizaje aquí: 52 “Si empujo la palanca, sale comida con sabor a fruta. Me gusta la comida
con sabor a fruta. Empujaré la palanca” o “Empujar la palanca es algo bueno que hacer. Cuando aparezca la
palanca, la empujaré”. La primera lógica corresponde al sistema Deliberativo (basado en la búsqueda,
predicción de resultados de acciones), mientras que la segunda lógica corresponde al sistema Procedimental
(acción almacenada en caché, automática, hábito, estímulo
sistema de respuesta).
Estos dos procesos cognitivos pueden diferenciarse cambiando el valor que la rata le da a la comida con
sabor a fruta. Por ejemplo, se le pueden dar bolitas de comida con sabor a fruta y luego cloruro de litio, una
sustancia química que no daña a la rata pero la hace sentir mal. 53 (El cloruro de litio a menudo hace que los
humanos vomiten). Cuando la rata es colocada nuevamente en la caja experimental, si está usando el sistema
deliberativo, la lógica se convierte en “Si empujo la palanca, sale comida con sabor a fruta. ¡Qué asco! Esa
cosa es repugnante. No empujes la palanca”. Si, en cambio, la rata está usando el sistema procedimental,
entonces la lógica se convierte en “Ahí está esa palanca. Debería empujarla”. Cuando sale comida con sabor
a fruta, la rata la ignora y no la come, pero sigue empujando la palanca. Estas dos reacciones dependen de
diferentes estructuras cerebrales, ocurren después de diferentes paradigmas de entrenamiento y requieren
cálculos computacionales diferentes. 54

Computacionalmente, el sistema procedimental es muy simple: aprender la acción correcta o 55 (En

modelos secuencian acciones, las asocian con una situación reconocida. realidad, la mayoría de los
asocian un valor con cada acción disponible en cada situación, almacenando valores de situación–
56 ) Entonces, la próxima vez que te enfrentes a esa situación, sabrás exactamente qué hacer. Este es en
gran medida el concepto de un hábito no consciente con el que todos estamos familiarizados. Cuando una
estrella del deporte aprende a reaccionar rápidamente "sin pensar", es el sistema procedimental el que está
aprendiendo. Cuando los soldados o la policía aprenden a responder con la velocidad del rayo al peligro, son
sus sistemas procedimentales los que están aprendiendo esas respuestas.

La literatura de psicología de la vieja escuela a menudo hablaba de este sistema como “estímulo
respuesta”, con la idea de que las respuestas específicas (presionar una palanca) se vinculan a estímulos
específicos (se enciende la luz), pero ahora sabemos que las respuestas pueden ser bastante complejas
(lanzar la pelota al receptor) y que los estímulos se describen mejor como situaciones completas (está libre).
Un amplio trabajo experimental sobre los mecanismos del control motor muestra que el proceso de aprendizaje
procedimental puede reconocer situaciones muy complejas y parte de la clave para ser una estrella deportiva
Puede aprender secuencias de acciones muy complejas.57 exitosa o dar la respuesta policial correcta es la
capacidad de reconocer la situación y categorizarla correctamente.
58
Una vez categorizada la situación, se procede a la selección de acciones.
Machine Translated by Google

Sistemas de toma de decisiones múltiples 53

El proceso es simple. Una forma de pensar en la diferencia entre los sistemas deliberativo y procedimental
es que el sistema procedimental traslada toda la complejidad de la toma de decisiones al componente de
reconocimiento de la situación.
Una de mis escenas favoritas de esto está en la película Hombres de Negro. , 59 donde lo nuevo
El recluta (el futuro agente J, interpretado por Will Smith) se enfrenta a una escena simulada de ciudad y
decide ignorar todos los recortes de alienígenas aterradores y dispararle a la niña. Cuando el agente jefe
Zed le pregunta por qué le había disparado a la “pequeña Tiffany” responde explicando que cada alienígena
parecía aterrador pero que solo estaba “tratando de llegar a casa” o “estornudando de verdad”, pero que “la
pequeña Tiffany era una niña de ocho años que llevaba libros de texto de mecánica cuántica por una calle
insegura de la ciudad por la noche”. El punto, por supuesto, es que el agente J tenía excelentes habilidades
de categorización de situaciones y notó las sutilezas (como el pañuelo del alienígena aterrador y los libros
de texto cuánticos de la pequeña Tiffany) y pudo reaccionar rápidamente a las preguntas.
situación correcta

Aunque describir la selección de acciones procedimentales como el almacenamiento de una acción

parece bastante simple (reconocer la situación y realizar la acción almacenada), existen dos complejidades
importantes en el funcionamiento de este sistema. En primer lugar, hay que aprender cuál es la acción correcta.
A diferencia del sistema deliberativo, el sistema procedimental es muy inflexible; la acción que se almacena
como la mejor opción no se puede actualizar sobre la marcha. Más adelante veremos que anular una acción
almacenada es difícil y requiere circuitos neuronales adicionales (sistemas de autocontrol en la corteza
prefrontal, capítulo 15). En segundo lugar, los circuitos del cerebro de los mamíferos (incluido el humano)
parecen incluir circuitos separados de “hacer” y “no hacer”: un sistema aprende “en esta situación, haz esta
acción”, mientras que otro sistema aprende “en esa situación, no lo hagas”.
60

Los datos actuales sugieren firmemente que el sistema procedimental incluye los ganglios basales,
particularmente los circuitos de los ganglios basales dorsales y laterales, comenzando con el núcleo
caudado y el putamen, que reciben entradas de la corteza. Estas conexiones
sinápticas entre los circuitos corticales (que se cree que representan información sobre el mundo) son
entrenadas por señales de dopamina. 62 Si recuerdas nuestra discusión sobre el
valor, la euforia y la señal de "hazlo de nuevo" (Capítulo 4), recordarás que la dopamina señaló el error en
nuestra predicción de cuán valiosas eran las cosas 63 —si las cosas salieron mejor de lo esperado, hubo
un aumento de dopamina y queríamos aumentar nuestra disposición a tomar una acción; si las cosas fueron
peores de lo esperado, hubo una disminución de dopamina y queríamos disminuir nuestra disposición a
tomar una acción; y si las cosas salieron como esperábamos, entonces no necesitábamos aprender nada
sobre qué hacer en esa situación. La conexión entre la corteza y el caudado/putamen codifica nuestra
"disposición a tomar una acción" y es entrenada por estas señales de dopamina.

Sistemas de apoyo

Además de los cuatro sistemas de selección de acciones, necesitamos cuatro componentes

adicionales: un sistema de acción física , que puede realizar físicamente la acción que ha sido
seleccionada, un sistema perceptivo , que puede reconocer los objetos en el mundo que nos rodea,
un sistema de reconocimiento de situaciones que clasifica los estímulos en "situaciones", y un
sistema motivacional que identifica lo que necesitamos a continuación y lo desesperados que
estamos por satisfacer esas necesidades.
Machine Translated by Google

54 El sistema de toma de decisiones

Realizar una acción física

La mayoría de las acciones requieren que movamos nuestros músculos. Esto es así tanto si corremos por la
calle, nos damos la vuelta para enfrentar a un adversario, sonreímos o fruncimos el ceño, o firmamos en una
línea de puntos. Al final, movemos nuestros músculos y tenemos un efecto en el mundo. Incluso el habla es
movimiento muscular. Como sistema de apoyo, a menudo se lo denominaría el sistema de “control motor”,
porque es el paso final en la interacción física con el mundo. Para completar, probablemente valga la pena
incluir las acciones no motoras dentro de este sistema de apoyo. Por ejemplo, en nuestra descripción de la
selección de acciones pavloviana, los perros de Pavlov estaban salivando, liberando un líquido en sus bocas,
lo que en realidad no es un movimiento muscular.
De la misma manera, el sobrecalentamiento provoca sudoración, que tampoco es realmente un movimiento
muscular. Sin embargo, la mayoría de los efectos del sistema de acción física son motores.
movimientos.

Los detalles de cómo funcionan los músculos se pueden encontrar en cualquier libro de texto de medicina.
descripciones. 64 La cuestión importante para Muchos libros de texto de neurociencia tienen buenas
nosotros es que dentro del sistema de control motor (acción física), los bloques de construcción no son
movimientos musculares individuales, sino más bien componentes hechos de conjuntos de movimientos
65
no relacionados, llamados sinergias musculares . Pero incluso dentro de esas sinergias musculares,
colocamos un pie abajo , talón a punta, colocamos el otro abajo y levantamos el primer pie; no ponemos
nuestros pies un paso a la vez; en cambio,
El caminamos .
caminar humano, como el nadar de un pez o una lamprea, es un
ejemplo de un proceso llamado generador de patrones centrales , llamado así porque es capaz de generar
sin entrada externa. Pueden continuar oscilando sin entrada, pero puedenuna secuencia de manera central,
modificarse directamente a partir de señales sensoriales externas y también de señales de arriba hacia abajo
(presumiblemente de los mismos sistemas de selección de acción).

Dado que nuestro objetivo en este libro es comprender el proceso de selección de acciones, vamos a
eludir la cuestión de cuáles son esas acciones a nivel de control motor individual, pero obviamente estos
procesos pueden ser muy importantes clínicamente.

Percepción

Al igual que el termostato con el que comenzamos al principio del libro (Capítulo 2), para
tomar las acciones adecuadas en el mundo, uno necesita percibir el mundo. Por supuesto,
nuestros sistemas perceptivos son mucho más complejos que simplemente medir la
temperatura. Los sistemas perceptivos humanos toman información sobre el mundo a
partir de señales sensoriales, procesan esa información y la interpretan. Aunque nuestros
ojos transforman la luz (fotones) en actividad neuronal, no vemos los fotones en sí, vemos objetos.
El árbol que está fuera de mi ventana, el carbonero saltando de rama en rama. De manera similar, nuestros
oídos detectan vibraciones en el aire, pero oímos sonidos: el silbido del viento, el canto del carbonero.

Al igual que con el sistema de acción física, los detalles de cómo funcionan los sistemas perceptivos se
pueden encontrar en muchos libros de texto de neurociencia. Fisiología del comportamiento y Avi de Neil Carlson

J Por supuesto, es posible colocar conscientemente nuestros pies paso a paso, pero esto implica que uno de nuestros
sistemas de selección de acciones tome el control de un subconjunto de movimientos motores. Este es un ejemplo de
, en el que los
arquitectura de subsumpción . nuevos sistemas no sustituyen a los antiguos, sino que les añaden bucles de control. 66
Machine Translated by Google

Sistemas de toma de decisiones múltiples 55

Los Fundamentos de la percepción sensorial de Chaudhuri son excelentes puntos de partida. No dedicaremos
mucho tiempo a la transición de la realidad física a la actividad neuronal (de los fotones a la vista, de las
vibraciones al sonido), pero sí dedicaremos algo de tiempo a explorar cómo los sistemas neuronales categorizan
la percepción para identificar objetos y extraer información de esas señales sensoriales (véase el capítulo 11).

Reconociendo la situación

Cuando los psicólogos clásicamente probaban animales en experimentos de aprendizaje, utilizaban individuos...
estímulos identificables individualmente para que pudieran controlar las variables en sus experimentos. 68;K

Pero, ¿cuál es la señal importante en el mundo en este momento? Estoy escribiendo este párrafo en un portátil
Lenovo negro, sentado en un escritorio cubierto de madera y vidrio de color marrón oscuro, escuchando la
guitarra quejumbrosa de Carlos Santana, mirando por la ventana hacia la oscuridad (son las 6 de la mañana en
invierno). Afuera, una farola ilumina la intersección vacía, la sombra de un árbol se cierne sobre mi ventana, hay
nieve en el suelo y puedo ver los copos de nieve cayendo. La luz sobre mi escritorio se refleja en la ventana. A
mi lado están mis notas.
¿Cuáles de estas señales son importantes para la situación? Si algo sucediera, ¿qué identificaría como importante?

Aunque es una idea controvertida, mi intuición actual es que el neocórtex es una gran máquina de
reconocimiento de situaciones. Básicamente, cada sistema cortical clasifica la información sobre el mundo. La
corteza visual reconoce características de las imágenes que vemos; la corteza auditiva reconoce características
de los sonidos que escuchamos. También hay componentes de la corteza que reconocen características más
abstractas: la corteza parietal reconoce la ubicación de los objetos que nos rodean; la corteza temporal reconoce
qué son esos objetos.
Hay un área de la corteza que reconoce caras y un área que reconoce la habitación.
Estás dentro. 70 Incluso la corteza motora puede verse como una categorización de acciones potenciales. 71

A medida que uno avanza desde la parte posterior del cerebro (donde tienden a estar las cortezas sensoriales)
hacia la parte frontal del cerebro, las categorías se vuelven cada vez más abstractas, pero la estructura cortical
se conserva notablemente y la estructura del proceso de categorización no parece cambiar mucho. 72

Los modelos dirigidos a cada una de estas cortezas individuales parecen funcionar a través de un proceso
llamado memoria direccionable por contenido
73. La memoria direccionable por contenido se puede distinguir del
tipo de memoria indexada con la que estamos familiarizados en las computadoras típicas porque la memoria
direccionable por contenido recupera la memoria completa a partir de una parte de la memoria, mientras que la
memoria indexada se recupera a partir de un identificador no relacionado. Una imagen de la fiesta de cumpleaños
de su hija almacenada en su computadora podría titularse IMG3425.jpg (memoria indexada, sin relación entre el
título y el tema), pero el recuerdo se recuperaría en su cerebro a partir de una sonrisa en su rostro, una torta,
velas que se apagan...

K Por supuesto, los experimentos se llevan a cabo en presencia de otras abundantes señales, como la caja, la habitación o el laberinto

experimentales. Estas otras señales suelen identificarse en una descripción general llamada "contexto". Las diferencias específicas entre el

contexto y las señales son muy complejas y sutiles y parecen tener que ver con las diferencias entre las señales ambientales (la habitación

en la que estás) y las señales de objetos pequeños (una luz o un tono) y con las diferencias en la estabilidad (los contextos son estables) y

la variabilidad (las señales de los objetos cambian rápidamente). Sin embargo, parece claro que el contexto y las señales individuales son

procesadas por diferentes sistemas cerebrales.

69
Machine Translated by Google

56 El sistema de toma de decisiones

La memoria direccionable por contenido es un proceso en el que se completan patrones parciales.

Los procesos computacionales que subyacen a las memorias direccionables por contenido son bien
conocidos y pueden considerarse como un medio de categorización. En el Apéndice C se puede encontrar
una descripción detallada de esos procesos computacionales, su implementación neuronal y cómo
conducen a la categorización.
La hipótesis de que el neocórtex es una maquinaria para la categorización de situaciones ofrece una
posible explicación tanto del gran aumento de la superficie neocortical en los seres humanos como de
nuestras asombrosas capacidades que parecen ser exclusivamente humanas: somos mejores a la hora de
categorizar situaciones, mejores a la hora de aprender la estructura causal del mundo (qué conduce a qué)
y mejores a la hora de abstraer esta información. Una categorización más compleja del mundo conduciría
a una mejor capacidad para generalizar de una situación a otra y a una mejor capacidad para modificar lo
que funcionó en una situación para utilizarlo en otra.
Sin embargo, esto también proporciona una posible explicación para aquellas enfermedades y disfunciones
cognitivas que son exclusivamente humanas, como la paranoia y la estructura causal incorrecta que se
observan en los delirios esquizofrénicos74 :
nuestra capacidad para reconocer la complejidad del mundo
puede llevarnos a encontrar conspiraciones e interacciones que en realidad podrían no estar presentes.
En cierto sentido, el sistema de reconocimiento de situaciones está aprendiendo la estructura del
mundo. Aprende qué permanece constante en una situación dada y qué cambia. Aprende qué conduce
el mundo. A esto se lo ha denominado a veces conocimiento semántico , nuestro a qué hechos sobre
mundo, nuestro lugar en él, las historias que nos contamos a nosotros mismos. El conocimiento
semántico en los humanos incluye tanto la categorización de las características del mundo ( eso es una
silla, pero eso es una mesa ), hechos sobre el mundo ( esta mesa está hecha de madera ) y la estructura
narrativa en la que vivimos ( tengo que irme a casa para que mi familia pueda cenar junta esta noche ).
Este conocimiento semántico forma las entradas a nuestros sistemas de selección de acciones. Cambiar
ese conocimiento cambia la estructura causal que conduce a las expectativas ( un susurro en la maleza
león, predice una selección de acción pavloviana), las consecuencias esperadas de nuestras acciones

reaccionamos ( detener el ( demasiado , deliberativo) y el conjunto de situaciones en las que

alcohol te emborrachará en un semáforo en rojo , procedimental). Exploraremos este sistema y cómo
cambiarlo cambia nuestras decisiones en profundidad en el Capítulo 12.

Motivación

Por último, necesitamos un sistema de motivación, que incluye dos componentes importantes: primero,
¿cuáles son los objetivos que necesitamos alcanzar? (queremos tomar acciones diferentes si tenemos
hambre o si tenemos sed) y segundo, ¿qué tan duro debemos trabajar para alcanzar esos objetivos?
(La sed que tengamos se traducirá en la desesperación que tengamos por encontrar agua). Veremos que
ambas cuestiones están relacionadas con el concepto de valor que analizamos por primera vez en el
Capítulo 3.
Históricamente, estas cuestiones se han abordado mediante la reducción de los “impulsos” innatos. 76
Pero, ¿qué crea esos impulsos? Sin duda, existen algunas motivaciones para mantener nuestro equilibrio
homeostático interno, pero las personas a menudo comen cuando no tienen hambre. ¿Por qué?

yo
La homeostasis es el mantenimiento de un parámetro interno en un nivel determinado. Por ejemplo, los mamíferos son
animales de sangre caliente y tratan de mantener su temperatura en un nivel determinado. Cuando tenemos frío, temblamos,
nos abrigamos o buscamos fuentes de calor. Cuando tenemos calor, sudamos, jadeamos o buscamos charcas en las que nadar.
Machine Translated by Google

Sistemas de toma de decisiones múltiples 57

Para entender esto, es necesario tener en cuenta dos conceptos adicionales: primero, el de las funciones de
recompensa intrínsecas77 y segundo, el del papel del aprendizaje en los cálculos de valor. 78
Nuestro complejo sistema de toma de decisiones evolucionó porque los animales que tomaban mejores
decisiones eran más capaces de sobrevivir y encontrar mejores parejas, tenían más probabilidades de
procrear y de tener descendencia que sobreviviera a sí misma. 79 Pero no hay nada en este proceso que
requiera que las razones proximales para las decisiones estén relacionadas con cualquiera de estos
objetivos evolutivos. En cambio, lo que la evolución tiende a hacer es encontrar objetivos que están
correlacionados con estos factores. Por ejemplo, un animal que viviera en un entorno donde la comida era
escasa tendría menos probabilidades de morir de hambre y más probabilidades de sobrevivir si comiera
80
siempre que hubiera comida disponible, tuviera hambre o Pero ¿qué sucede cuando estos intrínsecos...
no. ¿Estos procesos ya no rastrean la supervivencia? ¿Qué sucedería con una especie que hubiera
evolucionado para comer siempre que hubiera comida disponible pero que ahora se enfrentara a una sobreabundancia
81
Engordaría y aparecerían nuevas enfermedades, como la diabetes.
Podemos ver ejemplos de cómo las funciones de recompensa intrínseca correlacionadas con el éxito
evolutivo pueden corromperse en muchos animales y en muchas situaciones. A los perros les encanta perseguir
animales grandes (por ejemplo, ciervos, alces, etc.). Lo hacen porque así es como obtienen su alimento.
Ese era su nicho evolutivo. Los perros domésticos persiguen coches. Está bastante claro que si un perro alguna
vez atrapara un coche, no podría comérselo. Pero persiguen coches por el mero placer de perseguirlos. En los
humanos, el ejemplo clásico es la pornografía. A los hombres les gusta mirar a mujeres bonitas porque sentirse
atraídos por una mujer hermosa los ayuda a juzgar quién sería la mejor pareja, pero leer Playboy o ver pornografía
imaginaren Internet no va a ayudar a los hombres a encontrar pareja, mejores parejas. De hecho, uno podría
fácilmente un argumento de que estas opciones no reproductivas perjudican la capacidad de encontrar mejores
parejas.
Así pues, sí, tenemos impulsos que están directamente relacionados con el éxito evolutivo (el hambre, la
sed, el sexo) y tenemos funciones de recompensa intrínsecas que están correlacionadas con el éxito evolutivo
(la persecución de una presa, la atracción por la belleza). Pero también hay un componente aprendido en la
motivación de los mamíferos. Este componente aprendido se puede ver tanto en aumentos (o disminuciones)
generalizados de la excitación como en aumentos o disminuciones específicos de la disposición a trabajar por
una recompensa determinada.
¿Se da también este componente de aprendizaje en los seres humanos? En realidad, se trata de uno de los
efectos mejor comprobados en los drogadictos: ver los accesorios de su droga preferida provoca un deseo
85
intenso de consumirla y un aumento de las acciones que conducen a su consumo.
Los símbolos de marketing (CocaCola, McDonald's) aumentan nuestras percepciones internas de sed o hambre
y hacen que sea más probable que la gente vaya a comprar un refresco o una hamburguesa. 86 Todos estos son
ejemplos del sistema motivacional que impulsa otros sistemas de acción.

M En la actualidad, existen pruebas bastante sólidas de que muchos (pero no todos) los estándares de belleza se correlacionan realmente con la salud y la

fertilidad (tanto para hombres como para mujeres). Por supuesto, este es solo otro ejemplo de una función de recompensa intrínseca: ciertas características (como

una proporción específica entre el pecho y la cintura y la cadera, la simetría de la cara) se correlacionan con la fertilidad, por lo que las personas se sienten atraídas

por esas características. 82 Estas características indican salud y fertilidad y llamamos "bellas" a las personas con esas características. Por supuesto, en los humanos,

tener hijos exitosos que logren tener sus propios hijos es mucho más complejo que la simple salud, 83 lo que puede explicar por qué los humanos encuentran a otros

humanos con inteligencia y talento (como los músicos) particularmente atractivos.

84
atractivo.
Machine Translated by Google

58 El sistema de toma de decisiones

La motivación es un fenómeno complejo relacionado con la complejidad de la evaluación. Depende de funciones

intrínsecas que hemos desarrollado como animales. 87;N La motivación también puede modificarse mediante una

interacción entre los sistemas pavlovianos emocionales y otros sistemas de toma de decisiones más complejos
(deliberativo, procedimental).

Resumen
La toma de decisiones conductuales se produce como consecuencia de una serie de sistemas diferentes que
interactúan entre sí. Hemos identificado cuatro sistemas de selección de acciones (reflejo, selección de acciones
pavloviana, deliberativo y procedimental) y cuatro sistemas de apoyo (realización de la acción física, percepción,
reconocimiento de la situación y motivación). Uno de los hechos notables que ha ocurrido en las últimas décadas es la
convergencia de diferentes campos en estos múltiples sistemas de toma de decisiones. Varios campos han estado
examinando cómo interactúan diferentes agentes entre sí y con el mundo (por ejemplo, la psicología y la psiquiatría
humanas, la teoría del aprendizaje animal, la robótica y la teoría del control, la inteligencia artificial y la neurociencia,
incluidos tanto el modelado computacional como los nuevos campos de la neuroeconomía y la psiquiatría
computacional). 91

Una de las cosas que me motivó a escribir este libro ha sido la observación de que estos diferentes campos
parecen estar convergiendo en una categorización similar de los sistemas de toma de decisiones. Incluso los debates
dentro de los campos son similares: por ejemplo, ¿el cálculo del valor dentro de los sistemas basados en búsquedas
(deliberativos) y de acciones almacenadas en caché (procedimentales) es independiente o unitario? 92 (He

argumentado aquí y en otros lugares que son independientes, pero la cuestión está lejos de estar resuelta).

Por ejemplo, los especialistas en robótica han llegado a la conclusión de que se necesitan múltiples niveles de
sistemas de toma de decisiones: sistemas rápidos, de bajo nivel y cableados (no chocar contra las paredes; un sistema
reflexivo), así como procesos de búsqueda más lentos (lentos pero flexibles; un sistema deliberativo) y procesos
rápidos de acción almacenada en caché (rápidos pero inflexibles; un sistema procedimental ). 93
Los científicos informáticos que estudian la inteligencia artificial y los neurocientíficos computacionales que
intentan modelar la toma de decisiones animal han identificado estos sistemas en términos de sus expectativas: los
sistemas pavlovianos crean una expectativa de un resultado y conducen a acciones incondicionadas relacionadas con
ese resultado; los sistemas deliberativos buscan entre futuros potenciales, producen una expectativa del resultado y la
evalúan; los sistemas procedimentales
Los sistemas evalúan directamente las acciones en respuesta a situaciones específicas. 94
De manera similar, los teóricos del aprendizaje que trabajan en los campos de la psicología y el aprendizaje animal
95
Identificar tres sistemas. En primer lugar, existe un sistema de estímuloresultado en el que las reacciones
incondicionadas asociadas con los resultados pasan de ser realizadas en respuesta al resultado a ser realizadas en
respuesta al estímulo (pensemos en los perros de Pavlov que salivan en respuesta a una señal que predice una
recompensa de comida). En segundo lugar, identifican un sistema de acciónresultado en el que los animales aprenden
qué resultados se producirán si realizan una acción determinada. Estas acciones se realizan para lograr ese resultado
esperado. En tercer lugar,

norte
Una de las cosas que veremos al final de este libro (capítulos 22 al 24) es evidencia de que parte
88
La moralidad humana surge porque somos criaturas sociales que hemos evolucionado para vivir en grandes
sociedades, con funciones de motivación intrínsecas basadas en imponer la cooperación.
89 Como decía Aristóteles, “somos animales políticos”. 90
Machine Translated by Google

Sistemas de toma de decisiones múltiples 59

Identificar un sistema de estímulorespuesta o de estímuloacción en el que se toman acciones

en respuesta a un estímulo. El segundo y tercer sistema pueden diferenciarse mediante
experimentos de revaluación y devaluación, en los que el valor del resultado se modifica en línea.
(Recuerde nuestro ejemplo de la rata que decide si empuja o no la palanca para obtener
comida que ya no le gusta).
¿Y dónde nos deja todo esto? Hemos identificado cuatro sistemas de selección de
acciones y cuatro sistemas de apoyo. Aunque estos sistemas son separables, ya que en
cada uno de ellos intervienen diferentes estructuras cerebrales, también deben interactuar
para producir la conducta (la analogía que hemos planteado antes es la de los sistemas
eléctrico y de gasolina de un coche híbrido). Cada uno de estos sistemas es un cálculo
complejo por sí mismo y requerirá su propio capítulo para su tratamiento completo. En el resto
de esta parte del libro, exploraremos cada uno de estos componentes, los cálculos que
realizan y sus sustratos neuronales, y comenzaremos a notar los posibles puntos de fallo en
ellos. Empecemos por el sistema de selección de acciones más sencillo, el reflejo.

Libros y artículos para lectura adicional •

Matt hijs AA van der Meer, Zeb KurthNelson y A. David Redish (2012)
Procesamiento de información en sistemas de toma de decisiones. El neurocientífico, 18,
342–359 .
• Yael Niv, Daphna Joel y Peter Dayan (2006) Una perspectiva normativa sobre la motivación
ción . Tendencias en Ciencias Cognitivas, 10, 375–381 .
• Mortimer Mishkin y Tim Appenzeller (1987) La anatomía de la memoria. Scientific 256
Americano, (junio), 80–89.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Reflejos

La geografía de la concha
recuerda la natación, la lenta
expansión y contracción de los siglos, el recuerdo de una orilla
lejana, ahora sólo mar abierto.

Un reflejo es un sistema de toma de decisiones porque incluye la realización de

una acción. Un reflejo implica una respuesta simple a un estímulo basada en
una regla aprendida a lo largo de escalas de tiempo evolutivas prolongadas.
Aunque los reflejos pueden cambiar a lo largo de una vida, esos cambios
están predeterminados genéticamente (como los animales que cambian de
niños a adultos) o implican solo procesos de aprendizaje muy simples (limitados
principalmente a efectos de habituación y adaptación).

El reflejo es el sistema de toma de decisiones más simple. Implica una reacción simple basada en reglas.
En cierto sentido, el termostato es un reflejo. Cuando hace demasiado calor, el termostato enciende el aire
acondicionado; cuando hace demasiado frío, el termostato enciende la calefacción. En los animales, una regla
refleja está preprogramada en el agente, presumiblemente genéticamente. Esto significa que podemos imaginar
la regla como algo aprendido a lo largo de escalas de tiempo evolutivas. Los animales que tenían respuestas
apropiadas (retirar la mano de un estímulo doloroso que quemaba) tenían más probabilidades de sobrevivir y
de tener hijos que sobrevivieran. Pero fundamentalmente, la clave de un reflejo es la simplicidad de la regla y
1
su naturaleza preprogramada.
Las ventajas de un reflejo son (1) que puede responder muy rápidamente y (2) debido a que se ha aprendido
a lo largo de la evolución, está presente desde el principio en un animal y el animal puede reaccionar
correctamente la primera vez que encuentra el estímulo. No tienes que aprender a apartar la mano de una
estufa caliente. (Realmente deberías aprender a no tocar la estufa caliente en primer lugar. Pero ese es un
sistema diferente.)
Los reflejos son cosas simples: las neuronas sensoriales reconocen el estímulo y estas neuronas se
conectan, ya sea directamente o a través de una o más neuronas intermedias, con las neuronas que toman
acción y que impulsan los músculos. 2 En los vertebrados, esto generalmente ocurre en la médula espinal
porque cuanto más rápido pueda actuar el sistema, mejor será el reflejo evolutivamente. Recuerde, los reflejos
responden a estímulos ya presentes. Es decir, su

61
Machine Translated by Google

62 El sistema de toma de decisiones

La mano se está quemando. Cuanto más espere, más daño se le está haciendo a sus tejidos. Tener las neuronas que
responden lo más cerca posible del estímulo permite que el sistema reaccione rápidamente. Llevar el mensaje hasta el
cerebro lleva tiempo.
Las fibras nerviosas mielinizadas transportan potenciales de acción a una velocidad de 150 metros por segundo .

Dado que la distancia entre tu mano y tu cabeza es de aproximadamente un metro, el viaje de tu mano a tu cabeza y

viceversa podría tomar 14 milisegundos. Dado que tus dedos se están quemando, son 14 milisegundos que no tienes.
(Imagina cuánto tiempo tardaría una señal en ir desde el pie hasta el cerebro de una jirafa o desde la cola hasta la
cabeza de una ballena azul). Las respuestas reflejas, por lo tanto, tienden a estar ubicadas en la médula espinal, que
está más cerca
A la acción.

Los reflejos pueden ser simples conexiones entre una neurona sensorial y una neurona motora, o
incluso entre una neurona sensorial y el propio músculo, pero en la práctica la mayoría de los reflejos
tienen neuronas intermedias entre la neurona sensorial y la neurona motora.
4
Una pregunta interesante es por qué
a menudo hay una etapa intermedia dentro del reflejo, dado que el tiempo entre la detección y la respuesta es tan
valioso. La presencia de neuronas intermedias proporciona etapas adicionales en las que los sistemas de toma de

decisiones superiores y más complejos pueden intervenir para cambiar las respuestas.
5 Así es como podemos evitar que los reflejos actúen si así lo deseamos.
Pensemos, por ejemplo, en aquella escena de Lawrence de Arabia de la que hablamos en el capítulo 6.

Normalmente, Lawrence respondería arrojando reflexivamente la cerilla o sacudiéndola cuando la llama llega a sus
dedos, pero con su voluntad indomable, Lawrence se niega a dejar que sus reflejos reaccionen y mantiene la cerilla
firme. La presencia de neuronas intermedias permite más controles para que los otros sistemas manipulen, pero también
aumenta el tiempo que tarda la decisión en pasar del sensor a la acción. Algunos reflejos no incluyen neuronas

intermedias, mientras que otros tienen varias etapas de neuronas intermedias.

Ejemplos clásicos de reflejos son los reflejos de huida, como los sensores de viento en los insectos y las neuronas
oculomotoras de giro cruzado (visual [oculo] a motora) en los peces de colores. 7
Los insectos como los grillos y las cucarachas tienen un conjunto de pelos muy
pequeños en las antenas de sus colas. Cada pelo puede ser arrastrado por el viento, pero solo
puede moverse en una única dirección, de ida y vuelta. Esto significa que la cantidad de movimiento
del pelo depende de la dirección del viento: el viento que está alineado con el pelo lo moverá más;
el viento que está desviado 90 grados lo moverá menos. Estos pelos (sensores del viento) se
proyectan a cuatro interneuronas que representan las cuatro direcciones cardinales (adelante,
atrás, izquierda, derecha). Estas interneuronas se proyectan a las estructuras de control de los
músculos de las patas y hacen que el animal se aleje de ese viento. ¿Por qué el insecto tiene este
reflejo de respuesta al viento altamente evolucionado? Porque puede huir de un zapato que lo
pisotea en menos de 20 milisegundos.
Existe un sistema similar en los peces de colores que conecta el reconocimiento de señales visuales de un lado con
un giro repentino hacia el otro. Un pez de colores puede identificar que hay una señal inminente (como un depredador
que se come a un pez de colores, como un ave que se zambulle) y comenzar a alejarse en menos de 20 milisegundos.
Los peces de colores pueden alcanzar velocidades de 22 longitudes corporales por segundo en menos de 20 milisegundos.

A
Las neuronas comunican información enviando picos o potenciales de acción a lo largo de sus axones de
salida. Una fibra nerviosa (como las que conectan la médula espinal con el cerebro) es simplemente un conjunto de
axones alineados en la misma dirección. La velocidad de desplazamiento de estos potenciales de acción a lo largo
de una fibra nerviosa depende de varias propiedades, entre ellas, si los axones están o no rodeados de mielina, una
forma de células gliales “auxiliares”. 3
Machine Translated by Google

Reflejos 63

Aproximadamente 10 milisegundos desde el inicio del movimiento. ¡Eso es increíblemente rápido! Es de suponer
que este notable reflejo evolucionó porque el pez dorado y el pájaro que se zambulle están en una carrera
armamentista para ver quién es el más rápido, el pájaro hambriento o el pez dorado que huye.
Los reflejos pueden cambiar y, por supuesto, cambian a lo largo de una vida (los animales tienen ciclos vitales;
los renacuajos y las ranas probablemente necesitan reflejos muy diferentes para sobrevivir en los entornos muy
diferentes en los que habitan), pero estos cambios están preprogramados en el desarrollo. Los bebés humanos, por
ejemplo, tienen un reflejo en el pie llamado reflejo de Babinski, en el que los dedos se curvan y se abren siguiendo
un patrón específico en respuesta a las caricias en la planta del pie. El reflejo es completamente normal (y se utiliza
para comprobar la integridad de la médula espinal) en los bebés. Con el desarrollo del tracto corticoespinal (las
conexiones de la corteza cerebral a la médula espinal), el reflejo desaparece. En los adultos, un reflejo de Babinski
indica daño en la médula espinal, desacoplando la información cortical de la base de la médula espinal. 8

El problema de los reflejos es su inflexibilidad. Los reflejos se aprenden en una escala temporal evolutiva; están
preprogramados genéticamente en la criatura. Aunque los reflejos cambian en respuesta a estímulos repetidos, los
mecanismos de estos cambios no son particularmente complejos y los cambios potenciales son muy limitados.
Estos efectos han sido estudiados en detalle de manera más famosa en el reflejo de retracción branquial de la aplysia.
9 Una aplysia es una
especie de babosa marina, con una branquia ancha y delgada que flota en su espalda. (Imagínese un caracol sin
concha y un par de abanicos de seda). Utiliza esta branquia para respirar oxígeno fuera del agua. Pero, por supuesto,
esta branquia es frágil y se daña fácilmente. Imaginemos a la aplysia en el agua: las olas se intensifican y la aplysia
retrae su branquia. Pero si las olas van a ser grandes durante mucho tiempo y no empeorar, entonces necesita
abrirse de nuevo. La aplysia puede aprender a ignorar un estímulo repetido (es decir, puede habituarse). Sin
embargo, incluso estos cambios potenciales están preprogramados.
Por ejemplo, el reflejo de retracción branquial en la aplisia puede aumentar su respuesta a ciertos estímulos (es
decir, puede sensibilizar), pero estos cambios se deben a conexiones preestablecidas entre neuronas específicas.

Incluso reacciones simples preprogramadas y cambios potenciales pueden producir un comportamiento

extremadamente complejo si los cambios interactúan con el entorno de manera apropiada. Ejemplos de la complejidad
que se puede generar a partir de circuitos simples sin memoria ni representación explícita se pueden encontrar en
el delicioso libro Vehicles de Valentino Braitenberg . Sin embargo, esta inflexibilidad significa que en el juego
competitivo de la evolución, los reflejos pueden llevar a un animal sólo hasta cierto punto.

Si bien la evolución puede hacer que las poblaciones cambien con bastante rapidez (en el orden de un par de
generaciones), los reflejos B no se aprenden en una sola vida. 11 Para aprender a responder de manera diferente a
diferentes situaciones, es necesario recurrir a uno de los otros sistemas de toma de decisiones.

B
Un ejemplo maravilloso de la velocidad del cambio evolutivo que mueve los fenotipos dentro de las poblaciones
son las polillas blancas y negras que cambiaron su distribución en respuesta al smog en la Inglaterra industrial, donde
una población de polillas moteadas cambió de ser mayoritariamente blanca a mayoritariamente oscura cuando la
contaminación del carbón oscureció los cielos y los árboles de Inglaterra a fines del siglo XIX, y luego cambió de ser
mayoritariamente oscura a volver a ser mayoritariamente blanca cuando se controló la contaminación. 10 Se pueden ver
ejemplos más detallados de cuán rápidamente la evolución puede cambiar las poblaciones en los estudios de Rosemary
y Peter Grant que midieron la forma y la longitud de los picos de los pinzones en las Islas Galápagos. Los estudios de
pinzones de los Grant se describen en detalle en The Beak of the Finch de Jonathan Wiener .
Machine Translated by Google

64 El sistema de toma de decisiones

Libros y artículos para lectura adicional

Debido a que el reflejo se entiende tan bien, está bien descrito en muchos libros de texto médicos y de
neurociencia, como

• Dale Purves et al. (2008) Neurociencia . Sunderland, MA: Sinauer Associates.

Una revisión exhaustiva de los notables reflejos de escape se puede encontrar en

• Robert C. Eaton (1984) Mecanismos neuronales del comportamiento de sobresalto Nueva York: Springer
Editorial.

Un libro encantador que muestra cuán complejas pueden ser las reacciones preprogramadas es

• Valentino Braitenberg (1986) Vehículos: experimentos en psicología sintética

Cambridge, MA: MIT Press .
Machine Translated by Google

La emoción y el pavloviano
Sistema de selección de acciones

Mira con tus ojos hasta

que sean manos, manos
que sienten, manos
que sostienen otras manos.
Manos que tocan el corazón

El sistema de selección de acciones pavloviano consiste en conjuntos de respuestas

que evolucionaron para prepararse para comportamientos críticos específicos de la

especie, como alimentarse, pelear o aparearse. El aprendizaje en el sistema de

selección de acciones pavloviano implica el reconocimiento de que una cosa
probablemente cause otra, lo que lleva a tomar el conjunto de respuestas apropiado
para ese resultado esperado. Lingüísticamente, categorizamos estos conjuntos de
respuestas y los identificamos como emociones. En los humanos, muchos de estos
conjuntos de respuestas son importantes para las interacciones sociales.

Aunque no se suele pensar en ellas en términos de selección de acciones, las emociones son un mecanismo de selección
de acciones. 1
Cada emoción es un conjunto de respuestas que se han aprendido a lo largo

de escalas de tiempo genéticas para que sean útiles. Por ejemplo, en situaciones peligrosas, dependiendo de las
caracterizaciones emocionales de la situación, uno se asusta y su cuerpo se prepara para huir, para ponerse de pie y

luchar, o para someterse, a veces denominada respuesta de lucha o huida (o más exactamente, respuesta de lucha
huidaparálisis).
Existe un debate en la comunidad científica sobre si la categorización
2
El proceso de transformación de lo que conscientemente etiquetamos como emociones es consistente entre individuos.
Estas preguntas se centran más en la cuestión de las etiquetas que damos conscientemente a las emociones que en el

efecto físico de esas emociones: nadie niega que la ira nos prepara para luchar, pero otras emociones (como el miedo)
también nos preparan para ello. Aunque una situación determinada puede hacer que una persona se enfade y otra sienta
miedo, los animales (incluidos los humanos) tienen conjuntos de respuestas coherentes ante situaciones coherentes.
Volveremos a la relación entre estos conjuntos de respuestas y las emociones más adelante en este capítulo.

65
Machine Translated by Google

66 El sistema de toma de decisiones

La ventaja de tener un sistema con estos conjuntos de respuestas es que hay un complejo de
acciones internas relacionadas con el cuerpo que deben funcionar correctamente la primera vez. No
tienes la oportunidad de aprender a huir del león. Puedes aprender que un susurro en la hierba
probablemente significa que un león te está acechando. Y así puedes aprender a huir del susurro en la
hierba. De hecho, puedes aprender que un susurro en la hierba significa que un león te está acechando
incluso sin ser acechado. Puedes aprenderlo observando a un león acechando a otro animal, o puedes
aprenderlo escuchando una historia vívida junto al fuego, o de alguna otra manera. En cualquier caso,
lo que realmente has aprendido es que los leones que acechan a sus presas producen un susurro en
la hierba. Entonces, cuando escuchas el susurro, te das cuenta de que hay un león, y tienes la misma
respuesta emocional que si un león apareciera de repente frente a ti.
Lo que se necesita es un sistema que pueda reconocer el peligro e implementar todos los cambios
corporales rápidamente, de una sola vez. Ese sistema es el sistema de selección de acciones
pavloviano, en el que una acción aprendida genéticamente ocurre en respuesta a una situación dada
basada en una caracterización emocional de la misma ( me gusta, me acercaré a ella. Tengo miedo de
ella, huiré de ella. Estoy enojado con ella, la atacaré. No tengo adónde correr, me congelaré de miedo
y espero que no me mate ). 3
En los experimentos de psicología clásica, el aprendizaje pavloviano se describe como lo que se
aprende cuando el animal no tiene que realizar una acción para obtener el resultado.
En la práctica, el animal hace algo para prepararse para el resultado esperado: el perro saliva, la rata
se congela .
5—

En un tiempo se suponía que el animal estaba aprendiendo que las señales se dan simultáneamente;
sin embargo, ahora sabemos que el condicionamiento pavloviano implica el reconocimiento de contingencias
informativas: los animales aprenden que cuando hay una señal, es más probable que sucedan ciertas
cosas. Una señal omnipresente no es informativa. 6 Los animales pueden incluso aprender que ciertas
señales predicen que un evento no ocurrirá. Como muestra el ejemplo del león al comienzo de este
capítulo, estamos aprendiendo que una señal predice un resultado. (La campana de Pavlov también
funcionaba de esta manera: se hacía sonar la campana y luego se alimentaba al perro). Dicho de esta
manera, la parte de aprendizaje de la selección de acción pavloviana es que un estímulo (el susurro en la
hierba, el sonido de una campana) predice un resultado (un león te está acechando, la comida está
llegando). A partir de esa predicción, puedes tomar la acción apropiada (¡corre!, saliva).
Cuando se estudia en experimentos de psicología clásica, la parte de selección de acción del sistema de
selección de acción pavloviano a menudo se considera como respuestas conductuales específicas de la
y respuestas de aproximación o evitación, especie7 , pero los cambios más grandes son, de hecho, somáticos.
cambios en el propio cuerpo. 8 En respuesta al miedo, por ejemplo, aumenta la frecuencia cardíaca (al
igual que la fuerza de cada latido) para hacer llegar más sangre a los músculos, las vías respiratorias de los
pulmones se dilatan para permitir la entrada de más oxígeno y se producen una serie de otras respuestas que
preparan al animal para luchar o huir. La atención aumenta, lo que aumenta la capacidad de percibir estímulos.
Una de las mejores maneras de medir el miedo de un animal es medir las respuestas de sobresalto
en una situación dada. Un sonido sorprendente literalmente hace que el animal salte; en condiciones
de mayor anticipación al peligro (miedo), el animal saltará más alto. Al medir la fuerza de los músculos
cuando el animal salta, se puede medir cuantitativamente su preparación para la acción y su miedo. 9

Por supuesto, también se observan los mismos efectos en los seres humanos. Una vez, cuando
estaba montando mi laboratorio, me preocupaba si podría conectar de forma segura un componente
de computadora muy caro sin apagar el ordenador primero. (El ordenador estaba en proceso de
Machine Translated by Google

Emoción y selección de acción pavloviana 67

(Estaba realizando un cálculo muy largo y no quería interrumpirlo, pero necesitaba acceder a esa parte).
La noche anterior, una nueva unidad Zip (una especie de unidad portátil especializada antes de que
existieran las unidades flash USB) se había incendiado y quemado en mi casa (con hermosas chispas
azules), por lo que estaba razonablemente nervioso por conectar esta parte tan cara. Expresé mi
preocupación al laboratorio y decidí que debería ser yo quien la conectara para que, si algo salía mal,
fuera culpa mía. Mientras esperaba nerviosamente para conectar la parte, sin que yo lo supiera, uno de
mis estudiantes de posgrado se había acercado sigilosamente por detrás de mí. En el instante en que
conecté la parte, mi estudiante susurró "¡bzzzzt!" en mi oído.
Debí haber saltado un metro en el aire.
Otro efecto relacionado en los seres humanos es que tendemos a sudar cuando estamos
emocionalmente excitados. 10 Como el sudor es básicamente agua salada, conduce la electricidad, y
esto se puede medir por un aumento de la conductancia de la piel. Incluso los cambios muy sutiles se
pueden detectar como un cambio en la conductividad de la piel. Estos cambios se conocen como la
respuesta galvánica de la piel (GSR) o la respuesta de la conductancia de la piel (SCR) y son una medida
sorprendentemente confiable de la excitación emocional.
A
Neurofisiológicamente, estas respuestas están controladas por pequeños haces de neuronas en la
base del cerebro, llamado hipotálamo, B y por estructuras en la parte superior de la
D
médula espinal, particularmente la capa gris periacueductal
C y la amígdala.
Estas estructuras cerebrales interactúan con el resto del cuerpo a través de un circuito de
retroalimentación entre el hipotálamo en el cerebro y los órganos del cuerpo a través de las hormonas
que circulan en la sangre. El hipotálamo envía información a (y recibe señales de) una estructura llamada
glándula pituitaria, que es un conjunto de glándulas liberadoras de hormonas y
12
células detectoras de hormonas que traducen señales neuronales hacia y desde señales hormonales.
Esta vía desde el cerebro hasta el cuerpo es en realidad un circuito completo que incluye señales
de las hormonas al resto del cerebro también. Las neuronas del cerebro son células y, por lo tanto,
requieren nutrientes, que obtienen de la sangre. Estas hormonas (como la adrenalina,

A Estos pequeños haces se les llama “núcleos”, que no deben confundirse con el núcleo de la célula. La palabra
núcleo (del latín “grano” o “nuez”) simplemente significa una concentración central. En un átomo, el núcleo (de donde
obtenemos “bombas nucleares” y “física nuclear”) es la concentración central de partículas. En una célula, un núcleo es
el depósito central del ADN. Y en el cerebro, un núcleo es una concentración de células que forma un objeto separable
e identificable anatómicamente.
B
Hipo (abajo) + tálamo (otra parte del cerebro).
do
Una pequeña estructura de materia gris (cuerpos celulares neuronales) que rodea una bolsa de líquido
cefalorraquídeo en la base del cerebro ( periacueductal , cerca del acueducto). La sustancia gris periacueductal se
encuentra en el camino del tracto espinotalámico, donde las células de la médula espinal envían información hacia el
tálamo y las células talámicas envían información de regreso hacia la médula espinal.
D
Un pequeño núcleo (kernel) de células ubicado entre la corteza orbitofrontal y la estría ventral.
Tum, con forma de almendra. Amygdala es la palabra latina para almendra.
mi
En realidad, el cerebro de los mamíferos tiene una etapa intermedia entre la sangre y el cerebro, formada por una
especie de células gliales que filtran las sustancias químicas de la sangre, de modo que sólo determinadas sustancias
químicas pueden pasar de la sangre al cerebro. Los capilares están rodeados por paredes muy herméticas formadas
por estas células gliales para impedir que pasen cosas grandes (¡como las bacterias!). En los libros de texto de medicina,
esto se denomina barrera hematoencefálica y es una de las razones por las que ciertos fármacos afectan principalmente
al cuerpo, mientras que otros lo hacen principalmente al cerebro. Muchas de las hormonas de las que estamos hablando
sí se traducen a través de la barrera hematoencefálica, pero otras no. La barrera hematoencefálica es más débil en las
partes del cerebro donde viven estas estructuras liberadoras y detectoras de hormonas (como la pituitaria) y en las
zonas donde las señales químicas externas necesitan llegar al cerebro (como los sensores olfativos de la nariz).
Machine Translated by Google

68 El sistema de toma de decisiones

La testosterona, el estrógeno y los glucocorticoides pueden afectar drásticamente la función neuronal e

incluso las estructuras neuronales.
13 El cerebro está estrechamente conectado al resto del cuerpo a través de
Estas interacciones neuronaleshormonales.

Curiosamente, una de estas glándulas liberadoras de hormonas que conectan el cerebro con el
cuerpo es la glándula pineal, que era la estructura cerebral específica que el filósofo René Descartes
(15961650) identificó como la conexión entre el cuerpo y el alma. 14 Descartes sostuvo que los animales
eran máquinas, pero los humanos no, porque los humanos tienen alma. Descartes sostuvo que la

conexión entre el cuerpo y el alma se encontraba en la glándula pineal. Esta hipótesis (que el alma y el
cuerpo son cosas diferentes) se llama dualismo y generalmente se expresa en la era moderna en
términos de una hipótesis
, de que la mente y el cuerpo son cosas diferentes. Por supuesto, como todo el
que ha estudiado anatomía sabe (incluido Descartes, que fue un anatomista excepcional, muy familiarizado
con ambas 15 ), todos los mamíferos tienen glándulas pineales. Anatomía humana y no humana Esta
16 Regresaremos a
cuando abordamos directamente las discusión se presenta al final del libro,
filosofías dualistas y materialistas.

Un lector atento puede preguntarse en este punto de nuestra discusión sobre la “emoción”, ¿dónde
está exactamente la emoción ? La ira, los celos, la lujuria, el miedo, la felicidad, la tristeza: son
sentimientos ; son más que la respuesta de un cuerpo a los estímulos. Las emociones son más que la
respuesta de lucha o huida. La respuesta está en el hecho de que también hemos desarrollado un
mecanismo para monitorear estas respuestas corporales, y tenemos un mecanismo para categorizarlas.
17

emociones eran F (1842–1910) y Carl Lange (1834–1900) fueron los primeros en proponer que las
18
una conexión entre la mente y el cuerpo. Cuando nos enojamos, Todo el mundo sabe que cuando
nuestro ritmo cardíaco aumenta y nuestros capilares se dilatan para permitir que llegue más sangre a
nuestros músculos, lo que nos hace sonrojar y, de hecho, calienta nuestra piel. Como señalaron George
Lakoff y Mark Johnson en su análisis de los idiomas, las metáforas que utilizamos para describir las
19
emociones reflejan los cambios corporales reales que ocurren durante esas emociones.
Como se mencionó cuando presenté el sistema de reconocimiento de situaciones (Capítulo 6),
sospecho que la corteza es una gran máquina de categorización. (En el Apéndice C se puede encontrar
una discusión computacional de los mecanismos de categorización. Como se discute allí, la interacción
entre estos procesos de categorización y la realidad produce categorías que a menudo son similares pero
que pueden divergir entre individuos. El hecho de que no todos estén de acuerdo en los límites específicos
de estas categorías no implica que no exista un conjunto de respuestas basadas en especies que se
categoricen de manera similar entre individuos). Si aplicáramos esta maquinaria de categorización a
nuestro sistema sensorial visceral interno ( ¿Qué tan rápido late tu corazón? ), categorizaríamos estas
respuestas pavlovianas. Diferentes partes de la corteza reciben diferentes entradas y categorizan
diferentes aspectos: la corteza visual procesa la entrada visual porque recibe entrada de la retina (a
través del tálamo); La corteza auditiva procesa la información auditiva porque recibe información de la
cóclea (de nuevo a través del tálamo y otras estructuras). ¿Existe una zona cortical que reciba información
del hipotálamo, que pueda reconocer estos estados internos, algo que reciba información visceral?

F William James es el hermano mayor del novelista Henry James, quien, hay que decirlo, estaba muy
familiarizado con las emociones.
Machine Translated by Google

Emoción y selección de acción pavloviana 69

, a veces
GRAMO

Anatómicamente, esa parte del cerebro es la corteza prefrontal ventromedial ,

conocida como corteza orbitofrontal , pero que también incluye la ínsula . Estas neuronas reciben
información del cuerpo para representar y controlar los estados corporales emocionales, un
proceso conocido como interocepción
Esta .localización del procesamiento emocional se descubrió inicialmente

estudiando pacientes que tenían la corteza prefrontal dañada. 22 Estas cortezas

prefrontales ventrales tienen la conectividad anatómica necesaria, se sabe que están activas durante la toma de decisiones

(como lo demuestra la fMRI) y juegan un papel importante en la toma de decisiones (como lo demuestran los estudios de

lesiones). 23

El más famoso de estos pacientes fue Phineas Gage, un trabajador del ferrocarril que en
1848 recibió una explosión de hierro fundido (una barra de hierro fundido de 13 libras, 3 pies de
largo y 1,25 pulgadas de diámetro) en el cráneo. Su trabajo era apisonar (comprimir) la pólvora
explosiva antes de que estallara. Desafortunadamente, el proceso de apisonar la pólvora explotó
y la barra de hierro atravesó su cráneo. Sorprendentemente, Gage sobrevivió; aún más
24
sorprendente, se recuperó de sus heridas y vivió una docena deGage
años tenía
más.deficiencias
sorprendentemente específicas, aunque complejas, a causa de sus heridas: sus capacidades físicas
y sensoriales, sus capacidades lingüísticas e intelectuales, su capacidad para percibir el mundo, su
memoria y su capacidad para actuar estaban intactas. Sin embargo, lo que cambió fue su
personalidad y su capacidad para tomar decisiones. La reconstrucción del recorrido de la barra de
hierro a través de un cerebro del mismo tamaño que el de Phineas Gage sugiere una destrucción
completa de la parte prefrontal del cerebro, incluidas las partes ventral y dorsal. La corteza prefrontal
dorsal parece estar involucrada en la capacidad de planificar, mientras que la corteza prefrontal
ventral parece estar involucrada en la capacidad deestuvieran
Si ambos reconocer emociones.
dañados, la capacidad de Gage para tomar

decisiones, particularmente las inteligentes, se habría visto gravemente comprometida.

La literatura ha descrito a menudo la diferencia entre humanos y robots como emocional: los
humanos tienen emociones, los robots no. Desde Data, de Star Trek , que pasa su vida deseando
tener las interacciones emocionales que tienen sus colegas, hasta los replicantes de Blade Runner,
de Ridley Scott (y en el libro de referencia original de Phillip K. Dick, ¿Sueñan los androides ?, que
of Electric Sheep? es un título mucho mejor), que son identificables a través de su Dream
( ¿Sueñan los androides con ovejas eléctricas?), la literatura ha identificado a los no emocionales
como "robóticos". De hecho, en Blade Runner / ¿Sueñan los androides con ovejas eléctricas?, los
replicantes solo son identificables por el hecho de que cuando miran imágenes emocionales, sus ojos no se dila
, Antonio Damasio sigue la descripción de Phineas Gage con la descripción
En El error de Descartes,

de un paciente moderno (al que se hace referencia como “Elliot”) con daño conocido en la corteza
prefrontal ventral (confirmado por resonancia magnética estructural), J que tiene un déficit específico en

Ventro (hacia la base) + medial (hacia el medio) + prefrontal (delante del frente). Estas estructuras se denominan
GRAMO

“pre”frontales porque otros anatomistas ya habían denominado “frontales” a partes del cerebro de animales no humanos,
y los anatomistas que estudiaban el cerebro humano querían identificar un área que fuera incluso más frontal que los
cerebros de otros primates. El grado en que los mamíferos no humanos, como los monos y las ratas, tienen corteza
“pre”frontal es un tema de mucho debate. 20
H Orbito (cerca de los ojos, de la palabra órbita , que significa el hueso circular alrededor de los ojos) + frontal .
La ínsula, de la palabra latina que significa “isla”, porque se encuentra en lo profundo de los pliegues de la corteza humana.

La resonancia magnética estructural utiliza una tecnología similar a la más conocida resonancia magnética funcional
(fMRI) para medir el tamaño de la materia gris (cuerpos neuronales) y la materia blanca (cableado neuronal, principalmente
axones y estructuras de soporte glial [mielina]) en el cerebro. Debido a que estas áreas no cambian, es posible obtener
26
imágenes muy precisas de la estructura de un cerebro con la resonancia magnética estructural.
Machine Translated by Google

70 El sistema de toma de decisiones

Emoción. Al igual que los replicantes de Blade Runner,, este paciente era ciego a las emociones: incapaz
de procesar los sentimientos, reconocerlos o mostrarlos. En situaciones en las que las emociones son
casi inevitables, Elliot no mostraba ninguna reacción. Damasio cuantificó esto midiendo la conductancia
de la piel y descubrió que la conductancia de la piel de Elliot era completamente plana.

¿Cómo se relaciona la emoción con la toma de decisiones?

Históricamente, los filósofos han sugerido que existen dos sistemas de toma de decisiones:
un sistema de toma de decisiones emocional (caliente) y un sistema cognitivo (frío). Esta
hipótesis se remonta a Platón, quien describió al ser humano como un auriga que conduce
dos caballos, uno de ellos bien educado y que siempre hace lo correcto, y el otro salvaje y
difícil de controlar. 27;K San Agustín describe dos almas, una que vive en la Ciudad del
Hombre, conectada con los animales, llena de emoción, lujuria e ira, y la otra en la Ciudad
de Dios, separada de los animales, llena de razón y deliberación. 29 (La dicotomía inherente
de esto está encarnada en la maravillosa línea de las Confesiones de Agustín : 30 )
«Hazme casto, Señor, pero no hoy».
La teoría de Freud sobre el inconsciente sigue esta misma dicotomía. Freud propuso que
había tres componentes: el ello , el yo ,y el superyó. 31 Esto sigue los tres seres de Platón
en el carro: el caballo salvaje que necesita ser controlado (el ello), el caballo angelical que
intenta llevarnos a la razón (el superyó) y el auriga atrapado en el medio (el yo). Gran parte
yo
de la psiquiatría moderna todavía permanece dentro de esta hipótesis del sistema dual,
basada en gran parte en conceptos freudianos del inconsciente. Por supuesto, como hemos
visto, es fundamentalmente errónea. No estás separado de tu yo emocional, ni eres un
auriga que conduce a otros dos tomadores de decisiones; eres la suma de todos tus sistemas
de toma de decisiones.
Las teorías modernas de doble proceso abogan por una separación entre un sistema
inconsciente, impulsivo (dionisíaco) y un sistema consciente, de función ejecutiva (apolíneo).
tema.32 La analogía típica que se presenta es la de un caballo y su jinete, aunque algunos

autores se refieren a esto como un elefante y su jinete. En esta analogía, usted es el jinete
que intenta dirigir al caballo (o al elefante), pero el caballo (elefante) tiene mente propia y a
veces sigue su propio camino.
La traducción de estas teorías de doble proceso a nuestros cuatro sistemas de selección de
acciones sugiere que el ser consciente que eres es el sistema deliberativo, mientras que los sistemas
reflexivo, pavloviano y procedimental son no conscientes. Incluso si asumimos que existen múltiples
sistemas no conscientes, esta teoría de múltiples procesos sugiere que el yo consciente lucha por
controlar los otros sistemas. Esta es la diferenciación entre el sistema no cognitivo y el sistema de selección de acci

Este es un gran ejemplo de la falacia del homúnculo, en la que quien toma las decisiones es visto como una
28 El problema, como
pequeña persona (un “homúnculo”) que controla un cuerpo o sistema de toma de decisiones separado.
señaló Daniel Dennett en la década de 1980, es que alguien tendrá que explicar qué controla ese impulsor, lo que dará
lugar a una regresión infinita. Uno de los puntos de este libro es que usted es su cerebro.
No existe un homúnculo conductor separado; ustedes son todos estos sistemas de toma de decisiones, interactuando entre sí.

El hecho de que siempre se haga referencia a esto como una hipótesis de “sistema dual” enfatiza el peligro de la
Falacia del homúnculo: las teorías de sistema dual olvidan que los dos caballos de Platón requieren un conductor.
Machine Translated by Google

Emoción y selección de acción pavloviana 71

El otro (inconsciente) y el yo cognitivo (consciente) requieren que eliminemos las emociones de nosotros
mismos y las coloquemos en la caja del “otro”. No sé qué piensen ustedes, pero yo siempre he sentido
(¡una palabra emocional!) que mis emociones son una parte fundamental de quién soy.
Separar el “yo” cognitivo y el “otro” no cognitivo también requiere que separemos el sistema
procedimental (hábito, acción almacenada) como parte del “otro”. El sistema procedimental no es emocional
en ningún sentido de la palabra: es un simple almacenamiento de pares estímulorespuesta y cadenas de
acción respuestarespuesta. En lugar de los dos procesos inherentes a la teoría del proceso dual
(emocional, inconsciente, el caballo o elefante versus el yo cognitivo, el jinete), tendríamos que separar tres
sistemas (emocional, procedimental, el yo). Pero, nuevamente, las respuestas procedimentales son parte
de nosotros. Veremos que estos pares estímulorespuesta y estas cadenas de acción son la clave para que
los atletas golpeen pelotas de béisbol, hagan jugadas, lancen y atrapen pelotas de fútbol y den otras
respuestas entrenadas. Cuando se les pregunta, la mayoría de los atletas hablan de entrar en sí mismos,
no de salir de sí mismos, cuando están “en la zona”.

Como ha señalado Antonio Damasio en varios libros, las personas como “Elliot” con sistemas
emocionales deteriorados no toman decisiones normales. 33 De hecho, ahora hay cierta evidencia de que
las personas psicópatas o sociópatas son calculadoras y poco emocionales, y toman decisiones
34
independientemente de cualquier sensibilidad emocional.
Cuando hablamos de emociones y del papel de las emociones en la toma de decisiones, es importante
señalar que nuestros recuerdos del pasado se reconstruyen, se reconstruyen cada vez de nuevo y no son
necesariamente correctos. (Abordaremos esta cuestión en profundidad en nuestros análisis del
pensamiento episódico sobre el futuro, la memoria episódica y la deliberación en los capítulos 9 y 16). Esto
significa que si realizamos una acción basándonos en uno de nuestros otros sistemas (por ejemplo, debido
a nuestro sistema de aprendizaje procedimental), podemos imaginar que realizamos esa acción porque
nuestro sistema deliberativo quería hacerlo, o podemos imaginar que realizamos esa acción debido a una
respuesta emocional. Aunque uno puede recordar haber realizado una acción de hecho, las partes
35
“Porque se sentía bien”, emocionales de nuestro cerebro que realmente codifican
“sentirse bien” podría no haber estado activo en absoluto en ese momento; en cambio, es posible
que hayas retroconstruido la emoción.
Esto se ha visto explícitamente en estudios sobre el ansia y la recaída
en la adicción a las drogas: la mayoría de los adictos informan que recuerdan un ansia imparable en los
días previos a la recaída, pero los estudios prospectivos que observan a los adictos durante la recaída
37 ;M
encuentran que solo una pequeña proporción realmente muestra ansia.
Dicho esto, las emociones desempeñan un papel importante en nuestra toma de decisiones. A menudo,
las situaciones en el mundo o las situaciones con nuestros semejantes producen emociones, que guían
nuestras decisiones. Las emociones pueden describirse como nuestra interpretación de estados reactivos
que hemos aprendido a lo largo de escalas de tiempo evolutivas, que producen cambios en nuestras
respuestas corporales y sesgan nuestras acciones.
Cuando caminamos por una calle oscura de noche, los sonidos comienzan a ponernos nerviosos y
empezamos a pensar que podemos estar viendo cosas. La ansiedad que se desarrolla aumenta nuestra
atención hasta el punto en que incluso podemos ver cosas que no existen. No he profundizado en la
percepción en este libro, en gran parte porque se sabe tanto sobre ella que

Los estudios prospectivos son, por supuesto, mucho más difíciles de realizar porque tienen que examinar a
METRO

muchos más sujetos para encontrar a los que recaerán naturalmente durante el curso del estudio, y porque tienen
que construirse con mucho cuidado para no preparar a esos sujetos para que comiencen a desear o recaigan (lo que
sería poco ético y estaríamos observando una recaída inducida en lugar de una recaída natural).
Machine Translated by Google

72 El sistema de toma de decisiones

Necesitaría un libro adicional para explicarlo todo. 38 Sin embargo, aquí son útiles dos conceptos
39
importantes. En primer lugar, la percepción es fundamentalmente una acción interpretativa. Aunque
nuestra retina responde a la luz, no vemos “luz”, vemos objetos: árboles, casas, caras.
Aunque las neuronas de la cóclea de nuestros oídos responden al sonido, no oímos “sonidos”, oímos
voces y música. Las ilusiones se producen porque los mecanismos de interpretación del cerebro son
engañados y procesan la información de forma incorrecta. En segundo lugar, la percepción consiste
fundamentalmente en detectar señales. 40 Esto significa que hay que hacer una estimación

de si el conjunto de señales luminosas percibidas es una cara o algo más. Cuando miro un árbol a
plena luz del día, es bastante fácil darse cuenta de que es un árbol. Pero tarde por la noche, en la
oscuridad, ¿es un árbol que se mece con el viento o algo más siniestro?
Una vez, poco después de graduarnos de la universidad, mi esposa y yo estábamos visitando Irlanda.
Estábamos en las islas Aran, una zona muy rural de la parte más occidental de Irlanda. Caminábamos de
regreso desde el pub hasta el bed and breakfast donde nos alojábamos. Estaba todo muy oscuro, salvo
por la tenue luz de las estrellas que se asomaba entre las nubes que se movían rápidamente.
Como conocíamos muy bien la poesía y los mitos irlandeses, era bastante fácil asustarse con la
oscuridad. Al borde de la carretera, frente a nosotros, vimos una luz naranja flotando en el aire, como un
fuego fatuo. Había un olor en el aire, como un perro o un lobo. Cuando llegamos a la luz, nuestra
adrenalina estaba a toda potencia y yo estaba lista para saltar. Cuando pasamos, un joven, sentado en la
entrada de su casa, fumando un cigarrillo, con la mano sobre la cabeza de este perro grande y peludo,
nos saludó con la cabeza, dijo "Buenas noches" y nos preguntó a dónde nos dirigíamos. Se lo dijimos y
él dijo que estaba a una milla más adelante en la carretera. Y seguimos adelante, riéndonos de nuestras
interpretaciones emocionales de la luz naranja flotante.
En la detección de señales, se pueden cometer dos tipos de errores: falsos negativos y falsos
positivos. Un falso negativo implica no reconocer algo que está ahí, mientras que un falso positivo implica
reconocer algo que está ahí cuando no lo está. La mayoría de los mecanismos de detección de señales
tienen parámetros (ganancias y umbrales) que se pueden ajustar para compensar la probabilidad de
cometer errores de falsos positivos con los de falsos negativos. 41 El cerebro no es una excepción.
errores.

Esto significa que la percepción, como cualquier mecanismo de detección de señales, tiene que
compensar los falsos negativos (pasar por alto algo que está ahí) con los falsos positivos (identificar
algo que está ahí cuando no lo está). Cuando nos ponemos ansiosos, incluso asustados, por la
oscuridad, nuestro corazón empieza a latir con fuerza, nuestros músculos se tensan, listos para entrar
en acción, y nuestra atención busca cualquier cosa que pueda exigir una respuesta. Al oír el crujido de
una rama bajo nuestros pies, podríamos literalmente saltar por los aires. (Este es un sobresalto
, que ya hemos visto antes.)
potenciado por el miedo . Las emociones son particularmente importantes para las interacciones
sociales. El amor a primera vista puede existir o no, pero la lujuria a primera vista ciertamente sí. Una
persona que responde a una situación (por ejemplo, atrapar a un cónyuge infiel) con ira y rabia va a
seleccionar acciones fundamentalmente diferentes a tomar que alguien que responde a la misma
situación con tristeza y abatimiento. En un ejemplo ahora clásico, las personas a las que se les ofrecen
juego recompensas injustas en el ultimátum N muestran una mayor actividad en la ínsula anterior (involucrada en l
43
y rechazan la oferta injusta con ira y disgusto.

Analizaremos el juego del ultimátum en detalle en nuestro análisis de la moralidad. En resumen, el juego del
norte

ultimátum implica que dos jugadores se dividen una suma de dinero, digamos $20. Un jugador puede hacer una

oferta de (continúa)
Machine Translated by Google

Emoción y selección de acción pavloviana 73

Los estudios sobre las emociones han demostrado que no sólo muchas decisiones están
correlacionadas con reacciones emocionales a la decisión en sí, sino también que estados emocionales no
relacionados pueden afectar a las decisiones. 44 Inducir un sentimiento de ansiedad antes de enfrentarse

a una decisión hace que las personas estén menos dispuestas a asumir riesgos; inducir un sentimiento de
propensas a deliberar sobre las decisiones y más propensas a ira hace que las personas sean menos
responder rápidamente. 45 Esta observación (que estar emocionalmente asustado, enojado o excitado
sexualmente hace que uno sea menos propenso a deliberar cognitivamente) es casi con certeza de donde
Platón, San Agustín y Freud obtuvieron su dicotomía entre emoción y cognición que empuja a la persona
en dos direcciones. Sin embargo, como espero haber dejado claro, la interacción es mucho más complicada que eso.

¿Los animales muestran emociones?

A menudo se considera que la emoción forma parte de nuestra herencia “animal”, mientras que la cognición se
46
Como espero haber demostrado a lo largo
considera un sistema de toma de decisiones “superior”, “más humano”.
de este libro, se trata de una dicotomía errónea. Las ratas deliberan sobre sus decisiones y las emociones
son fundamentales para las interacciones que nos hacen humanos. Sin embargo, una pregunta que surge
es si los animales tienen emociones y sentimientos. Todos los amantes de las mascotas, en particular
aquellos que tienen una mascota mamífera (un gato, un perro), te dirán que sus mascotas tienen
sentimientos, pero, por supuesto, como vimos al principio del libro, somos notoriamente malos a la hora de
juzgar la capacidad de acción de las criaturas no humanas. Mi padre está convencido de que su GPS se
enoja cuando tiene que recalcular una ruta porque se saltó
Oh un desvío.
Por otra parte, los simios a los que se les ha
enseñado un lenguaje limitado (como Kanzi el chimpancé o Koko el gorila) son capaces de expresar
emociones con palabras. 47 Estos simios utilizan palabras emocionales de maneras muy paralelas a
, las de Charles Darwin.
En su libro La expresión de las emociones en el hombre y los animales , señala que
ciertas expresiones emocionales son comunes en todas las culturas y especies: la ira, el asco, la risa, la
alegría, la tristeza: todas ellas son señales comunes en todos los seres humanos y en todas las culturas.
De hecho, como vimos en el Capítulo 4, estas expresiones faciales son similares en todos los mamíferos.
Kent Berridge y sus colegas estudiaron las expresiones faciales de desagrado (en respuesta a líquidos
amargos) y de atractivo (en respuesta a líquidos dulces) y encontraron expresiones faciales similares en
ratas, monos y humanos (sacar la lengua, hacer cara de asco para los líquidos amargos y lamerse los labios
para los dulces). Berridge y sus colegas pudieron demostrar que estas expresiones no tienen que ver con el
gusto en la lengua porque podían cambiar el desagrado por atractivo y viceversa manipulando el sistema
48
opioide en ratas.

cómo dividir el dinero, y el otro decide si acepta la oferta (y ambos jugadores obtienen la parte ofrecida) o rechaza la
oferta (y nadie obtiene nada). Observe que un receptor que rechaza una oferta está perdiendo dinero para castigar a la
persona que divide el dinero. Este es un fenómeno llamado "castigo altruista", porque castigar a las personas que ofrecen
de manera injusta conduce a sociedades más justas, pero la persona que castiga a la persona que ofrece de manera
42
injusta también ha perdido dinero. Exploraremos el castigo altruista y sus efectos en las sociedades en
Nuestro capítulo sobre la moralidad (Capítulo 23).
Por supuesto, sabe que el GPS simplemente utiliza un algoritmo para identificar cuándo recalcular y reproducir un
archivo de generación de voz para informarlo. (De hecho, probablemente podría programar el algoritmo).
Sin embargo, nuestras respuestas emocionales a situaciones sociales (como escuchar una voz grabada de una persona
exasperada que dice “recalculando”) están preprogramadas evolutivamente en nuestro cerebro.
Machine Translated by Google

74 El sistema de toma de decisiones

Una pregunta interesante, por supuesto, es en qué momento de la línea temporal evolutiva surgen las
emociones. ¿Las bacterias tienen emociones? Probablemente no tal como las entendemos nosotros. ¿Las tienen los reptiles?
Es poco probable. Una vez más, los científicos no han podido identificarlos de manera fiable. ¿Los mamíferos sí?
Casi con toda seguridad. Una propuesta interesante planteada por Michel Cabanac, Arnaud Cabanac y André Parent
es que los amniotas (mamíferos, aves y algunos reptiles) desarrollaron un sistema de categorización que puede
observar el sistema de selección de acciones pavloviano del cuerpo y que este sistema de categorización es lo que
ahora reconocemos como emoción. 49 Esto

es coherente con los conceptos de William James sobre la emoción como algo que realmente reside en los
cambios viscerales del cuerpo y con los conceptos de Antonio Damasio sobre la emoción como el reconocimiento
50
y la memoria de las respuestas corporales, a lo que él se refiere como la hipótesis del marcador somático .
Cuando las emociones aparecieron en la evolución, es evidente que son una parte importante de los sistemas
de toma de decisiones humanos. Las emociones deben ser vistas no sólo como sentimientos que impulsan a otros
componentes de la toma de decisiones a actuar, sino como sistemas de selección de acciones por derecho propio.
Las emociones interactúan con nuestra categorización de los sentimientos a través de cambios viscerales en el
cuerpo, que identificamos como esas mismas emociones a través de la memoria y la metáfora: la vigilancia del
miedo, la tensión de la ira, el calor de la lujuria, la calidez de la comodidad, el dolor desgarrador de la tristeza.

Libros y artículos para lectura adicional • Antonio

Damasio (1994). El error de Descartes: emoción, razón y cerebro humano .

Nueva York: Quill Press .

• Antonio Damasio (2003). En busca de Spinoza: alegría, tristeza y el cerebro emocional .

Nueva York: Harcourt .

• Joseph E. LeDoux (1996). El cerebro emocional . Nueva York: Simon and Schuster. • George Lakoff y Mark
Johnson (2003). Metáforas por las que vivimos . Chicago: University of Chicago Press.
Machine Translated by Google

Deliberación

Tragando la luz verde de las hojas,

estirándose bajo la gravedad, la tensión en la
superficie nos envuelve en un momento,

hasta que, de
repente, perturbados por un
soplo, caemos.

Algunas decisiones se toman imaginando explícitamente las posibles

consecuencias de esa decisión. Este proceso de imaginación es particularmente
bueno para decisiones que no se pueden aprender lentamente con el tiempo, o
para decisiones importantes que requieren un gran compromiso inicial. La
deliberación es un proceso computacionalmente costoso que requiere una serie
de sistemas neuronales, incluidos los procesos de atención, imaginación y
evaluación, y como tal, lleva tiempo calcular qué acción tomar.

La deliberación implica una búsqueda secuencial y serial de posibilidades. Implica una predicción de “qué
sucedería si”, seguida de un proceso de evaluación y un proceso de selección de acciones. Esto significa que la
deliberación requiere una serie de procesos complejos. Este procesamiento complejo hace que la deliberación
sea increíblemente flexible (saber que un camino conduce a un resultado no implica que uno deba tomar ese
camino para llegar a ese resultado), pero también hace que la deliberación sea lenta (lleva tiempo hacer todos
esos cálculos).
La deliberación también requiere un conocimiento de la estructura del mundo, particularmente de la estructura
definiciones previas). La deliberación
de causa y efecto . (Si no puedes predecir, no puedes buscar entre esas
requiere imaginación. 2 La deliberación requiere que uno sea capaz de
construir futuros posibles, y un proceso para saber que esos futuros potenciales son imaginarios y no reales. Una
deliberación también requiere un proceso de memoria activa capaz de recordar qué caminos ya ha recorrido y qué
caminos le quedan por recorrer.

A La incapacidad de diferenciar la imaginación de la realidad es, por supuesto, un componente clave de varias
Trastornos psicológicos (como la esquizofrenia). 3

75
Machine Translated by Google

76 El sistema de toma de decisiones

explorar. 4 Al comparar opciones, es necesario tener en la cabeza varias opciones, sus evaluaciones y los
caminos que llevan a ellas. Si se presta atención a los pros y contras específicos, se puede incluso manipular la
evaluación. 5 Esto requiere un proceso llamado memoria de trabajo , en el que los conceptos se mantienen en un
B
bucle de procesamiento activo.

El mapa cognitivo y la memoria declarativa

El concepto de mapa cognitivo fue introducido por Edward Tolman en la década de 1930.
Tolman sugirió que tanto las ratas como los humanos (y presumiblemente otros mamíferos también) mantenían
un “mapa de posibilidades”. 11 Esto significaba que el aprendizaje no tenía por qué apuntar a
obtener recompensas y evitar castigos (como sugerían sus contemporáneos, como Clark Hull y BF Skinner 12 ).
El concepto de Tolman implicaba que valía la pena para un individuo.
Los animales pueden aprender información sobre el mundo incluso cuando esa información no les proporciona

una recompensa o un castigo inmediatos. La información sobre el mundo puede utilizarse para tomar decisiones
futuras, lo que hace que la información básica sea en sí misma una actividad que vale la pena.
En la neurociencia moderna, el mapa cognitivo suele describirse como si fuera un mapa espacial, pero el
concepto original de Tolman era más "cognitivo" que "mapa", y las interpretaciones más modernas de los mapas
cognitivos se acercan más al concepto de un esquema sobre la estructura del mundo. 13 Sin duda, una de las
cosas más importantes que hay que saber sobre la estructura del mundo es dónde están las cosas y cómo se

conecta el mundo espacial.

Saber que hay pasarelas que conectan el edificio en el que está mi oficina con la sala de correo será muy útil
hoy, cuando la temperatura en el exterior sea de 2 ° Fahrenheit. Pero también es parte del mapa cognitivo saber
que uno puede sacar libros de una biblioteca y, por lo tanto, no necesita comprarlos. Y recordar el número de
teléfono de un amigo, o que uno puede llamar al 911 en caso de emergencia (en los Estados Unidos). O que París
está en Francia y Tokio en Japón, que Nueva York está en la costa este de los Estados Unidos y San Diego está
en la costa oeste. Todo este conocimiento sobre la estructura del mundo forma su mapa cognitivo. Si ya ha
aprendido estos hechos, puede usarlos para buscar entre las opciones y encontrar la elección que desea hacer.

A estos hechos a veces se los llama declarativos14 porque son cosas que se pueden “declarar”: si te digo
que Tokio es la capital de Japón o que crecí cerca de allí,

B
La memoria de trabajo mantiene las ideas, conceptos y resultados fácilmente accesibles para su procesamiento inmediato.
La complejidad y los mecanismos que permiten la memoria de trabajo son un tema muy amplio y son
objeto de múltiples libros. 6 Está relacionada con el concepto de recordar , donde uno repite la cosaa
una y otra vez lo que se ha hecho 7 y con la memoria prospectiva , en la que uno tiene que recordar estar preparado para
un evento futuro 8 (“No olvides la leche”). La capacidad de la memoria de trabajo está fuertemente ligada al cociente

intelectual, la habilidad mental, el éxito en la vida y el autocontrol. 9 Experimentos recientes han sugerido que es posible
10
entrenar la memoria de trabajo y que este entrenamiento tiene efectos en la toma de decisiones.
do
Para mis lectores que usan el sistema métrico, ¡eso es 17° Celsius! La mayoría de los edificios de la Universidad
de Minnesota están conectados por pasarelas, puentes entre edificios colocados sobre la calle, generalmente en el
segundo piso o en pisos superiores. Estas pasarelas suelen ser hermosas, con grandes ventanales de vidrio, pero forman
un laberinto complejo. Algunas conexiones entre edificios están sobre la calle, mientras que otras son túneles debajo de
la calle. Si conoces los pasadizos secretos, a menudo puedes recorrer un largo trecho del campus sin siquiera salir al exterior.
Machine Translated by Google

Deliberación 77

Como vivo en Washington DC, Minnesota, ya sabes esos hechos. No necesitas practicarlos. Por el
contrario, puedo decirte cómo lanzar una pelota de béisbol, andar en bicicleta, tocar el piano o el
clarinete, pero para ser bueno en eso, necesitas practicar. En la literatura sobre la memoria, estas otras
habilidades se denominan procedimentales porque requieren recuerdos del proceso y los procedimientos
en lugar de hechos.
La memoria declarativa a menudo se divide en dos subcategorías: memoria semántica y memoria
episódica . 15 La memoria semántica implica los hechos y el conocimiento sobre la
estructura del mundo. Las memorias episódicas son las memorias de tu propia vida. La afirmación de
que en mi fiesta de sexto cumpleaños, mis padres me hicieron una torta con la forma de un teléfono de
disco es una memoria semántica. Mi recuerdo de que mi papá me dijo que tenía que esperar para
obtener el último pedazo porque mis iniciales estaban en el centro (probablemente tratando de
enseñarme a ser educado y dejar que mis invitados comieran la torta primero), y que metí mi dedo y me
comí las iniciales mientras mi papá le estaba sirviendo un pedazo a alguien, y luego exigí un pedazo de
torta porque ya había obtenido las letras, es una memoria episódica.

La evidencia clave de que los animales (incluidos los humanos) utilizan un mapa cognitivo para
tomar decisiones es un proceso llamado aprendizaje latente . El aprendizaje sobre la estructura del
mundo puede no aparecer en la conducta hasta que uno necesita recurrir a ese conocimiento. La
16
hipótesis inicial de Tolman surgió de la observación de ratas que Ratas con experiencia en una
corrían por laberintos. Las ratas que recorrían un laberinto específico (solo explorando, sin recompensas
en el laberinto) aprenderían posteriormente mucho más rápido que las ratas sin experiencia en ese
laberinto. El experimento que finalmente convenció a Tolman de que los animales tenían que recordar
el conocimiento sobre la estructura del mundo fue que una rata (que no tenía hambre ni sed) a la que
se le permitió explorar un laberinto en forma de Y con comida en la bifurcación izquierda y agua en la
derecha iría inmediatamente a la bifurcación izquierda cuando tuviera hambre y a la bifurcación derecha
cuando tuviera sed. Para los humanos, al menos, este aprendizaje latente se trata de causa y efecto.
Reconocemos este conocimiento en términos de reglas de sientonces. Si dejo caer este vaso, se
romperá. Si dejo caer esta botella de plástico, no lo hará. Por lo tanto, es más seguro darle una botella
de plástico a mi hija de tres años, ya que podría dejar caer el vaso.
Podemos pensar en la deliberación como algo que tiene cuatro partes: el conocimiento del mundo,
el proceso de búsqueda que utiliza ese conocimiento del mundo para predecir lo que sucederá, un
proceso de evaluación que mide qué tan bueno es ese resultado y, finalmente, un proceso de selección
de acciones para realmente dar el primer paso adelante.

Buscar

Los primeros intentos de construir sistemas artificiales de toma de decisiones se basaron en procesos de búsqueda entre posibilidades

Newell y Herb para encontrar un camino desde un punto de partida hasta un objetivo. 17 El Solucionador General de Problemas de Allen

Simon (propuesto originalmente en 1957) buscaba entre posibilidades para encontrar un camino desde un punto de partida hasta un objetivo.

Fue capaz de crear subobjetivos en el plan y luego resolverlos. Funcionó buscando entre subobjetivos
potenciales y luego resolvió cada subobjetivo buscando entre acciones conocidas hasta que pudo
encontrar un camino desde el punto de partida hasta el objetivo final dado. Durante los últimos 50 años,
se ha realizado una enorme cantidad de trabajo para mejorar los algoritmos de búsqueda hasta el punto
de que los algoritmos de búsqueda altamente eficientes pueden superar a los humanos.
Machine Translated by Google

78 El sistema de toma de decisiones

en partidas complejas (como la ahora famosa Deep Blue que pudo vencer al gran maestro Garry Kasparov en
ajedrez en 1997). 18 ;D
Sin embargo, en las últimas décadas ha quedado claro que estos procesos de búsqueda altamente eficientes
y optimizados no son la forma en que los expertos humanos resuelven la mayoría de estas tareas. 19
La búsqueda es algo que se hace al principio del aprendizaje y como respuesta a situaciones cambiantes. Cuanto
más experiencia adquieren las personas en un campo, más pequeño es el conjunto de futuros que buscan.
Las teorías actuales sugieren que esto se debe a que los expertos han almacenado en caché (mejora) la
opciones que tienen por delante.20 información. La búsqueda requiere mantener una gran cantidad de resultados

temporales en la memoria y realizar un seguimiento de una enorme cantidad de subpartes. Esto significa que es
21
laboriosa y requiere un amplio procesamiento computacional.
Cuando quedó claro que los expertos humanos no resuelven juegos como el ajedrez mediante búsquedas
profundas a través de largos caminos posibles, se hizo popular decir que la búsqueda era exclusivamente humana.
Estas hipótesis sugirieron que la búsqueda era difícil de realizar, que los humanos podían realizarla cuando la
necesitaban, pero que requería procesos cognitivos y conscientes complejos.
En particular, estas teorías sugerían que la búsqueda requería una descripción lingüística del
problema (que las personas necesitaban hablar consigo mismas mientras buscaban entre esas
posibilidades). Esto implica que se trata de una característica exclusivamente humana y que los
animales no querrían o no podrían realizar
22 búsquedas.
Por otra parte, se sabía desde hacía muchos años que los animales podían tomar decisiones basadas en
expectativas de los resultados de sus acciones. 23 Dados los procesos
simples que se plantearon en ese momento, se supuso que estas expectativas se formaban a partir de
asociaciones simples entre la acción y el resultado. Sin embargo, los estudios computacionales de la toma
de decisiones que comenzaron a desarrollarse en la última década llevaron a la conclusión de que esas
asociaciones simples son insuficientes para resolver el problema. Aunque se puede resolver una decisión
de un solo paso (acercarse a la Señal Uno cuando se tiene hambre, a la Señal Dos cuando se tiene sed)
con una asociación simple (la Señal Uno tiene comida, la Señal Dos tiene agua), si el reconocimiento de
,
las expectativas debe cruzar opciones (ir a la izquierda, luego a la derecha, luego a la izquierda nuevamente
para llegar a la comida), entonces la única manera de resolver esto es con procesos que codifiquen toda la
estructura de causa y efecto de la situación.
24 Así, varios autores han sugerido que los animales en realidad realizan procesos de búsqueda y

evaluación en determinadas condiciones. 25

En 2007, Adam Johnson y yo descubrimos que las señales neuronales en el hipocampo de la

rata reproducían representaciones de caminos futuros en los momentos en que las teorías
computacionales predecían que los animales estarían buscando en el futuro. 26 Las células del
hipocampo de la rata codifican la ubicación del animal en un laberinto.
Esto significa que si grabas desde
suficientes celdas simultáneamente, puedes decodificar esa representación. 28 Adam desarrolló

una nueva técnica matemática 29 que nos permitió decodificar estas representaciones en escalas de tiempo muy
rápidas (la cognición ocurre más rápido que el comportamiento 30 ), y cuando miramos películas de esa
representación decodificada a lo largo del tiempo, encontramos que a veces el animal se detenía en un punto de
decisión difícil y esas representaciones barrían los caminos posibles, primero en una dirección y luego en la otra.
mi

D
Curiosamente, aunque los algoritmos de búsqueda parecen ser capaces de vencer de forma fiable a los jugadores humanos al ajedrez,

Otros juegos, como el Go, han sido mucho más difíciles.

mi
No buscábamos esto. En realidad, intentábamos examinar las representaciones del hipocampo en un
laberinto específico para compararlos con nuestras grabaciones del estriato dorsal de ratas que recorrieron el mismo laberinto.31

Pero un día, Adam entró en mi oficina y me dijo: “Dave, ¡mis animales están mostrando viajes mentales en el
tiempo!” (continúa)
Machine Translated by Google

Deliberación 79

En los seres humanos, la deliberación depende del proceso de imaginación, en el que uno crea una
imagen mental de un futuro potencial. 32 Si estos barridos secuenciales de representación a lo largo de
los caminos potenciales que tiene por delante la rata que vimos son el mismo fenómeno que un ser
humano que piensa conscientemente sobre el futuro es todavía una pregunta abierta, pero las estructuras
neuronales involucradas coinciden notablemente bien. Sabemos, por ejemplo, que los seres humanos con
lesiones hipocampales tienen dificultad para imaginar el futuro, y que el pensamiento episódico sobre el
futuro en los seres humanos produce actividad hipocampal medida por fMRI. En los seres humanos, las
decisiones deliberadas conscientemente dependen de estructuras prefrontales acopladas a sistemas
hipocampales. En ratas, estructuras prefrontales similares se acoplan funcionalmente a sistemas
33
hipocampales durante la toma de decisiones deliberativa. Como veremos en la siguiente sección, la
Las mismas estructuras (corteza orbitofrontal y estriado ventral [núcleo accumbens], ambos acoplados
funcionalmente al hipocampo) están involucradas en los procesos de evaluación tanto en seres humanos
como en animales. 34

Evaluación

Los modelos actuales de deliberación basados en la neurociencia económica y computacional en realidad

no realizan mucha “deliberación”. F Es decir, incluso los que incluyen procesos de búsqueda simplemente
buscan el valor de ese resultado como un único número, expresado en una moneda común. Obviamente,
si vas a comparar dos opciones (como comer una manzana o una naranja), tienes que ponerlas en la
misma escala para poder compararlas. Los modelos económicos (y los modelos informáticos en los que
se basan los modelos actuales de neurociencia) llaman a esta misma escala moneda común .
37
Sin embargo, ésta no es nuestra experiencia consciente
de deliberación; nuestra experiencia consciente de deliberación es que evaluamos los resultados en
relación unos con otros .

Para decirlo con cortesía, no le creí; estaba profundamente incrédulo. A medida que comprobábamos y volvíamos a comprobar

nuestros hallazgos en busca de posibles hipótesis alternativas, finalmente llegamos a la conclusión de que nuestras ratas efectivamente

representaban posibles caminos por delante de sí mismas. Esto es lo divertido de la ciencia: descubrir algo completamente

inesperado. Esto se captura elegantemente en la famosa cita que generalmente se atribuye a Isaac Asimov: "La frase más importante

en la ciencia no es en realidad 'Eureka', sino más bien 'Oye, eso es gracioso'".

F
Una excepción es el trabajo sobre modelos de carrera hacia el umbral, que acumulan evidencia de indiSi bien existe evidencia
opciones individuales hasta que una de las opciones alcanza un umbral. 35 neuronal para estos modelos de carrera hacia el

umbral, la evidencia tiende a provenir de experimentos que incluyen ambigüedad perceptiva, pero que no han incorporado los múltiples

sistemas de toma de decisiones que se sabe que existen.

Un experimento ha examinado el efecto de la ambigüedad de valores y ha encontrado evidencia de una integración de carrera
hacia el umbral en humanos que toman decisiones entre alimentos igualmente valorados pero diferentes. 36 Examinaremos
los modelos de carrera hacia el umbral en nuestro análisis del papel de la percepción en la toma de decisiones (Capítulo 11).
Una posibilidad interesante es que la evaluación utilice los mismos mecanismos que la percepción, aplicados a hipótesis sobre estados

internos futuros.

Vale la pena hacer una digresión para hablar de la introspección y la psicología. La introspección es el examen interno
GRAMO

consciente de nuestros propios procesos mentales. Tiene una tradición muy larga en psicología, que se remonta a los primeros

filósofos: el famoso dicho era “conócete a ti mismo”. 38 El problema es

que, como todos sabemos (y como se desprende de gran parte de lo que trata este libro), a menudo nos equivocamos en nuestros
39
propios procesos de toma de decisiones.

(continuado)
Machine Translated by Google

80 El sistema de toma de decisiones

Las observaciones introspectivas y casuales de las situaciones en las que deliberamos sobre las
decisiones sugieren que tienden a tener más que ver con las dificultades en el paso de evaluación que
en el paso de predicción futura. Gran parte de la literatura computacional ha dedicado su tiempo a
44
trabajar en el paso de predicción de las decisiones, Probablemente porque surgió de la robótica.
literatura en la que es necesario que el robot realice cada paso. Pero, como se señaló en los primeros
modelos de búsqueda (como el Solucionador de problemas generales de Newell y Simon), no dedicamos
45
nuestro tiempo a calcular el camino hacia el resultado; en cambio, creamos subobjetivos .
Por ejemplo, si imaginamos a una persona con dos ofertas de trabajo, la acción necesaria es sencilla:
Envía un correo electrónico a un trabajo diciendo "sí" y otro al otro trabajo diciendo "lo siento". Esto puede
generar una larga serie de acciones posteriores (firmar un contrato, encontrar una casa, mudarse), pero
nuestro candidato hipotético no necesita considerar cómo llegar al trabajo para evaluar las dos
posibilidades, solo saber que es posible mudarse a donde sea que esté el trabajo. La complejidad de
determinar si los subobjetivos importan es que atravesar el subobjetivo puede importar en algunas
condiciones, pero no en otras. Si estoy decidiendo si tomar el tren o el avión desde Washington DC a
Nueva York, llegar a la estación de tren o al aeropuerto es fácil (ambos están en el metro). Sin embargo,
si estoy considerando si tomar el tren o el avión desde Baltimore, atravesar el subobjetivo se convierte
en un problema porque la estación de tren está en la ciudad, mientras que el aeropuerto está muy lejos
de la ciudad. La cuestión de cómo identificar cuándo se puede omitir el paso del subobjetivo y cuándo es
necesario incluirlo es un asunto complejo que es objeto de mucha investigación actual.

La psicología normal (el estudio del procesamiento mental normal, en comparación con la “psicología anormal”,
el estudio de los trastornos mentales) surgió en el siglo XIX con el estudio de la percepción.40 Estos psicólogos
experimentales desarrollaron una técnica en la que se entrenaron para responder rápidamente a las señales y
midieron cuantitativamente la rapidez con la que reconocían algo (como la imagen de una cara).
Los psicólogos que utilizaban la introspección a finales del siglo XIX se llamaban a sí mismos psicólogos de la
Gestalt , de la palabra alemana Gestalt , que significa forma o figura, porque creían que estaban aprendiendo a
reconocer la forma general del mundo. El problema era que estaban midiendo respuestas introspectivas. ( ¿Con
qué rapidez reconozco esta señal? ) Con el descubrimiento de Sigmund Freud (18561939) de que parte de la
psicología era inconsciente, los experimentos basados en la conciencia de los gestaltistas se volvieron problemáticos.
(Es importante reconocer que los experimentos Gestalt eran cuantitativos [midían qué tan rápido respondían a una
señal], incluso si eran introspectivos). A principios del siglo XX, estos experimentos introspectivos fueron
abandonados en favor de medidas directas del comportamiento, bajo el disfraz del conductismo, lo que llevó a la
creencia de que, dado que era imposible medir la cognición interna, la introspección no era una buena práctica
científica. 41 El argumento era que
deberíamos tratar el cerebro como una caja negra, ya que lo único que podemos medir es la conducta. Por supuesto,
como hemos visto a lo largo de este libro, ahora podemos abrir la caja negra y medir otras cosas además de la
42
conducta (como la actividad neuronal; véase el Apéndice B). Ahora podemos medir esos estados cognitivos internos.
Sin embargo, los problemas con la introspección persisten.
El problema fundamental de la introspección, por supuesto, es que, como vimos en el Capítulo 1, nos
contradecimos, cada uno de nosotros contiene multitudes y no todos nuestros procesos internos son accesibles a nosotros.
Nuestra conciencia. 43 Esto no significa que no podamos utilizar la introspección para orientar nuestras hipótesis

científicas, pero vamos a tener que comprobarlas con experimentos cuidadosos basados en observaciones directas.
En psicología, esto se llama operacionalizar nuestra hipótesis: la idea es que no podemos medir los conceptos
introspectivos directamente, pero sí podemos medir el comportamiento (o las señales neuronales). Si podemos
encontrar algo que se correlacione con nuestras hipótesis introspectivas o las diferencie, entonces podemos
estudiarlo científicamente.
Machine Translated by Google

Deliberación 81

En cualquier caso, una vez que hemos identificado los resultados potenciales, necesitamos evaluarlos. Esta
etapa de evaluación es compleja, depende de la atención a los detalles y está sujeta a interesantes efectos de
46
encuadre. Aunque actualmente se desconoce el proceso mecanicista mediante el
cual evaluamos estos múltiples objetos no comparables, sabemos que este proceso se ve afectado por los demás
47
sistemas de toma de decisiones, en particular el sistema emocional.
No es sorprendente para nadie que haya observado a sus semejantes, pero las pruebas han demostrado que su
estado emocional al comienzo de una decisión puede influir en su decisión deliberativa final. 48 En el nivel más
trivial, podemos ver esto en el experimento original de Tolman con ratas: las ratas hambrientas fueron a la comida,

las ratas sedientas fueron al agua. 49 Pero

esto también ocurre en niveles más complejos: por ejemplo, las personas que están enojadas o tristes
50
tienen más probabilidades de rechazar ofertas en juegos de intercambio.
También conocemos algunas de las estructuras cerebrales implicadas en estos procesos de evaluación,
porque sabemos lo que ocurre cuando estas estructuras dejan de funcionar. Dos estructuras que se sabe que
están profundamente implicadas en la evaluación en general y en la evaluación deliberativa en particular son el
cuerpo estriado ventral y la corteza orbitofrontal . 51 El estriado ventral, a veces
llamado núcleo accumbens , se encuentra en la parte inferior del cuerpo estriado, que
La corteza orbitofrontal se encuentra en la parte
es una estructura subcortical grande y evolutivamente antigua.
inferior de la parte frontal de la corteza, justo detrás de los ojos. I Cuando estas estructuras están dañadas, las
53
personas y los animales tienen dificultades para evaluar sus opciones.
El disparo neuronal en ambas estructuras se relaciona con los juicios de valor de los resultados. Ambas
estructuras contienen algunas células que responden al consumo de recompensas, así como otras células que
responden a señales que predicen recompensas y otras células que parecen representar el valor esperado de un
ratas. tomando decisiones económicas resultado. 54 Esto se ha probado de manera más explícita en monos y
entre objetos. Por ejemplo, Camillo PadoaSchioppa y John Assad dieron a monos sedientos opciones entre dos
sabores de jugos. Al variar la cantidad de jugo ofrecido, pudieron determinar cuánto valía cada jugo para el
mono. ( ¿Una gota de jugo de uva vale dos gotas de jugo de manzana? ) Lo que descubrieron es que algunas
células en la corteza orbitofrontal representaban lo valioso que era el jugo de manzana, otras células representaban
lo valioso que era el jugo de uva y algunas células representaban lo valiosa que era la elección que hizo el mono,
traducida a una moneda común, independientemente de si eligió manzana o jugo de uva. Se han encontrado
efectos similares en humanos utilizando experimentos de fMRI.

Las neuronas orbitofrontales también reflejan los efectos de encuadre. En tareas en las que todas las
opciones están intercaladas, las neuronas reflejan correctamente el valor de preferencia revelado entre las
opciones. 56 En tareas en las que las opciones se dan en grupos, las células reflejan la valoración

yo
Ventral significa "hacia el pecho" en latín y se puede contrastar con dorsal, que significa "hacia la espalda" en
latín. En los animales que corren a cuatro patas (cuadrúpedos, como perros y gatos), el mentón del animal está
hacia el pecho, mientras que la parte superior de la cabeza está hacia la espalda. En los humanos, debido a que
nos hemos puesto de pie (nos hemos vuelto bípedos), la parte inferior del cerebro está hacia el suelo y la parte
dorsal del cerebro está hacia el cielo. Los científicos se apegan a estos términos para poder usar la misma
terminología para las mismas partes del cerebro, como el estriado dorsal y ventral, que están bien conservados
entre otros animales y los humanos. 52 Piense en ventral como hacia la parte inferior del cerebro y dorsal como hacia la parte sup
Yo Th nosotros orbito ,
de la “órbita” de los ojos, en referencia al hueso circular que rodea el ojo, y frontal . Encontramos
la corteza orbitofrontal en nuestro análisis de la emoción y los sistemas pavlovianos de selección de acciones
(Capítulo 8).
Machine Translated by Google

82 El sistema de toma de decisiones

entre las opciones disponibles. Leon Tremblay y Wolfram Schultz dieron a un mono la opción de elegir entre
pasas y manzanas o manzanas y cereales. Por experimentos anteriores, sabían que el mono al que estaban
registrando prefería las pasas a las manzanas y las manzanas a los cereales. Descubrieron que las neuronas
codificadoras de valores se activaban muy poco en el caso de las manzanas en la comparación entre pasas y
manzanas, pero mucho en el caso de las manzanas en la comparación entre manzana y cereal. Por el contrario,
Camillo PadoaSchioppa y John Assad no encontraron estos cambios en sus tres opciones de zumo, pero el
experimento de PadoaSchioppa y Assad intercaló las opciones, mientras que el experimento de Tremblay y
Schultz las agrupaba. Esta agrupación se denomina "bloques" en la jerga de la neurociencia conductual. Es decir,
un sujeto puede recibir un bloque de opciones entre manzana y uva (por ejemplo, durante 50 ensayos) y luego
otro bloque de opciones entre naranja y plátano (por ejemplo, durante 50 ensayos) y luego otro bloque de
manzana y naranja. ... etc. En experimentos posteriores, PadoaSchioppa descubrió que la actividad de las
neuronas de la corteza orbitofrontal dependía exactamente de esta cuestión: ¿cuál es el menú de opciones
disponible? Al igual que los humanos al elegir entre televisores determinan el valor de las opciones en relación
con las otras opciones , los monos al elegir entre alimentos o las opciones en relación con las otras opciones
en relación con las otras opciones disponibles. disponibles, los jugos determinan el valor de las opciones

Por supuesto, estas preferencias pueden cambiar. Si te enfermas después de comer algo, aprenderás a
desagradar ese alimento. 58 (Es por eso que a los pacientes de quimioterapia se les dan sabores extraños de
alimentos, para que las náuseas extremas que induce la quimioterapia no les enseñen a desagradar sus alimentos
favoritos. 59 ) De manera similar, la sobreexposición a un sabor de alimento determinado puede producir saciedad
y preferencia por otros alimentos. 60 Cuando un animal cambia su preferencia (por ejemplo, porque se sacia
porque ha bebido suficiente jugo de manzana, o porque tiene una mala experiencia después de beber ese jugo
de manzana), las neuronas de la corteza orbitofrontal cambian para reflejar ese cambio de preferencia.
61
Uno de los efectos de las drogas de abuso, en
particular la cocaína, es que alteran la capacidad de las neuronas de la corteza orbitofrontal para reconocer
cambios en el valor. 62 Las neuronas orbitofrontales en animales con una amplia experiencia con la cocaína no
logran cambiar la valoración cuando la acción que conduce a un sabor dulce se cambia para conducir ahora a un
sabor amargo. Parte del problema con las drogas es que afectan la capacidad del cerebro para reevaluar
correctamente las situaciones cuando cambian.
En un experimento reciente muy interesante, Geoff Schoenbaum y sus colegas probaron si las ratas podían
reconocer un cambio en la recompensa que se produciría después de tomar un 63 (ya sea aumentando el número
acción de bolitas de comida proporcionadas, digamos de una bolita de comida a tres, o cambiando el sabor de

la comida proporcionada, digamos de sabor a plátano a cereza). Si el cambio en el valor era numérico (es decir,
cambiando el tamaño pero no el sabor de la recompensa), el animal necesitaba el estriado ventral intacto, pero
no la corteza orbitofrontal. Sin embargo, los animales necesitaban tanto el estriado ventral como la corteza
orbitofrontal para reconocer el cambio entre sabores. Esto sugiere que el estriado ventral es clave para reconocer

cambios en la valoración, y la corteza orbitofrontal para reconocer cambios en el producto.

Por lo tanto, los datos sugieren que estas estructuras están involucradas en la evaluación, pero ¿están
activas durante el paso de evaluación en la deliberación? Los datos de fMRI sugieren firmemente un papel para ambas

J Recuerde el ejemplo de la televisión del Capítulo 3. Cuando se les da a elegir entre televisores de $100, $200 y
$300, las personas tienen muchas más probabilidades de elegir el televisor de $200 en lugar del de $300. Pero cuando
se les da a elegir entre televisores de $200, $300 y $400, las personas tienen muchas más probabilidades de elegir el
televisor de $300 en lugar del de $200. Esto se llama encuadrar , porque el conjunto de opciones enmarca sus decisiones. 57
Machine Translated by Google

Deliberación 83

la corteza orbitofrontal y el estriado ventral durante algún aspecto de la deliberación. 64

La evidencia directa de un papel para estas estructuras neuronales en la evaluación durante la deliberación
proviene de datos de registros neuronales tomados por mi ex posdoctorado Matt hijs van der Meer y por
mi estudiante de posgrado Adam Steiner. 65 Como discutimos anteriormente, en ciertas decisiones
difíciles, las ratas se detienen y miran hacia adelante y hacia atrás (un fenómeno conocido como "ensayo
y error vicario"). 66 Ya hemos discutido cómo, durante este proceso, el hipocampo de las ratas representa
opciones potenciales por delante del animal, como si el animal estuviera buscando caminos posibles.
67 Cuando estaba en mi laboratorio, Matt Steiner registró neuronas del estriado
ventral de ratas en esta misma tarea y descubrió que en los mismos momentos en que Adam Johnson

había descubierto que el hipocampo recorría esos caminos futuros, las células de recompensa del
estriado ventral (células que respondieron positivamente durante el consumo) se activaban de nuevo,
como si el estriado ventral estuviera representando de manera encubierta algo sobre el hecho de que el
animal obtendría una recompensa si iba en esa dirección. Al registrar de nuevo las neuronas de la
corteza orbitofrontal de la misma tarea, Adam Steiner descubrió que las células de recompensa
orbitofrontales (células que respondieron positivamente durante el consumo) también se activaban, de
nuevo, como si la corteza orbitofrontal estuviera representando de manera encubierta algo sobre el
hecho de que el animal obtendría una recompensa. Sin embargo, una diferencia interesante que
encontramos es que las células estriatales ventrales reflejaban la expectativa de recompensa antes de
que el animal se volviera hacia esa recompensa (lo que sugiere participación en la selección de la
acción), mientras que las células de la corteza orbitofrontal estaban activas después de que el animal ya
se había vuelto hacia la recompensa (lo que sugiere participación en la predicción de un resultado más que en la sele
El paso de evaluación en la deliberación es todavía un área de investigación activa tanto en humanos
como en animales no humanos. Conocemos algunas de las estructuras que intervienen, y algo sobre la
sincronización de los mecanismos, pero aún no entendemos cómo la atención cambia el marco del
proceso de evaluación. Por ejemplo, al comparar automóviles, imaginemos que tratamos de decidir entre
un automóvil deportivo y una minivan o un híbrido: uno es más elegante, uno puede llevar más cosas, uno
obtiene un mejor rendimiento de combustible. No hay una manera directa de comparar el estilo, el tamaño
y el rendimiento de combustible en una "moneda común". En cambio, las personas van y vienen,
deliberando sobre lo que es importante para ellos, construyendo hipótesis de valor para la comparación.
En un giro interesante, los pacientes con daño en la corteza orbitofrontal no van y vienen entre opciones;
en cambio, miran una opción a la vez y determinan si es lo suficientemente buena.
68
No se sabe, sin embargo, si este cambio de estrategia se produce porque la
corteza orbitofrontal controla realmente la estrategia utilizada o porque la corteza orbitofrontal ayuda en
la comparación y los pacientes reconocen que simplemente no son muy buenos haciendo comparaciones.
En cualquier caso, está claro que la corteza orbitofrontal participa de manera crítica en la comparación de
opciones durante la deliberación.

Selección de acciones

El paso final de la deliberación, la adopción de la acción, sigue siendo una cuestión casi completamente
abierta. ¿Cómo convergen las personas y otros animales en una decisión? ¿Se trata de un proceso en
el que simplemente se dice “¿es eso suficiente?” después de cada evaluación? ¿Se trata de un proceso
en el que las evaluaciones se guardan en la memoria y se comparan directamente? En este punto, los
científicos no lo saben, pero hay algunas pruebas a favor de la hipótesis de la comparación (que el
resultado esperado y su evaluación se guardan en la memoria de trabajo y se comparan con otras alternativas).
Machine Translated by Google

84 El sistema de toma de decisiones

Si la deliberación implica predecir opciones futuras y compararlas, entonces hay que recordar cada opción para poder

compararlas. La memoria de trabajo es la capacidad de mantener varias cosas en la cabeza al mismo tiempo. El efecto de

hacer que las personas sean más inconsistentes en sus elecciones: con menos poner a prueba la memoria de trabajo sería

recursos de memoria de trabajo, hay menos tiempo para acertar en la deliberación y es más probable que uno abandone la

búsqueda en el futuro antes de tiempo. Esto es lo que muestran las pruebas. 70 Las personas con mejor memoria de

trabajo están más dispuestas a esperar recompensas posteriores. También son mejores a la hora de tomar decisiones. De
hecho, es posible entrenar la memoria de trabajo y mejorar la capacidad de algunas personas para esperar recompensas

retrasadas.

La ventaja de la deliberación es que proporciona flexibilidad. Saber que ir al casino me permitirá jugar no me obliga a ir

al casino. Combinar la deliberación con la imaginación puede permitirnos tomar decisiones sobre decisiones muy complejas

que no podemos (o no deberíamos) tomar muchas veces (como qué trabajo aceptar, a qué universidad ir o con quién

casarnos). Combinar la deliberación con la atención nos permite alejarnos de las opciones que estamos muy motivados a

tomar (ese cigarrillo) y acercarnos a opciones que son mejores para nosotros a largo plazo (hacer ejercicio en el gimnasio).

El problema con la deliberación es que podemos “perdernos en nuestros pensamientos”. Como Hamlet, atrapados entre

posibilidades difíciles, pasamos nuestro tiempo prediciendo resultados, sopesando opciones, enumerando pros y contras,

y nunca tomamos medidas.

Tolman y Hull

Me gustaría terminar este capítulo con una breve discusión sobre la historia de la deliberación y su papel en la toma de

decisiones. La diferencia entre la toma de decisiones deliberativa y la toma de decisiones basada en el hábito (lo que hemos

llamado "procedimental") se convirtió en uno de los grandes debates científicos de los años 1930 y 1940, dos importantes
72
nuestro tiempo.
laboratorios hacían correr ratas por laberintos, tratando de determinar cómo encontraban la meta. (Ambos

laboratorios eran conductistas en el sentido de que querían ser cuantitativos y operacionalizar el proceso de toma de

decisiones en animales que pudieran estudiar con controles apropiados, en respuesta a la introspección de los gestaltistas.)

En la Costa Este, en la Universidad de Yale, Clark Hull sostuvo que las ratas aprendían a asociar estímulos con respuestas,

mientras que en la Costa Oeste, en Berkeley, Edward Tolman sostuvo que las ratas eran criaturas cognitivas que planificaban

mentalmente rutas para alcanzar metas. En 1970, en una reseña de este debate aún en curso, Endel Tulving y Stephen A.

Madigan escribieron que “los organismos que aprenden lugares, guiados por mapas cognitivos en sus cabezas, sortearon

con éxito las carreras de obstáculos para conseguir comida en Berkeley, mientras que sus contrapartes que aprenden

respuestas, impulsadas por hábitos e impulsos, realizaron hazañas similares en Yale”.

Ya hemos visto cómo el aprendizaje latente llevó a Tolman a plantear la hipótesis de la presencia de un mapa cognitivo.

Tolman también observó a sus ratas mientras aprendían a recorrer el laberinto y se dio cuenta de que, a medida que
cometían errores, parecía haber un método para esos errores: las ratas hacían todos los giros a la izquierda, luego todos

los giros a la derecha y luego alternaban izquierda y derecha, como si realmente estuvieran probando hipótesis.

73 El problema con estas observaciones es que si las ratas simplemente estuvieran

haciendo elecciones aleatorias durante el aprendizaje, entonces a veces las ratas que hacen elecciones aleatorias tomarían

todas las opciones de izquierda a derecha. (Si hay tres opciones de izquierda a derecha en el laberinto, entonces una rata

de cada ocho irá a la izquierda en las tres opciones incluso si las ratas realmente estuvieran haciendo elecciones aleatorias).
Machine Translated by Google

Deliberación 85

(Como a nuestro cerebro le gusta encontrar patrones, las ratas que eligen todas las opciones de izquierda a
derecha se destacarían. De manera similar, incluso una rata que sabe la respuesta correcta no necesariamente
siempre va a elegir esa opción. (Tal vez haya algo de ruido en el resultado; tal vez el animal esté explorando
para verificar sus hipótesis). De hecho, determinar cuándo el animal sabe la respuesta es matemáticamente
74
complicado.
Ahora tenemos los métodos estadísticos para identificar si estas secuencias son aleatorias, 75 pero Tolman
no disponíade estas estadísticas complejas. Randy Gallistel, Stephen Fairhurst y Peter Balsam utilizaron estos
nuevos análisis estadísticos para examinar explícitamente cómo aprenden las ratas y descubrieron que (en
ciertas tareas) las ratas individuales no aprendían gradualmente, sino que de repente cambiaban en un solo
ensayo de equivocarse en su mayoría a acertar en su mayoría . 76 Argumentaron que la tasa de aprendizaje
cada una de las gradual observada en muchos estudios era un artefacto de promediar entre diferentes ratas,
cuales alcanzaba su momento "¡Ajá!" en diferentes momentos.
K

Como era tan difícil analizar la variabilidad de los errores cometidos en las primeras fases del aprendizaje,
Hull decidió analizar ratas que habían alcanzado una regularidad en sus trayectorias y que ya no cometían
errores. Hull utilizó la analogía de un operador de centralita que crea una conexión entre dos teléfonos para
explicar sus ideas, mientras que Tolman sólo contaba con la analogía de la inspiración humana para intentar su
explicación. Mientras que Hull pudo proporcionar una explicación matemática de sus sugerencias, Tolman no.
Esto hizo posible que Hull (y otros que argumentaban en contra de los procesos cognitivos, como BF Skinner)
explicaran específicamente cuándo ocurrirían los fenómenos y les permitió ser cuantitativos al respecto.

78
La ciencia se basa en la predicción y la replicación. Las observaciones de
Tolman eran difíciles de cuantificar. La inspiración llegaba a las ratas en diferentes momentos. Así, mientras que
cualquier rata individual de repente "lo entendía" y comenzaba a recorrer el laberinto correctamente, el promedio
de todas las ratas mostraba una curva que se desarrollaba lentamente. De manera similar, aunque cada rata
mostrara individualmente un comportamiento de ensayo y error indirecto en algunos ensayos, los ensayos en
79 a otra.
los que se producía el comportamiento de ensayo y error indirecto diferían de una rata

Las matemáticas son una tecnología. Como cualquier otra tecnología, nos permiten ver cosas que antes no
podíamos ver (compárese con el microscopio, que permitió a Robert Hooke ver células, o el telescopio, que
permitió a Galileo Galilei ver las lunas de Júpiter) .
Es importante tener en cuenta que Tolman fue anterior a Claude Shannon, por lo que carecía de las matemáticas
de la teoría de la información. Fue anterior a la primera computadora (desarrollada durante la Segunda Guerra
Mundial), a John von Neumann y Alan Turing, y al revolucionario libro de Norbert Wiener, Cibernética (publicado
en 1948), y por lo tanto no tuvo acceso a la nueva conceptualización de la inteligencia como computación. Y fue
anterior a Alan Newell y Herb Simon, por lo que carecía de las matemáticas de los algoritmos.
81 El trabajo

principal de Tolman fue en los años 1930 y 1940, resumido en su artículo de Psychological Review “Mapas
cognitivos en ratas y hombres” publicado en 1948. Claude Shannon publicó su artículo innovador sobre la teoría
de la información en 1948. Alan Turing hizo su trabajo principal sobre computabilidad a fines de los años 1930 y
durante la Segunda Guerra Mundial a principios de los años 1940, pero no tuvo una influencia importante en la
psicología hasta el desarrollo del campo de la computación artificial.

K
Como vimos en nuestro análisis de los sistemas de toma de decisiones múltiples (Capítulo 6) y volveremos a
abordarlo en nuestro análisis del aprendizaje procedimental (Capítulo 10), hay algunas tareas que los individuos sí
77
La tarea se resuelve de forma aprenden. Obtener de repente la respuesta correcta (un momento “¡Ajá!”) es una señal de que una
gradual e incremental mediante el sistema deliberativo en lugar del sistema procedimental.
Machine Translated by Google

86 El sistema de toma de decisiones

inteligencia en la década de 1950. Allen Newell y Herb Simon desarrollaron los primeros
conceptos algorítmicos de búsqueda e inteligencia con su publicación del General Problem
Solver en 1959, el año en que murió Tolman.
La teoría de la información cuantifica la capacidad de una señal para ser extraída del ruido.
El algoritmo proporciona el concepto de que una secuencia de cálculos se puede vincular entre sí a
través de mecanismos de control para llegar a una conclusión que está oculta en los datos. Sin
embargo, una de las ideas más importantes fue la de la complejidad computacional, que se originó
con Turing. Ahora estamos familiarizados con los ordenadores que ejecutan algoritmos largos: todos
hemos visto ordenadores que funcionan a toda velocidad, el disco duro girando, calculando un
cálculo complejo. Antes de los conceptos de teoría de la información, algoritmo y computación, la idea
de que los resultados ocultos en los datos solo se podían encontrar después de cálculos que
inherentemente requieren tiempo para ser calculados no era apreciada.
Ahora sabemos que tanto Tolman como Hull tenían razón. Cuando se enfrentan a decisiones complejas
entre opciones similares o entre opciones cambiantes, se necesita un sistema flexible aunque sea
computacionalmente complejo, pero cuando se enfrentan a una decisión regular en la que la respuesta
correcta no cambia, los animales desarrollan hábitos de cadena de respuesta (secuencias de acciones).
82 En la práctica, el desempeño temprano en los laberintos se logra a menudo mediante procesos de
búsqueda deliberativa similares a los de Tolman, mientras que el desempeño posterior a menudo se logra
83
realizado mediante procesos de hábito estímulorespuesta similares a los de Hull. mediante procesos de
búsqueda deliberativa similares a los de Tolman. De hecho, si volvemos a mirar sus datos, Tolman estudió
cómo se aprendían los laberintos y concentró su análisis en el momento del aprendizaje temprano,
mientras que Hull estudió el "rendimiento asintótico" una vez que la conducta se había establecido en una
rutina regular. Ambos sistemas (el proceso de búsqueda computacionalmente costoso de Tolman y el
proceso de estímulorespuesta computacionalmente simple de Hull) son capaces de resolver tareas y
tomar decisiones. Sin embargo, cada sistema tiene ventajas y desventajas y se logra mediante un conjunto
diferente de estructuras cerebrales que interactúan. En el próximo capítulo abordaremos lo que se sabe sobre ese siste

Libros y artículos para lectura adicional •

Randy L. Buckner y Daniel C. Carroll (2007). Autoproyección y el cerebro.

Tendencias en las ciencias cognitivas, 11, 49–57 .
• Adam Johnson y David A. Crowe (2009). Revisitando a Tolman, sus teorías y
mapas cognitivos . Crítica cognitiva, 1 , 43–72 .
• Yael Niv, Daphna Joel y Peter Dayan (2006). Una perspectiva normativa sobre la motivación .
Tendencias en las ciencias cognitivas, , 375–381 .
10 • John O'Keefe y Lynn Nadel (1978). El hipocampo como mapa cognitivo . Oxford: Oxford
University Press .
Machine Translated by Google

Los hábitos de nuestra vida

Corriendo por un sendero de

montaña, un paso tras otro...

Vacía la mente
excepto el cielo azul arriba y las
rocas rojas debajo de nuestros pies.

Con suficiente experiencia, la selección de acciones se “almacena” o almacena en

pares estímulorespuesta y cadenas respuestaacción. La ventaja de este sistema es

que puede responder de manera rápida y confiable, con la misma secuencia de

acciones cada vez. La desventaja de este sistema es que es inflexible y cambia

lentamente en respuesta a condiciones cambiantes.

Los poetas suelen referirse a nosotros como “criaturas de hábitos”. Por la mañana nos levantamos a la misma hora,

tomamos el mismo café todas las mañanas, comemos los mismos cereales. Por la noche, queremos nuestro libro o
nuestra televisión antes de acostarnos. Todos hemos desarrollado nuestros propios hábitos a lo largo de nuestras vidas.

Estos hábitos no son instintos; no están programados genéticamente en nosotros.

En cambio, los hábitos se desarrollan a partir de la regularidad y la fiabilidad. Nos gustaría pensar que los hábitos se
desarrollan a partir de lo que individualmente hemos descubierto que es más útil para nuestras vidas, pero, por supuesto,

todos tenemos hábitos que nos gustaría abandonar. ¿Por qué desarrollamos malos hábitos? ¿De dónde surgen los hábitos?
¿Qué son los hábitos? ¿Por qué el camino que recorremos para ir al trabajo se convierte en un hábito, pero el que
A
recorremos para ir al aeropuerto no?
En esencia, los hábitos son secuencias de acciones que hemos aprendido a llevar a cabo. El ejemplo más simple

de hábito es el de conducir hasta el trabajo. La primera vez que conduces hasta el trabajo, necesitas usar un mapa,

seguir un GPS y prestar atención a la ruta que quieres tomar. Pero si conduces por esa ruta todos los días durante

semanas, meses o años, con el tiempo dejas de prestarle atención. Conduces hasta el trabajo incluso mientras estás

pensando en otra cosa.

A La respuesta obvia es que se conduce mucho más para ir al trabajo que para ir al aeropuerto (a menos que se trabaje
en el aeropuerto). Como saben muchos viajeros de negocios, con suficientes viajes al aeropuerto, el trayecto hasta el
aeropuerto también se convertirá en un hábito.

87
Machine Translated by Google

88 El sistema de toma de decisiones

Esto sugiere la trayectoria habitual del aprendizaje: los mecanismos flexibles y deliberativos predominan al principio
del aprendizaje, mientras que los mecanismos inflexibles y basados en los hábitos se desarrollan con la experiencia.
1
Pero, por supuesto, el control también puede pasar del hábito a la deliberación. 2 Cuando se

construyó el puente 35W, que era el conducto principal a través de los sistemas del Mississippi.
En 2007, el río que atravesaba Minneapolis colapsó y el tráfico tuvo que ser desviado por toda la ciudad. Esto cambió el
flujo de tráfico en mi ruta al trabajo y descubrí que la ruta que normalmente tomaba para ir al trabajo era mucho más
lenta que antes. Así que encontré una nueva ruta, que resultó ser más rápida, incluso después de que se construyó y

reabrió el nuevo puente.

Esta nueva ruta requiere girar a la izquierda en una determinada intersección. Sin embargo, incluso años después, si no
presto atención, sigo recto en esa intersección. En particular, si estoy pensando en otra cosa, como un examen que
tengo que hacer, un problema científico o incluso simplemente tratando de recordar que tengo que comprar leche de
camino a casa después del trabajo, sigo recto. Lo interesante de esto es que, por más distraída que esté con mis
pensamientos, nunca me he saltado un semáforo en rojo. Nunca he dejado de frenar a tiempo y nunca he chocado con
otro coche en esta intersección, a pesar de que es una intersección muy concurrida. Mi cerebro conduce de manera
fiable, pero no le presto atención.

¡Esto no significa que sea seguro conducir distraído! Se ha demostrado que conducir mientras se habla por el
teléfono móvil, incluso si es un teléfono con manos libres, cuadruplica la probabilidad de sufrir un accidente. 3
En particular, las distracciones sensoriales (como hablar o, peor aún, enviar mensajes de texto por el
teléfono móvil) interfieren en el procesamiento sensorial necesario para responder adecuadamente mientras se conduce.
Como veremos, existe una gran diferencia entre permitir que la mente divague para pensar en otras cosas y desviar la
atención de la carretera.
Esta diferencia se puede ver fácilmente al aprender a tocar un instrumento musical. Ningún músico intentaría tocar
una pieza compleja mientras ve la televisión o lee un libro: las señales sensoriales interferirían con la música. Sin
embargo, con la experiencia, los músicos se vuelven expertos en pensar cada vez menos en los detalles y cada vez más

en los aspectos artísticos de la música. Cuando se aprende a tocar un instrumento musical, al principio hay que pensar
en qué teclas están en cada lugar, qué combinaciones de teclas producen qué notas. Tocar una pieza musical de
principio a fin sin tocar una nota incorrecta a menudo significa hacer una pausa antes de cada nota para encontrar la
digitación correcta (lo que, por supuesto, arruina por completo el ritmo). Pero a medida que uno adquiere experiencia con
el instrumento, comienza a asociar las notas con las teclas, hasta que llega un momento en que ya no piensa en la
digitación de una nota determinada; en cambio, piensa "toca un sol" y sus manos simplemente hacen lo correcto. Esto le
permite concentrarse en las notas. Con el tiempo, a medida que aprendes una pieza musical, prestas cada vez menos
atención a cuál es la nota siguiente, lo que te permite dedicar tu cálculo mental a aspectos cada vez más complejos de
la música. Los músicos expertos con mucha experiencia con diferentes piezas y diferentes géneros pueden incluso crear

melodías musicales complejas en el momento (véase jazz, improvisación).

Computacionalmente, el aprendizaje de hábitos surge de dos procesos importantes: situación

Asociaciones de acciónB (SA) y procesos de fragmentación ( acciónacción , AA). Asociaciones SA

B
En la literatura psicológica, el aprendizaje de “situaciónacción” se conoce más a menudo como aprendizaje de estímuloacción.
4
aprendizaje de respuesta (SR), Pero, como hemos visto (Capítulo 6), los animales reaccionan a situaciones, categorizando

adaptaciones de estímulos, no de estímulos específicos. 5 (Discutiremos este tema con más profundidad en el Capítulo 12.)

Ciertamente, algunos estímulos son más importantes que otros para determinar la situación en cuestión, pero rara vez
una situación está definida completamente por un solo estímulo (fuera de una caja de pruebas psicológicas con animales

donde (continúa)
Machine Translated by Google

Los hábitos de nuestra vida 89

Son exactamente lo que parecen, recuerdos que han aprendido que en esta situación debes tomar
esta acción. 6
La fragmentación es el encadenamiento de secuencias AA, como si una secuencia de
sistema de “acción en caché”, porque ha almacenadoacciones 7 (El sistema de hábitos a veces se denomina
en caché o almacenado la acción a realizar. 8 En el Capítulo
6, 9 ) llamamos a este sistema “Procedural”, porque aprende y almacena procedimientos.
Es interesante observar que la mayoría de los ejemplos de conductas de tipo “estímuloreacción” que
suelen identificarse como “hábitos” son en realidad iniciaciones voluntarias más que respuestas: cuando se
enciende la luz, la rata empuja la palanca; cuando se le da el cigarrillo, el adicto lo fuma. Aunque el impulso
de ir al trabajo se convierte en un “hábito” automático y ya no requiere atención durante el proceso, sigue
siendo una acción voluntaria iniciada y controlada en todo momento. El sistema recupera una secuencia
voluntaria de acciones motoras y la libera en respuesta a una señal.
10

Así es exactamente como los atletas practican deportes. Un mariscal de campo que lanza un pase a un
receptor reconoce la situación, la evalúa y recupera una secuencia de acciones. No importa lo que digan
algunos fanáticos, nadie “obligó” al mariscal de campo a realizar el lanzamiento que llevó a la intercepción;
colocó “lanzar el balón” en el conjunto de acciones que estaba listo para hacer y luego interpretó mal la
cobertura. La toma de decisiones procedimental se entiende mejor en términos de preparación y
posibilidades : en cada momento, el agente está combinando situaciones hasta que aparece una que
coincide con una acción que se puede liberar. 11;C
La fragmentación es un proceso en el que los subobjetivos se almacenan como partes completadas
para que el proceso de planificación cognitiva pueda funcionar a un nivel más abstracto. 13 Así, el músico
experto no piensa: “para tocar un sol en este clarinete, necesito poner mis dedos en esta posición y soplar
con esta fuerza en la lengüeta”; en cambio, el músico simplemente “toca sol”. De hecho, los músicos
expertos a menudo fragmentan secuencias de notas en acordes y arpegios. De manera similar, un lanzador
de béisbol no piensa: “para lanzar la bola rápida, coloco dos dedos en las costuras de la pelota de béisbol y
tiro mi brazo hacia atrás, no te olvides de girar las caderas…”. En cambio, el lanzador experto simplemente
lanza la pelota de béisbol. Como el receptor Crash Davis (Kevin Costner) le dice al lanzador Ebby LaLoosh
,
(Tim Robbins) en la película Bull Durham: “No pienses, carne, simplemente lanza”. Este consejo es
fundamental porque pensar demasiado en el proceso altera tanto el componente de SA (porque obliga al
componente de deliberación a tomar el control) como el componente de fragmentación (porque está
trabajando a un nivel demasiado bajo). Como vimos en el Capítulo 9, la deliberación requiere una cantidad
variable de tiempo para llegar a la siguiente acción. Una secuencia de acciones confiable y fluida necesita
el sistema procedimental .
En el laboratorio, estas cuestiones se estudian con tareas como la tarea de tiempo de reacción serial
secuencial (SSRT, por sus siglas en inglés). En esta tarea, se coloca la mano del sujeto sobre un teclado y
15 Se le
simplemente se le indica que presione cada tecla tan pronto como aparezca la letra en la pantalla.
dice al sujeto que las letras aparecerán al azar; sin embargo, sin que el sujeto lo sepa, las letras
aparecen en una secuencia. La secuencia puede ser simple o complicada.

Sólo hay disponibles un par de estímulos muy discretos). Por lo tanto, prefiero el término “situación” a “estímulo”
(convenientemente, ambos comienzan con S). No tengo ningún problema con el término “respuesta” en sí, pero sigo
confundiendo la R en SR con “recompensa”, por lo que prefiero el menos ambiguo “acción”, lo que nos permite llamar
a esto aprendizaje SA.
En la literatura psicológica, esto se ha conocido históricamente como ventajas., porque cada situación
do

La acción “permite” (prevé, alienta) ciertas respuestas más que otras. 12

Machine Translated by Google

90 El sistema de toma de decisiones

determinista o probabilista. La clave es que la secuencia nunca se le dice explícitamente al sujeto. A

medida que las personas aprenden a reconocer la secuencia, comienzan a hacer movimientos
anticipatorios y su tiempo de reacción se acelera. Esto se puede probar explícitamente poniendo en
práctica una sesión de prueba de secuencia aleatoria en la que la secuencia de letras vuelve a ser
aleatoria. Los movimientos anticipatorios ya no son útiles; de hecho, uno tiene que deshacer la
preparación y el tiempo de reacción se ralentiza drásticamente.
Lo que resulta particularmente interesante de la tarea SSRT es que hay dos cosas potenciales
que uno puede aprender sobre la secuencia: uno puede aprender que había una secuencia y uno
puede aprender cómo responder a la secuencia. Para comprobar si el sujeto reconoció que había
una secuencia, simplemente preguntamos. Después, cuando se le pregunta, algunas personas
dirán: "Sí, había una secuencia" y otras dirán: "No, fue aleatorio". Para comprobar si el sujeto
aprendió a responder a la secuencia, medimos los tiempos de reacción. Si el sujeto muestra
movimientos anticipatorios y acelera para secuencias repetidas (y disminuye la velocidad en
respuesta a la sesión de prueba), entonces las acciones del sujeto en cierto sentido "conocen" la
secuencia (porque las acciones la están prediciendo).
Podríamos pensar que estas dos pruebas siempre deberían coincidir: si reconoces la secuencia,
tu tiempo de reacción se acelerará y si tu tiempo de reacción se acelera, entonces debes haber
reconocido la secuencia. Pero esto no es lo que se ve. Aunque muchas personas, de hecho,
informan de la secuencia después y muestran una aceleración del tiempo de reacción durante la
tarea, muchos sujetos no reconocen la secuencia explícitamente pero aun así muestran fuertes
efectos en el tiempo de reacción.16 Incluso hay sujetos que reconocen la secuencia pero no
muestran efectos en el tiempo de reacción.
17
En particular, los pacientes con enfermedad de Parkinson y
enfermedad de Huntington, que afectan ambas a los ganglios basales, a menudo reconocen la secuencia sin
mostrar cambios en el tiempo de reacción. Por el contrario, los pacientes con enfermedad de Alzheimer, que afecta
las capacidades de aprendizaje en el hipocampo y sus áreas relacionadas, a menudo muestran una aceleración
normal del tiempo de reacción pero una incapacidad para informar el reconocimiento de la secuencia. Esta
distinción se conoce a menudo como aprendizaje implícito frente a aprendizaje explícito , que se corresponde
estrechamente con las distinciones entre el aprendizaje procedimental y el declarativo, entre la toma de decisiones
basada en hábitos y orientada a objetivos, y los términos utilizados en este libro (entre el aprendizaje procedimental y el aprendiz
y toma de decisiones deliberativa ), todas las cuales parecen captar esta distinción fundamental entre
un aprendizaje revelado inconsciente y un proceso de aprendizaje consciente y explícito.
18

Las dos estructuras cerebrales más involucradas tanto en la fragmentación como en las asociaciones SA se
19
Los ganglios basales encuentran en el centro del cerebro de los mamíferos (debajo de la corteza, por lo tanto,
20
(también conocidos como “subcorticales”) y , en la base del cerebro, ambos son evolutivos.
21
el cerebelo son estructuras muy antiguas y se encuentran componentes similares en todos los vertebrados.

Los ganglios basales

El circuito de los ganglios basales es muy complejo. Dedicaremos algún tiempo a explorarlo en
este capítulo, pero, brevemente, hay dos vías a través de los ganglios basales: una fomenta las
acciones y la otra las inhibe (Figura 10.1). 22 (En realidad, hay tres Volveremos
23
vías a través de los ganglios basales; la tercera detiene una acción aprendida.
(Nos referiremos a esta tercera vía en el Capítulo 15 en nuestra discusión sobre el autocontrol y la
anulación de las acciones aprendidas). Las dos vías principales se pueden identificar por sus influencias.
Machine Translated by Google

Los hábitos de nuestra vida 91

excitatorio (+)
corteza hiper
tálamo inhibidor (–)
directo dopaminérgico

Directo camino

(¡detener!)
camino

(ir) Indirecto

cuerpo estriado camino

(no va)
STN

GPe

GPi
SNc
VTA
acciones motoras

Figura 10.1 Vías a través de los ganglios basales. Los ganglios basales son un circuito
subcortical que aprende a controlar las acciones motoras. Hay tres vías a través de él. (1) La
primera es una "vía directa" en la que la corteza excita el cuerpo estriado, lo que inhibe el globo
pálido interno (GPi). Debido a que las neuronas del GPi se activan tónicamente, inhibirlas libera
los circuitos de acción motora talamocortical y subcortical. (2) Una "vía indirecta" agrega un paso
inhibidor intermedio (globo pálido externo, GPe), que crea un triple negativo. (3) La tercera es una
"vía hiperdirecta", en la que el núcleo subtalámico excitador (STN) aumenta la activación en el
GPi, lo que detiene las acciones. El aprendizaje se produce en el cuerpo estriado a través de
entradas de dopamina que provienen del área tegmental ventral (VTA) y la pars compacta de la
sustancia negra (SNc).

sobre los sistemas de selección de acciones talámicos y corticales. La vía “ir”, que estimula las
acciones, inhibe las células que inhiben los sistemas de selección de acciones talámicos y corticales
(una doble negación, que estimula las acciones), mientras que la vía “no ir”, que desalienta las
acciones, añade un tercer paso de inhibición (una triple negación, que desalienta las acciones). La
tercera vía interviene en la última etapa, excitando directamente a las células que inhiben los
sistemas de selección de acciones talámicos y corticales (una única negación, que desalienta las acciones).
La primera vía, que alienta las acciones, reconoce los aumentos de dopamina, mientras que la segunda vía,
que desalienta las acciones, reconoce las disminuciones de dopamina. 24 (Recuerde que la dopamina es una
aumentoseñal donde los aumentos significan "eso fue mejor de lo que esperaba" y deberían conducir a un
en la disposición a realizar una acción, y las disminuciones significan "eso fue peor de lo que esperaba" y deberían
conducir a una disminución en la disposición a realizar una acción. Vea el Capítulo 4). Estos cambios en la
dopamina son reconocidos por diferentes receptores (prosaicamente llamados receptores D1 y D2). Esto significa
que ligeras diferencias en la genética pueden hacer que una persona aprenda más fácilmente de las recompensas
positivas (zanahorias) y otra aprenda más fácilmente de los castigos negativos (palos). 25

Esta diferencia sugiere que los cambios genéticos en estos receptores podrían cambiar la
capacidad de aprender de la información positiva o negativa. En un experimento notable, Michael
Frank y sus colegas descubrieron exactamente eso. 26 Desarrollaron una tarea en la que las personas
aprendieron a reconocer qué caracteres arbitrarios D probablemente conducirían a una recompensa y cuáles

D
En realidad, utilizaron caracteres hiragana japoneses . Es de suponer que los sujetos de experimentación
estadounidenses no los reconocieron.
Machine Translated by Google

92 El sistema de toma de decisiones

No era probable que lo hicieran. Mediante una elegante combinación de procedimientos de entrenamiento
y prueba, pudieron separar el aprendizaje de la información positiva (más probable que conduzca a una
recompensa) que de la negativa (menos probable que conduzca a una recompensa). Hicieron pruebas
mi
Se estudiaron los sujetos y se examinó un polimorfismo genético común genéticas en sus receptores D1 y
en los receptores D2. El polimorfismo en la vía del receptor D1 afectó la capacidad de las personas para
aprender de las señales positivas, mientras que el polimorfismo en la vía del receptor D2 afectó la
F
capacidad de las personas para aprender de las señales negativas.
Como también comentamos en el capítulo 4, la dopamina se relaciona principalmente con las
recompensas positivas (refuerzo), no con los castigos negativos (aversión). En ese capítulo, argumentamos
que debería haber una contraparte negativa de la dopamina que indique cuándo los castigos son peores
de lo esperado (aprender a no ir) y cuándo los castigos no son tan malos como se esperaba (alivio,
aprender a ir). Como señalamos en ese capítulo, actualmente no se sabe cuál es esa señal. En las últimas
décadas, se han sugerido dos posibles candidatos para esta antidopamina negativa: la serotonina y la
noradrenalina (también llamada noradrenalina). 28
Ambos neurotransmisores están relacionados químicamente con la dopamina (y por lo tanto son buenos
candidatos desde la perspectiva de que la evolución tiende a funcionar modificando los sistemas existentes)
y están definitivamente involucrados en la toma de decisiones.
La dopamina, la serotonina, la noradrenalina y otro neurotransmisor relacionado, la octopamina, son
sustancias químicas relacionadas que pertenecen a una familia llamada catecolaminas. 29 Las
catecolaminas desempeñan papeles interesantes en el aprendizaje y la toma de decisiones en varias
especies muy distantemente relacionadas. En los insectos, el componente positivo (refuerzo) es la
30
octopamina, mientras que la señal negativa (aversión) es la dopamina. La serotonina y la Dopamina,
octopamina también controlan la activación y la detención del movimiento (nadar, arrastrarse) en animales
simples como las sanguijuelas, los gusanos y las lampreas. 31 Esto sugiere
que el papel de estas catecolaminas en el estímulo y el desaliento de acciones tiene una larga historia
evolutiva. Sin embargo, todavía se desconoce cómo se relacionan los papeles que desempeñan estas
catecolaminas en estos otros animales con su papel en la toma de decisiones humana.
Experimentos recientes han descubierto que la serotonina está relacionada con la capacidad de
retener recuerdos a través de retrasos y con la perspectiva a largo plazo, pero que la serotonina no refleja
señales de error de predicción de valores negativos. 32 Por el contrario, la noradrenalina está implicada en el afecto

negativo, particularmente en la adicción a las drogas, como durante la abstinencia de opiáceos. 33

Las ráfagas de noradrenalina provocan pausas en la activación de las neuronas dopaminérgicas, que
hemos visto que reflejan decepción y reconocimiento de recompensas no entregadas. 34 Sin embargo,
otros investigadores han propuesto que la noradrenalina desempeña un papel en la atención y en las
un papel en la vigilancia y la atención.
representaciones
36 ) de incertidumbre. 35 (La dopamina también desempeña

mi
Toda especie tiene una distribución de cambios genéticos sutiles entre sus miembros; por eso no todos somos
idénticos. Son estas pequeñas diferencias las que constituyen la clave de la evolución, que modifica la distribución
de estas pequeñas diferencias a lo largo del tiempo. 27 Estas diferencias se llaman polimorfismos : poli

(múltiple) + morfismos (formas).

También probaron un tercer polimorfismo en un receptor de dopamina que afecta la corteza prefrontal. Este tercer polimorfismo afectó la capacidad de las

personas para responder a los cambios en la contingencia de recompensa. Como veremos más adelante en el Capítulo 12, la corteza prefrontal es importante

para la caja de reconocimiento de situaciones, en particular ante cambios, y estas señales de dopamina se utilizan para determinar cuándo uno necesita cambiar

de opinión sobre la situación en la que se encuentra.

Machine Translated by Google

Los hábitos de nuestra vida 93

Al igual que ocurre con la dopamina, es probable que tanto la serotonina como la noradrenalina transmitan señales
generales que puedan utilizarse de muchas maneras.
GRAMO

En la actualidad, en la neurociencia es objeto de controversia si los ganglios basales son en realidad los que
impulsan el movimiento o si simplemente influyen en las decisiones que se toman en la corteza. Lo más probable, por
supuesto, es que ambas teorías sean correctas y que las sugerencias de acción realizadas por los ganglios basales
se envíen tanto a las estructuras motoras profundas del cerebro (y luego a la médula espinal) como a los circuitos
corticales (que luego se proyectan de vuelta a esas mismas estructuras motoras profundas del cerebro y a la médula
espinal). 40

Corteza motora

¿Cómo pueden los circuitos corticales tomar decisiones? Las estructuras corticales de control motor categorizan las
41
entradas provenientes de las estructuras sensoriales. Las estructuras sensoriales están categorizando aspectos del
mundo, y esos aspectos se vuelven cada vez más complejos a medida que se alejan 42 (En la corteza visual primaria,
manchas de color, esquinas, etc. En las las "categorías" son realmente "características del mundo", puntos, líneas,
cortezas visuales secundarias y terciarias, se encuentran otras "características" hasta que se convierten en categorías,
como caras, casas, objetos, etc. De manera similar, la corteza auditiva primaria reconoce características del sonido, y
las áreas auditivas secundarias y terciarias reconocen el habla, las palabras, la música, los géneros musicales, etc.)
El resultado de una categoría de situaciones puede tratarse como una señal de acción.

43 En cierto sentido, esto puede considerarse como acciones de liberación : el mariscal de

campo levanta el brazo para lanzar y comienza a controlar a los receptores. Si encuentra uno que
está abierto (que su proceso de categorización identifica como un buen lanzamiento para hacer),
la corteza motora envía una señal a otras estructuras (incluidos los ganglios basales, el cerebelo
y las estructuras motoras profundas) para iniciar la acción de lanzar la pelota. Observe cómo
este mecanismo mantiene la decisión de iniciar o no la acción voluntaria dentro del sistema de
categorización cortical, pero la secuencia de acciones en sí no es parte de ese sistema. El
mariscal de campo ha dividido la decisión: la corteza motora determina "¿lanzar o no?", pero no
identifica los movimientos motores individuales que debe realizar.
Los modelos computacionales de la corteza sugieren que el proceso de categorización depende de iniciar una
44;H
en una red de células que “se conforman” con una decisión demasiado rápido en estos
45 Estudios de las respuestas corticales a la selección motora
respuesta, los modelos mostrarán la respuesta incorrecta.

G Esta cuestión se complica aún más por el hecho de que estos neurotransmisores tienen efectos en el cerebro
más allá del error de predicción de valores, 37 y que todos estos neurotransmisores también tienen efectos fuera del
cerebro. 38 La serotonina tiene efectos en el intestino y los intestinos. La noradrenalina tiene efectos en la frecuencia

cardíaca y la presión arterial. La dopamina y la noradrenalina afectan a los sistemas simpático y parasimpático
periféricos del cuerpo (sin relación con la emoción de la simpatía, por supuesto). Los sistemas simpático y
parasimpático funcionan en contradicción entre sí: el sistema simpático prepara al cuerpo para la actividad estresante
(lucha, huida y el acto de reproducción), mientras que el sistema parasimpático mantiene el cuerpo en una actividad
sin estrés (seguridad, descanso y relajación poscoital). 39 Los complejos y diversos efectos de una determinada
sustancia química sobre diferentes estructuras implican que los medicamentos a menudo tienen efectos secundarios
no deseados y complican la farmacología.
Los mecanismos computacionales de este proceso de asentamiento ( cuencas de atracción en memorias direccionables
por contenido ) se comprenden bien. En el Apéndice C se puede encontrar una discusión detallada de este mecanismo.
Machine Translated by Google

94 El sistema de toma de decisiones

Descubrimos que hay dos respuestas a las señales sensoriales en la corteza motora: una muy rápida (menos de
46
Respuesta de 50 milisegundos) y luego una respuesta más lenta (superior a 100 milisegundos).
La primera respuesta se produce a través de conexiones directas entre las cortezas sensoriales y motoras; la
segunda respuesta se produce a través de un camino más largo a través de más circuitos frontales. Por ejemplo,
cuando se les pide que se alejen de una señal, las neuronas corticales motoras inicialmente representan la
dirección hacia la señal, pero luego, influenciadas por la información procesada en los circuitos frontales
47
premotores, cambian su activación para reflejar la dirección de la acción.
Este problema se puede ver mejor en términos de la reacción a un derrape sobre el hielo. La primera

reacción que tiene la mayoría de las personas es frenar y girar contra el derrape, pero esto solo empeora las cosas.
De hecho, lo correcto en caso de derrape es disminuir la velocidad soltando el acelerador y luego girar hacia la
zona de derrape hasta recuperar la tracción. 48
Esto plantea un problema interesante con las interfaces cerebromáquina. Muchas personas han
argumentado que las interfaces cerebromáquina podrían acelerar los tiempos de reacción, pero parte de la
lentitud de los tiempos de reacción se debe a que el cerebro tiene que desarrollar la respuesta correcta.
Si se descodifica demasiado rápido la información de la corteza motora, se puede obtener una respuesta
errónea. Al igual que ocurre cuando se conduce durante un derrape, no se desea la primera reacción, sino la
reacción correcta, que a veces aparece en segundo lugar, solo después de que el cerebro haya tenido la
oportunidad de realizar un procesamiento adicional para encontrar la categorización correcta de la situación compleja.
También es importante recordar que estas categorías son en realidad dinámicas: aunque es más fácil
construir modelos computacionales de categorías como un valor estático, la corteza en realidad está encontrando
un camino a través de estas categorías. 49 Este camino es en realidad
una secuencia de categorías: mi camino al trabajo consiste en bajar primero por Roselawn, luego a la izquierda
en Hamline y a la derecha en Larpenteur... En cada punto, necesito ejecutar correctamente la conducta en dos
niveles diferentes: en un nivel, necesito ejecutar las acciones correctamente, detenerme en el semáforo cuando
está en rojo, avanzar cuando está en verde, no chocar con el coche que tengo delante, etc. Y en el otro nivel
(que suele denominarse nivel "superior" porque es más abstracto), necesito decidir el siguiente paso en nuestro
viaje: ¿hacia dónde giro en esta intersección? El objetivo de este capítulo es que, a veces, incluso esas
decisiones de nivel superior pueden ser inconscientes.
Sin embargo, incluso cuando decidimos conscientemente hacia dónde girar en una intersección, normalmente
no pensamos conscientemente “luz roja significa parar” o “luz verde significa seguir”. Esto es dividir en bloques
50 —Hemos almacenado el comportamiento en un fragmento para que podamos pensar
“girar a la izquierda”, no
“quitar el pie del freno, poner el pie en el acelerador, girar el volante”, etc. Un programador informático podría
decir que hemos compilado el proceso en una subrutina a la que podemos acceder fácilmente. Por supuesto, el
cerebro cognitivo todavía puede dividir estos bloques y controlar los componentes, como cuando intentamos
enseñar a alguien a conducir y decimos: “¡Es luz roja! ¡Para!” mientras pisamos a fondo el pedal imaginario del
lado del pasajero del coche.

En general, conducir es un gran ejemplo de este proceso de fragmentación. Recuerdo mis primeras
experiencias al volante de un coche, intentando calcular cuánta presión me atrevía a poner en el acelerador,
mientras el coche se lanzaba de repente hacia delante. O la forma nerviosa en que agarré el volante la primera
vez que entré en una autopista con coches que pasaban a toda velocidad a 112 kilómetros por hora. Otros
grandes ejemplos de este tipo de fragmentación son tocar un instrumento musical y caminar.
Caminar sobre dos piernas es en realidad una interacción compleja de equilibrio, movimiento hacia adelante
y control de uno mismo. Como cantó Laurie Anderson en su canción Walking and Falling de 1982 , “Estás
caminando. Y no siempre te das cuenta, pero siempre estás cayendo. Con cada paso te caes ligeramente hacia
adelante. Y luego te detienes para no caerte. Una y otra vez, estás caminando”.
Machine Translated by Google

Los hábitos de nuestra vida 95

“Caerse y luego detenerse para no caerse. Y así es como puedes caminar y caer al mismo tiempo…”
Cualquiera que observe a un niño pequeño dar sus primeros pasos puede ver lo complejo que es el proceso.

Cerebelo
La clave de estos comportamientos recopilados es el cerebelo, una fascinante estructura cerebral que se
encuentra en la parte posterior del cerebro, colgando sobre la médula espinal. En un cerebro humano, el
cerebelo parece un apéndice adicional que sobresale de la parte posterior del cerebro, pero de hecho el
cerebelo es una estructura evolutivamente mucho más antigua que la corteza. El cerebelo aparece por
primera vez evolutivamente en los vertebrados, y no ha cambiado su estructura básica desde los primeros
peces hasta los mamíferos. 51 (Debido a que el cerebelo es una estructura bulbosa distintiva, los cráneos de
muchos animales tienen bolsillos para acomodarlo. Por lo tanto, la ubicación del cerebelo se puede ver en
los fósiles de cráneos de animales antiguos, incluidos los peces e incluso los dinosaurios. 52 )

La estructura del cerebelo es fascinantemente simple y regular. 53 El

I
componente principal son las células de Purkinje, que tienen árboles dendríticos notablemente bidimensionales,
esparcidos en hojas como hojas de papel. Se apilan unas sobre otras como las páginas de un libro. Dos
entradas convergen en las células de Purkinje: las fibras paralelas y las fibras trepadoras. Curiosamente, al
igual que las salidas de los ganglios basales, las células de Purkinje son inhibidoras. La activación de las
células de Purkinje mantiene sus salidas hasta que las libera mediante una disminución repentina de la
activación.
El cerebelo parece una gran hoja de cálculo, con las fibras paralelas y las células de Purkinje alineadas
perpendicularmente. La otra entrada principal a las células de Purkinje son las fibras trepadoras, que trepan
por las células de Purkinje como la hiedra en un árbol y proporcionan una señal de enseñanza. Y las
54
conexiones Los errores en la suavidad de las acciones se transmiten a las células de Purkinje.
entre las fibras paralelas y las células de Purkinje se ajustan hasta que se reduce el error. 55

esta señal de aprendizaje es el experimento del prisma, realizado por un estudiante de 56 Un ejemplo clásico de

secundaria como parte de programas de divulgación de la neurociencia. En este experimento, se le da al sujeto un conjunto de

prismas que desplazan el mundo visual hacia un lado (por ejemplo, 20 grados a la izquierda). La persona intenta lanzar una

bolsa de frijoles a una canasta que se encuentra a unos pocos pies frente a él. Debido a que existe un desajuste entre el
mundo visual y las acciones motoras, el sujeto intenta lanzar una bolsa de frijoles a una canasta que se encuentra a unos pocos pies frente a

En el momento en que la persona está acostumbrada, lanza la bolsita de frijoles 20 grados hacia el lado
opuesto (hacia la derecha). En el transcurso de una docena de lanzamientos aproximadamente, el sujeto
ajusta su comportamiento para lanzar correctamente la bolsita al balde. Luego, cuando se quitan los prismas,
hay nuevamente un desajuste y la persona lanza la bolsita de frijoles 20 grados hacia el lado original (hacia
la izquierda). Nuevamente, en el transcurso de unos pocos lanzamientos (menos que antes), el sujeto
recupera la antigua asociación y puede golpear la canasta nuevamente. Estos cambios ocurren debido a
cambios de conectividad en el cerebelo.
En una feria de divulgación de neurociencia en una escuela secundaria local, una vez nos encontramos
con una persona que no mostró ningún efecto de los prismas al lanzar la bolsa de frijoles (aunque nunca había

I
Pronunciado “PURRkinjay” en honor a Jan Purkinje (1787–1869), un anatomista checo del siglo XIX.
quien notó por primera vez la hermosa estructura en abanico de las células de Purkinje.
Machine Translated by Google

96 El sistema de toma de decisiones

EspañolHabía usado prismas antes); acertaba a canasta en el primer intento, en todos los intentos. Al
principio nos sorprendió mucho, pero después nos enteramos de que era una estrella local del
baloncesto. Es de suponer que había enseñado a su sistema motor a lanzar en línea recta
independientemente de lo que le dijera su visión. Ya había identificado la distancia a la canasta antes
de ponerse los prismas. Sabía que estaba mirando hacia delante y no tenía que usar las señales
visuales para corregirlo. Ya había aprendido a lanzar a cierta distancia y ángulo. A través de una extensa
práctica, había desarrollado una acción motora compilada que le permitía acertar con fiabilidad a canasta.
El cerebelo parece estar involucrado en estas acciones motoras compiladas o agrupadas.
Caminar, conducir, tocar un instrumento musical... El cerebelo es la clave para cronometrar
57 Hay algunas pruebas de que el cerebelo también puede
acciones y secuencias motoras fiables.
compilar secuencias cognitivas, pero esto sigue siendo controvertido. 58 (Es mucho más difícil
medir una secuencia cognitiva que una secuencia motora). Sin embargo, que el cerebelo tenga un
papel en las secuencias cognitivas no debería sorprendernos. Las personas pueden, sin duda,
agrupar
mentales de la misma manera que lo hacen con las secuencias secuencias
motoras físicas.cognitivas

Resumen
En este capítulo, hemos visto dos formas de decisiones de acción arbitrarias: el almacenamiento en
caché de decisiones almacenadas en un nivel alto (abstracto) y la compilación de secuencias
motoras almacenadas en un nivel bajo (concreto). El primero utiliza los ganglios basales para
identificar el siguiente paso correcto y el segundo utiliza el cerebelo para cronometrar las secuencias
de acción motora. Pero ambos sistemas de control motor/toma de decisiones pueden contrastarse
con los otros tres sistemas que hemos estado discutiendo: los reflejos están cableados
(evolutivamente) en nuestro sistema, no pueden cambiar ni los estímulos sensoriales que los
desencadenan ni las acciones que realizan; los sistemas pavlovianos/emocionales no pueden
cambiar las acciones desencadenadas pero pueden aprender a asociar nuevos estímulos con ellas;
los sistemas deliberativos pueden decidir tomar acciones arbitrarias en respuesta a situaciones
arbitrarias, pero requieren una gran atención y tiempo computacional para procesarlas. La
compilación de secuencias de acción nos permite tomar decisiones sobre fragmentos de
comportamiento en lugar de preocuparnos por cada pequeño detalle. Y el almacenamiento en caché
de pares situaciónacción nos permite prestar atención a otros planes mientras tomamos incluso
acciones arbitrarias complejas en respuesta a estímulos complejos. En los próximos capítulos,
analizaremos los sistemas adicionales necesarios para comprender la máquina de toma de
decisiones humana (sistemas perceptuales, de reconocimiento de situaciones y de motivación), y
luego pasaremos a analizar cuestiones de interacción entre los sistemas (el equilibrio entre
exploración y explotación, y el proceso de autocontrol), antes de analizar las consecuencias del cerebro físico y

Libros y artículos para lectura adicional •

Rudolpho Llinas (2002). Yo del vórtice . Cambridge, MA: MIT Press. • Paul Cisek
y John F. Kalaska (2010). Mecanismos neuronales para interactuar con un mundo lleno de
opciones de acción. Annual Review of Neuroscience, 33. • Kenji Doya, 269–298 .
(1999). ¿Cuáles son los cálculos del cerebelo, los ganglios basales,
¿Y la corteza cerebral? Redes neuronales, 12 , 961–974 .
Machine Translated by Google

Integración de información

Hojas en el viento

¿O un leopardo en el bosque?
¡No tardes mucho en decidir!

Aunque nuestros sentidos reciben información física del mundo,

interpretamos esos sentidos en términos de los objetos del mundo: vemos
un árbol, sentimos el viento, oímos un pájaro. Interpretar esa información
requiere un proceso de integración que lleva tiempo. Podemos intercambiar
tiempo por precisión si es necesario.

Cuando miras una imagen (por ejemplo, de un rostro), tus ojos se mueven de un rasgo importante a
Al siguiente. 1 otro. En parte, necesitas hacer esto porque los fotorreceptores en el ojo humano están

más concentrados en el centro de tu retina que en la periferia, lo que significa que tu visión es más
precisa (tiene mayor resolución A ) cuando miras algo directamente. Cada pocos cientos de milisegundos,
tus ojos hacen otro viaje (hacen un movimiento sacádicoB ) a otra ubicación. En el transcurso de unos
pocos segundos o minutos, has integrado la información importante sobre la imagen para responder
cualquier pregunta que tengas. A dónde miras, durante cuánto tiempo miras y durante cuánto tiempo se
detienen tus ojos en cada punto dependen de las preguntas que estás tratando de responder sobre la
do
imagen.
Los estudios experimentales sobre la toma de decisiones a menudo dificultan el reconocimiento
2 Los
perceptivo de la información, lo que significa que hay que integrar la información a lo largo del tiempo.
estudios antiguos hicieron esto porque les permitía usar el tiempo de reacción para diferenciar entre

condiciones. Los estudios nuevos lo hacen porque les permite estudiar cómo se activan las neuronas.

A
Todos estamos familiarizados ahora con los problemas de resolución visual gracias a la industria de las cámaras digitales.
B
Rara vez somos conscientes de estos movimientos sacádicos, aunque, como la mayoría de los sistemas motores, pueden tomarse
bajo control consciente.
do
Es posible identificar información sobre el mundo sin mirarlo directamente (como sucedería si intentaras que alguien no se diera

cuenta de que lo estás mirando. Como los ojos humanos tienen esclerótica blanca, podemos saber hacia dónde está mirando otra

persona, una cuestión importante para las criaturas sociales). No mirar algo requiere más esfuerzo porque uno tiene que recopilar la

información de los sensores de la periferia con una resolución menor y porque uno tiene que inhibir la tendencia natural a hacer

movimientos sacádicos hacia ello.

97
Machine Translated by Google

98 El sistema de toma de decisiones

El proceso de toma de decisiones cambia a medida que el sujeto decide qué hacer. Es interesante que,
debido a esto, gran parte de la literatura neurocientífica sobre la “toma de decisiones” se centre en el
reconocimiento de situaciones, más que en la deliberación o en otros procesos de selección de acciones que
hemos estado analizando. En estas tareas perceptualmente difíciles (que analizaremos en detalle más
adelante), lo difícil es reconocer en qué situación las señales implican que uno no está decidiendo qué hacer.
Cada situación tiene un único resultado correcto. (Compare esto con los ejemplos que analizamos en el
Capítulo 9 cuando hablamos de personas que deliberan sobre opciones laborales o sobre grandes compras como automóv
Sin embargo, la categorización perceptiva es una parte clave del proceso de toma de decisiones, y estas
tareas perceptualmente difíciles nos han enseñado cómo integramos la información a lo largo del tiempo.

Modelos de carrera hacia el umbral

Desde el punto de vista computacional, la integración de información se entiende más fácilmente en

términos de los modelos de carrera hacia el umbral . 3 En estos algoritmos, utilizados originalmente por
Alan Turing y los Aliados para descifrar el código Enigma alemán en la Segunda Guerra Mundial, se mide
el peso de la evidencia para cada posibilidad, y cuando el peso de la evidencia se vuelve abrumador para
una posibilidad sobre las otras (cuando el peso de la evidencia para una posibilidad alcanza un umbral),
esa elección gana y se toma la decisión.
Veamos primero el caso de una decisión forzada de dos opciones. Una decisión forzada de
dos opciones es aquella en la que se debe tomar una decisión entre dos opciones. No hay una
tercera opción; no elegir la primera opción equivale a elegir la segunda. Podemos medir cuánto
mejor es una opción que la otra midiendo la relación entre el peso de la evidencia a favor de una
opción y el peso de la evidencia a favor de la otra opción.
Es conveniente utilizar la relación de probabilidades porque cualquier ventaja para un lado es equivalente
a una desventaja para el otro lado.
Algunos lectores pueden reconocer esto como una razón de probabilidades., 4 que normalmente se escribe como 1:X,
donde X mide cuánto mejor es la segunda opción que la primera. Sin embargo, estas razones de
probabilidades requieren muchas divisiones y que representemos nuestro número desde 0 (1:infinito) hasta
infinito (infinito:1). Una mejor opción es tomar el logaritmo de esta razón.
La ventaja de los logaritmos es que multiplicar dos números equivale a sumar

Se podría decir que Alan Turing (19121954) salvó el mundo. Turing dirigió el equipo de descifrado de
códigos en Bletchley Park, Inglaterra, que descifró los códigos nazis. Los alemanes habían desarrollado un
código que era tan complejo que creían que era indescifrable. Se basaba en una máquina, llamada Enigma , que
mensaje constaba de tres diales. La persona escribía un mensaje en la máquina y la máquina codificaba el
carácter por carácter en función de los diales. Los diales se configuraban de una manera específica cada día,
por lo que el equipo de descifrado de códigos tenía que descifrar el código de cada día de nuevo. Pero una
máquina capturada proporcionó a los Aliados el conjunto de diales posibles. Incluso si no conocían la
configuración para ese día, conocían los parámetros y podían calcular la probabilidad de que un mensaje
determinado viniera de una configuración de dial determinada. Debido a que se enviaban miles de mensajes
cada día, Turing y su equipo podían integrar la información entre estos mensajes. Midieron el peso de las pruebas
para cada escenario y se detuvieron cuando alcanzaron un umbral. Aunque no descifraron el código todos los
días, lo hicieron con la suficiente frecuencia como para poder leer las órdenes alemanas y saber lo que los
alemanes iban a hacer. Los alemanes pensaron que la Enigma era impenetrable y continuaron enviando
mensajes a través de ella hasta el final de la guerra. Tanto el libro de historia de no ficción de David Kahn, The
CodeBreakers, como la novela de ficción de Neal Stephenson, Cryptonomicon, cuentan esta historia con detalles maravillosam
Machine Translated by Google

Integ rating En formaci ón 99

sus logaritmos; de manera similar, dividir dos números es equivalente a restar sus logaritmos. El logaritmo es
una función que traduce esta razón en un número desde menos infinito hasta más infinito. (Esto resulta ser la
cantidad de información que hay para apoyar una hipótesis sobre la otra). Cuando las dos opciones son
iguales, esta diferencia entre los logaritmos es cero, y la diferencia se aleja de cero a medida que reunimos
información. Esto nos permite definir el peso de la evidencia de elegir izquierda o derecha como un solo
número (mayor que cero significará ir a la izquierda, menor que cero significará ir a la derecha).
,
Simplemente comenzamos desde cero e integramos nuestra información a lo largo del tiempo, moviéndonos
hacia arriba con evidencia para la primera opción y hacia abajo con evidencia para la opción alternativa.

Esto nos deja con tres parámetros importantes. En primer lugar, tenemos la pendiente , que es cuánto
debemos cambiar nuestra proporción con cada pieza de información que respalde una hipótesis sobre la
mi
otra. En segundo lugar, el sesgo determina desde dónde comenzamos nuestra decisión.
Finalmente, en tercer
,
lugar, está la condición de detención , que puede ser tomar la mejor opción después de un cierto tiempo o
(más comúnmente utilizada en la literatura experimental) la razón de probabilidades, donde decidimos que
tenemos suficiente información, es decir, cuando nos hemos desviado de cero (las dos opciones son iguales)
a un cierto umbral (una opción es mucho mejor, nos quedaremos con esa).
Considero que el modelo de carrera hacia el umbral es sumamente intuitivo, ya que implica sopesar los
pros y los contras de dos opciones y detenerse cuando estamos convencidos de que una opción es mejor que
la otra. Los parámetros primarios son aquellos que tienen sentido intuitivamente: el sesgo.
es nuestra preferencia por una opción sobre la otra, la pendiente es la rapidez con la que aprendemos sobre
las opciones y el umbral es qué tan seguros queremos estar antes de comprometernos con una opción.
El modelo de integración al umbral produce una distribución única de tiempos de reacción debido a la
forma en que ocurre la integración (Figura 11.1). 5 Resulta que está relacionado
con lo que en el campo de la ingeniería se conoce como función de riesgo : ¿cuánto tiempo pasará
antes de que algo suceda?, dado que dejamos de contar la primera vez que sucede. Esto se utiliza,
por ejemplo, para medir la primera vez que algo se estropea y debe repararse (como un avión). 6
También rastrea la física de una señal ruidosa que cruza una barrera de energía. 7
Imaginemos que las palomitas de maíz están en una máquina de aire caliente. Tenemos dos casos de una
función de “riesgo” aquí. Primero, las palomitas de maíz están rebotando, y algunas de ellas tendrán el rebote
suficiente para salir y cruzar el umbral de la máquina por sí solas. Cuanto más aire sopla, más rebotan las
palomitas de maíz (más aire = pendiente más rápida; salir de la máquina = cruzar el umbral). Segundo, el
calor en la máquina hace que el agua dentro de cada grano de palomitas de maíz se expanda; en algún
momento el agua se expande lo suficiente y hace estallar el grano (más calor = pendiente más rápida; grano
que explota = cruzar el umbral). Si la primera función de riesgo ocurre antes que la segunda, obtienes granos
sin explotar en tu tazón.
Estas teorías se han probado explícitamente en varios paradigmas experimentales.
F
El más simple es el paradigma del “ruido visual” o “nieve televisiva”. En este paradigma, el
sujeto mira fijamente una pantalla negra en la que se dibujan puntos brillantes. Algunos de esos puntos

mi
Curiosamente, la palabra inglesa “bias” tiene dos significados relacionados. Puede significar la
expectativa inicial, una suposición hecha antes de reunir información. En segundo lugar, puede significar una
preferencia por una cosa sobre otra, en particular cuando uno responde sin integrar adecuadamente la información.
Como señala Jan Lauwereyns en The Anatomy of Bias , en realidad son lo mismo: un estereotipo es una
expectativa inicial (a menudo errónea) que no está dispuesta a cambiar ante información adicional.
F
La mayoría de los televisores (y todos los monitores de computadora que muestran señales de televisión) son digitales en la

actualidad, pero los televisores más antiguos recibían señales analógicas. Los televisores analógicos que no estaban sintonizados con

una señal (continuación)

Machine Translated by Google

100 El sistema de toma de decisiones

70 fin
¡Entiendo!
¿acumulación?
Límite
alto
60 coherencia

medio
Acumulando 50 coherencia
evidencia
¿Comenzar la bajo
acumulación? coherencia
40
Inicial

Velocidad
disparo
(picos/
de
s)
inclinación

20
0 200 400 –200 0
alineado a alineado
inicio del movimiento Tiempo (ms) para sacar

Figura 11.1 Integración hasta el umbral. (Izquierda) Los acumuladores múltiples comienzan con un sesgo inicial
y cada uno avanza hacia el umbral integrando la evidencia acumulada a una velocidad diferente. El primero en
alcanzar el umbral gana y la percepción colapsa a la decisión. (Derecha) Las neuronas individuales en LIP
integran la información. Todos los ensayos comienzan con velocidades de activación similares (no hay sesgo inicial)
y terminan con las mismas velocidades de activación (al alcanzar el umbral), pero se integran a diferentes
velocidades según la coherencia de la señal sensorial entrante.
Panel derecho de Gold y Shadlen (2002), rediseñado a partir de Roitman y Shadlen (2002).
Reimpreso con permiso del autor y el editor.

desaparecen en el instante siguiente. Otros puntos se mueven en una dirección aleatoria. Pero algunos de los puntos

Los puntos se mueven juntos en una dirección dada (por ejemplo, hacia la izquierda). El objetivo es averiguar en qué
dirección va el subconjunto de puntos coherentes. Al variar la proporción de puntos que se mueven en la misma
dirección, el experimentador puede controlar cuantitativamente la velocidad a la que se proporciona información al
sujeto. Tanto los humanos como los monos son notablemente sensibles incluso a proporciones muy pequeñas,
pudiendo reconocer fácilmente tan solo el 10% de los puntos que se mueven en la misma dirección. 8

Esta tarea depende de la capacidad de los primates para detectar el movimiento. El cerebro quiere detectar
cosas que se mueven por dos razones. En primer lugar, si te mueves, todo el mundo que ves se mueve en sincronía
(este es el secreto de las ilusiones de movimiento que pueden producir las películas IMAX). Pero, en segundo lugar,
el cerebro quiere detectar otras cosas que se mueven en el mundo.
capacidad de detectar cosas que se mueven depende de una estructura cerebral llamada MT, que tiene G que La
yo
células que detectan cosas que se mueven en el mundo visual, y una estructura llamada LIP, que tiene células que
tienen curvas de ajuste a una dirección dada y aumentan su tasa de disparo.

Muestran una mezcla aleatoria de puntos blancos y negros que se denominaba “nieve”. Las señales de movimiento visual que
se muestran en el paradigma del ruido visual se parecen mucho a este ruido de televisión analógica.
G La estructura ahora se conoce únicamente por su acrónimo “MT”, pero en un tiempo este acrónimo
significaba corteza temporal medial (que significa “en el medio” [medial] de la corteza temporal). La corteza
temporal está ubicada debajo del resto del cerebro. En la literatura temprana, MT también se conocía como V5, ya
que fue la quinta área cortical visual descubierta. 9
yo
Nuevamente conocido por sus siglas (LIP), pero refiriéndose a la corteza intraparietal , Porque se sienta
10
lateral en la pared interna de uno de los surcos de la corteza parietal.
Machine Translated by Google

Integ rating En formaci ón 101

I
con el tiempo, mientras el mono observa la pantalla. (Hay una estructura cercana llamada MST, que detecta el primer

caso, donde todo el mundo visual se mueve, generalmente porque te estás moviendo dentro de él). Las características del

mundo detectadas por las células en MT son buenas para detectar animales y objetos en movimiento. Imagine, por ejemplo,

un animal camuflado (como un leopardo) moviéndose a través de un bosque. La mayoría de los puntos que ve parpadearían

con el viento, pero algunos de ellos (¡el leopardo!) se moverían de manera confiable en la misma dirección juntos.

Las células MT proporcionan información sobre la dirección de esos puntos en movimiento: la velocidad de disparo de

cada célula tiene una dirección preferida y el disparo de esa célula refleja la proporción de puntos que se mueven en esa

dirección contra un fondo estático. 11 (Las células MST también tienen

una velocidad de disparo preferida de 12 ) y reflejan el movimiento de toda la pantalla.

Las células LIP parecen estar integrando la información. (MT proyecta directamente a LIP).

La tasa de disparo inicial de una célula LIP refleja las predicciones iniciales del mono sobre si los puntos se moverán en la

dirección favorita de esa célula o no (el sesgo), la velocidad a la que aumenta el disparo refleja la información que viene de

MT (la pendiente), y cuando las células LIP alcanzan una cierta tasa de disparo, el animal reacciona (alcanzando el umbral).

13 Podemos pensar en esta decisión como controlada por dos neuronas, una que busca el movimiento hacia la izquierda y
otra que busca el movimiento hacia la derecha.

El primero en llegar al umbral gana, y esa es la decisión tomada.

Ahora que hemos visto cómo esta idea de integración al umbral puede funcionar con dos

En cuanto a las opciones, es fácil imaginar cómo funcionaría con más opciones. 14 Por ejemplo, dudo que los monos Para
hayan evolucionado para elegir si los puntos iban hacia la izquierda o hacia la derecha. Es más probable que estos

experimentos estén aprovechando un sistema que evolucionó para detectar la dirección (cualquier dirección) en la que se

movía un objeto camuflado. En lugar de dos neuronas, tenemos cientos o miles de neuronas que representan una gama de

posibilidades, cada una integrando la información y cada una corriendo hacia el umbral.

Esto es algo llamado red del tipo "el ganador se lo lleva todo" y surge de un modelo simple que combina células

excitadoras e inhibidoras (células que aumentan la activación de las células a las que envían axones y células que

disminuyen la activación de las células a las que envían axones).

Se supone que las células excitadoras están conectadas de tal manera que las células que representan cosas similares

(por ejemplo, direcciones similares) se apoyan entre sí, mientras que las células que representan cosas diferentes (por

ejemplo, direcciones separadas 180 grados) no lo hacen. 15 Las células inhibidoras funcionan como una simple

retroalimentación negativa, de modo que la actividad total en las células excitadoras debe permanecer constante. Esta red
se examinó por primera vez en la década de 1970 como un modelo de corteza, y resulta ser un modelo muy razonable de

muchos aspectos de la corteza. El trabajo matemático en la década de 1980 mostró que el estado final estable de esta red

es un acuerdo entre las células excitadoras, con un subconjunto de células que están de acuerdo con un cierto resultado

que tienen todas altas tasas de activación y células que no están de acuerdo con ese resultado que tienen bajas tasas de

activación.
Esta red se utilizó en los años 90 como modelo del sentido de orientación y de ubicación de las ratas (células de ubicación

en el hipocampo) y como modelo de la corteza cerebral. Funcionalmente, estos modelos son un caso especial de las

memorias direccionables por contenido.

Se analiza en el Apéndice C.

I
Nuevamente conocido enteramente por su acrónimo (MST), pero que alguna vez significó temporal superior medial , y
corteza“superior” significaba “encima”.
Machine Translated by Google

102 El sistema de toma de decisiones

Percepción paralela y serial

Un radar que recorre el cielo en busca de aviones que se aproximan es una percepción en serie .
Sólo puede ver una dirección a la vez; cada dirección se comprueba secuencialmente. Una
cámara analógica percibe la luz en paralelo , y cada sustancia química que detecta la luz en la
placa fotográfica reacciona al mismo instante. (Las cámaras digitales utilizan una combinación de
procesamiento paralelo y serial. Cada dispositivo acoplado a la carga en cada píxel de la cámara
detecta la luz al mismo tiempo [integrando los fotones durante el tiempo que el obturador está
abierto], pero luego los píxeles suelen leerse en la memoria en serie). Nuestros sistemas
perceptivos utilizan una combinación de procesamiento paralelo y serial, pero el paso paralelo
16
generalmente va mucho más allá que los detectores de luz simples.
Resulta útil examinar este procesamiento paralelo y serial en la visión. La luz es detectada por
la retina, que funciona de una manera masivamente paralela, como los píxeles de nuestra cámara
digital, integrando los fotones que llegan a nuestros ojos. Desde allí, las señales se envían al
tálamo y luego a la corteza visual primaria, que contiene detectores de características, en particular
para puntos, líneas y bordes. Cada uno de estos detectores de características se repite para cada
parte del campo visual, como si fuera para los píxeles de nuestros ojos. Desde allí, las señales se
envían a muchos sistemas visuales diferentes, que intentan extraer información de la señal en
paralelo. Un sistema, por ejemplo, intenta identificar objetos, otro intenta identificar caras, etc.
Otro reconoce objetos que se mueven a través del campo visual (MT).
El experimento clásico que examina la diferencia entre la percepción paralela y serial es el
experimento de la salida (Figura 11.2). 20 Su objetivo en esta tarea es identificar un determinado
objeto (el objetivo) en un campo de distractores. Cuando el objetivo es realmente diferente de los
distractores ( O en un campo de X ), el objetivo parece salir y la velocidad a la que sale es mayor.

xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx XXXXXXXXOX
xxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxx xxxxxxxxxxxx
xxxxxxxx incógnita XXXXXXXXXXXX X
Figura 11.2. Aparece en la pantalla. Intente encontrar la Y en el panel izquierdo y la O en el
panel derecho. Es mucho más fácil encontrar la O porque aparece en la pantalla, mientras que la
Y requiere una búsqueda en serie en la pantalla. Por supuesto, una vez que sepa dónde buscar,
tanto la Y como la O son fáciles de encontrar.

Los humanos hemos desarrollado áreas especializadas de la corteza para reconocer rostros. 17 Por eso
vemos rostros en todas partes (como en los tonos de luz y oscuridad de la luna vista desde la Tierra). Algunas
personas tienen una dificultad particular con esto, que es un trastorno llamado prosopagnosia18 (de prosopon
[ πρ ó σωπον, Griego para cara] y agnosia [ αγνωσíα ; a, α no + gnosis , γνωσις, conocer]). personas con
prosopagnosia tienen que depender de características de identificación (un peinado distintivo o modo de vestir) para
identificar a las personas. Markos Moulitsas describió su prosopagnosia en su blog "Daily Kos", y señaló su incapacidad
para ver películas de guerra (como Salvar al soldado Ryan ) o películas de la mafia (como El Padrino ) porque todos
19
tienen el mismo corte de pelo y están vestidos de la misma Aunque no se sabe qué causa la pros
manera. opagnosia, Doris Tsao descubrió recientemente que uno de los monos que estaba estudiando no tenía actividad
selectiva de caras en su corteza y mostró una incapacidad para reconocer caras, muy similar a las personas con
prosopagnosia, por lo que sabemos que esto también puede ocurrir naturalmente en otros primates.
Machine Translated by Google

Integ rating En formaci ón 103

El tiempo que tarda en encontrar el objetivo no depende de la cantidad de distractores (porque tiene
diferentes detectores de características para el objetivo y los distractores y puede hacer que el detector
de características se sintonice con el objetivo y lo registre cuando lo encuentre). Cuando el objetivo es
muy similar a los distractores ( Y en un campo de X ), debe verificar cada uno individualmente. Esto
significa que el tiempo que le toma encontrar el objetivo depende de la cantidad de distractores. Para
el reconocimiento paralelo (emergencia), su precisión es independiente del tiempo que le toma
responder. Sin embargo, para el reconocimiento en serie (búsqueda entre candidatos), cuanto más
tarde en responder, más preciso será (hasta cierto punto cuando haya reunido toda la información
disponible). Esto significa que existe una clara compensación entre velocidad y precisión para el
reconocimiento en serie.

Los expertos y el equilibrio entre velocidad y precisión

El modelo de carrera hacia el umbral proporciona una buena explicación del equilibrio entre velocidad
y precisión en la búsqueda en serie. 21 Si el agente que utiliza un algoritmo de carrera hacia el umbral
quiere responder más rápido, simplemente reduce el umbral. Un umbral más bajo significa que la
carrera termina más rápido (por lo que el agente responde más rápidamente), pero con el umbral más
bajo, el agente ha tenido menos tiempo para analizar la información y, por lo tanto, será más susceptible
al ruido. De manera equivalente, el agente puede aumentar la pendiente. En ambos casos (reducir el
umbral o aumentar la pendiente), con cada pequeña pieza de información que recopile, se acercará al
umbral más rápidamente. Aumentar la pendiente y disminuir el umbral son matemáticamente
equivalentes. Por otro lado, mover su punto de partida más cerca del umbral es diferente: eso es mover
su sesgo, adivinar antes de que llegue la información. Si mueve su sesgo por encima del umbral, ni
siquiera tiene que esperar la información, ¡podría simplemente tomar la decisión sin información!
(Sospecho que esto es más común de lo que debería ser).

Ciertamente, es posible que en algunas tareas hayas reunido toda la información posible, que en
algún momento no haya nueva información disponible y hayas llegado a lo que matemáticamente se
llama una asíntota . En esos casos, esperar más tiempo no empeorará
tu decisión, pero tampoco la mejorará.
En algún momento hay que actuar. Sin embargo, en los experimentos psicológicos con datos ambiguos
y ruidosos (como el experimento de la nieve en la televisión descrito anteriormente), siempre es mejor
esperar y existe un equilibrio entre velocidad y precisión.
Entonces, ¿por qué los expertos pueden actuar con rapidez? ¿Cómo hicieron Ted Williams o Tony Gwynn para pegar cerca de la
K
El 40% de los lanzamientos que se les pelota? Se necesitan unos 400 milisegundos para que una pelota de béisbol
yo
lanzan desde el montículo del lanzador hasta el llegue a la pelota. Dado que el tiempo de reacción humano (incluso para los
23
plato de home. Los atletas más rápidos) tardan Uno tiene sólo un par de cientos de milisegundos.
unos 200 milisegundos (un par de décimas de segundo) en integrar la información sobre cómo gira la
pelota, dónde va a cruzar el plato y cuándo va a estar allí. Los jugadores con mejores tiempos de
reacción tienen mejores promedios de bateo.

K Ted Williams y Tony Gwynn fueron dos de los mejores bateadores de todos los tiempos, llegando a base un promedio de 48,4% y 38,8% del tiempo, con

promedios de bateo de por vida de 0,344 (34,4%) y 0,338 (33,8%) respectivamente.

yo
Un lanzamiento de 100 millas por hora que recorre 60 pies y 6 pulgadas demora aproximadamente 400 milisegundos.
Machine Translated by Google

104 El sistema de toma de decisiones

Los expertos tienen dos ventajas sobre los no expertos: han entrenado su sistema perceptivo para reconocer
mejores características de la tarea y han entrenado su sistema de hábitos para almacenar en caché las opciones
más fiables sobre qué hacer. El entrenamiento perceptivo es como la fragmentación que vimos en el capítulo 10.
Los expertos han aprendido a representar la tarea de tal manera que sea más fácil determinar las respuestas
correctas a partir de las entradas disponibles; han identificado buenas categorías para la tarea. Los ejemplos
clásicos de esto son el ajedrez y los videojuegos. Ya hemos visto cómo un algoritmo de búsqueda computacionalmente
costoso puede vencer a un gran maestro de ajedrez (Deep Blue contra Gary Kasparov), pero que los grandes
maestros de ajedrez en realidad no hacen esa misma búsqueda computacionalmente costosa. 24

En cambio, los grandes maestros del ajedrez han aprendido a representar el tablero de maneras que limitan la
búsqueda que tienen que hacer. El experimento que demostró esto fue que los maestros del ajedrez son mejores a
la hora de recordar las posiciones de las piezas en los tableros cuando esas posiciones pueden surgir de
movimientos legales que cuando no pueden. Así como un músico experto ya no piensa en la digitación de un
acorde en una guitarra, un maestro del ajedrez ya no mira cada pieza del tablero como algo individual. Jugar a
videojuegos produce una pericia específica similar:
reconocimiento más rápido de los eventos del juego (entrenamiento de sistemas de reconocimiento perceptivo,
este capítulo) y reconocimiento más rápido de qué hacer en respuesta a esos eventos (entrenamiento de sistemas
procedimentales, Capítulo 10). 25
Es importante reconocer que esto no significa que la “intuición” sea mejor que el “análisis”, incluso para los
expertos. Los verdaderos expertos pasan de decisiones intuitivas a decisiones analíticas (de procedimentales a
deliberativas) según sea necesario. De manera similar, es importante reconocer que la intuición pura no es
confiable en estas situaciones: los expertos han pasado años (¡a menudo décadas!) entrenando sus sistemas
perceptuales y procedimentales. En cierto sentido, lo que hace el sistema de toma de decisiones procedimental que
examinamos en el Capítulo 10 es intercambiar tiempo perceptual y deliberativo durante la decisión por tiempo
durante el entrenamiento, de modo que, si bien lleva más tiempo aprender a hacer la tarea, una vez entrenada, la
tarea se puede hacer más rápidamente, aunque con menos flexibilidad. Las estimaciones típicas del tiempo de
entrenamiento para la mayoría de las tareas de nivel experto humano son de aproximadamente 10.000 horas. 26
(Eso es cinco años a 40 horas por semana durante 50 semanas por año, o cuatro años a 50 horas por semana
durante 50 semanas por año). Es por eso que la mayoría de los aprendizajes, como la escuela de posgrado, la
METRO

escuela de medicina, el tiempo en las ligas menores, etc., duran aproximadamente de cuatro a seis años.
Es importante reconocer que lo opuesto de “analítico” no es “intuitivo”. Tanto la toma de
decisiones analítica (deliberativa) como la toma de decisiones intuitiva (procedimental) surgen de
sistemas que han evolucionado para tomar decisiones precisas frente a la integración de
información. Lo opuesto de “analítico” es “simplista”, bajar el umbral hasta el punto de que no se
obtiene información (o mover el sesgo por encima del umbral), dos cosas que son desastrosas.
De hecho, tanto las respuestas analíticas como las intuitivas muestran disyuntivas entre velocidad
y precisión. Una clave del éxito de Tony Gwynn es que utilizó un bate muy ligero y esperó hasta
el último momento para golpear la pelota. 27 Una de las grandes diferencias entre Ted Williams,
Tony Gwynn y el resto de nosotros es que Williams y Gwynn tenían una vista mucho mejor.
Cuando Tony Gwynn se retiró, le comentó a un reportero que sus ojos se estaban deteriorando y que no podía
tomar la pelota tan pronto como antes. Cuando el reportero le preguntó cómo era su vista ahora, Gwynn respondió
que ahora era de aproximadamente 20/15, pero en un momento

Esto , por supuesto, nos recuerda el viejo chiste: nuestro protagonista bien vestido detiene a un transeúnte en una
calle de la ciudad de Nueva York y le pregunta: "¿Cómo llego al Carnegie Hall?" La respuesta inevitable: "¡Práctica,
mucha práctica!"
Machine Translated by Google

Integ rating En formaci ón 105

El tiempo había sido 20/10. Con una mejor vista, pudo captar la rotación de la pelota antes,
lo que le dio más tiempo para reaccionar, más tiempo para integrar la información y una
mejor oportunidad de golpear la pelota.

Libros y artículos para lectura adicional

• Jan Lauwereyns (2010). La anatomía del sesgo . Cambridge, MA: MIT Press. • Joshua
I. Gold y Michael N. Shadlen (2002). El banburismo y el cerebro: descifrando la relación entre los
estímulos sensoriales, las decisiones y la recompensa. Neuron, 36
, 299–308 .
• Joshua I. Gold y Michael N. Shadlen (2007). La base neuronal de la toma de decisiones. 535–574.
Revista anual de neurociencia, 30,
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Las historias que contamos

La piedra de arriba te pesa, la tensión en

tu voz te delata.

Los brazos humanos son

débiles pero nuestras piernas

son fuertes y nos levantarán.

Tanto la toma de decisiones deliberativa como la procedimental requieren el

reconocimiento de la “situación” en la que nos encontramos. El reconocimiento
de la situación es un proceso de categorización en el que reconocemos que este
momento comparte similitudes con situaciones anteriores que hemos experimentado
y es diferente de otros. Aunque existen modelos de procesos estáticos de
reconocimiento de situaciones, en realidad, el reconocimiento de situaciones debe
tratarse de reconocer secuencias de eventos (narrativas). Los mecanismos
neuronales subyacentes a la narrativa siguen siendo desconocidos.

Los experimentos de psicología animal suelen realizarse en entornos en los que no hay señales. Una rata en una
caja pequeña con nada más que un agujero para meter la nariz y tal vez unas cuantas palancas para empujar, o un
mono en una silla pequeña frente a una pantalla en blanco, tienen pocas opciones entre las que elegir.
Cuando suena el tono y se entrega comida al puerto de alimentación, no hay mucha ambigüedad sobre cuál era la
nueva señal. Cuando sucede unas cuantas veces más, el animal reconoce rápidamente que el tono precede a la
entrega de comida. Cuando aparece un punto en la pantalla, el mono lo mira: es lo único que ha cambiado en el
entorno.
Aun así, el comportamiento animal tiene que adaptarse a un entorno. Uno de los 1 Uno de los más
experimentos más famosos que se utilizan en la neurociencia en la actualidad es el laberintoacuático de
Morris, que consiste en una gran piscina de agua (de varios metros de ancho) que se vuelve opaca con una
pequeña cantidad de pintura blanca no tóxica soluble en agua. En esta tarea, se entrena a ratas o ratones
para que encuentren una plataforma oculta bajo el agua. Esta tarea es popular porque es particularmente
A
daños a ciertas estructuras cerebrales, como el hipocampo. sensible a la toma de decisiones.

A
Como en cualquier experimento clínico, la interpretación de los estudios de lesiones debe moderarse con una
comprensión de las implicaciones lógicas. Los daños en el hipocampo provocan problemas en el laberinto acuático
de Morris, pero no es cierto que los problemas en el laberinto acuático de Morris impliquen daños en el hipocampo.

107
Machine Translated by Google

108 El sistema de toma de decisiones

Desde esta perspectiva, el laberinto acuático de Morris es muy interesante porque la tarea se puede resolver
mediante sistemas deliberativos o procedimentales (hábitos), según la secuencia de entrenamiento. Los
3
niños se sientan Pero, ¿qué es lo primero que hacen las ratas en esta tarea? Nadan alrededor.
en el borde de la piscina, buscando una salida. Solo después de explorar a fondo esta posibilidad, comienzan
a dirigirse hacia la plataforma.
En el caso de los seres humanos, las señales importantes en los experimentos de psicología y
neurociencia suelen identificarse explícitamente para el sujeto: "Verás un conjunto de caras. Intenta identificar
"
caras que has visto antes... cuál". Incluso cuando no se identifican explícitamente, aunque los
entornos para los experimentos de psicología humana suelen ser ricos en señales, la señal importante suele
ser obvia para el sujeto. Una máquina de fMRI es un espacio claustrofóbico con paredes estrechas a tu
alrededor, una jaula de metal alrededor de tu cabeza y ruidos extremadamente fuertes y palpitantes.
4
Sabemos Y, sin embargo, cuando la señal visual está activada, sabemos que debemos prestarle atención. En parte,

que debemos prestarle atención porque tenemos una historia de lo que esperamos que suceda en uno de
estos experimentos.
Pero, como ya he señalado antes, la vida fuera de los experimentos psicológicos se compone de una
plétora de señales que inciden en nuestros sentidos en todo momento. No es frecuente que estemos
sentados, mirando una pantalla, intentando averiguar si un pequeño subconjunto de un conjunto de puntos
que se mueven aleatoriamente tiende a moverse más en una dirección que en otra. Es cierto que hay veces
en las que vemos a gente escudriñando la distancia o la oscuridad (pensemos en un marinero de pie en el
puesto de vigía de un barco, vigilando la tierra, o en un cazador acechando a un ciervo); sin embargo, la
mayoría de las veces, el problema es que hay demasiadas señales, no muy pocas.

Reconocimiento de la situación

Me interesé por primera vez en la cuestión del reconocimiento de situaciones cuando hablé con uno de mis
colegas (Steve Jensen) durante el almuerzo. Steve estaba fascinado por un fenómeno de un ensayo 5 Estos
del corazón cambia a un ritmo pacientes tienen un riesgo de arritmias cardíacas repentinas (donde el latido
incorrecto) y se les ha implantado un desfibrilador cardioversor (ICD) conectado al corazón. Estos dispositivos
detectan el ritmo del corazón y, si ese ritmo se altera, proporcionan una descarga eléctrica para reiniciar el
corazón. (Al igual que un desfibrilador externo puede dar una descarga eléctrica al corazón para que vuelva
a tener ritmo, también puede hacerlo uno interno). A diferencia de un marcapasos, que proporciona un ritmo
lento y constante al corazón, el DCI se activa solo cuando el ritmo se detiene o es incorrecto. Además, a
diferencia de un marcapasos, el DCI duele muchísimo cuando se activa. A diferencia de un desfibrilador
externo, que se utiliza solo en pacientes inconscientes, el DCI suele activarse mientras el paciente está
consciente.
En tales situaciones, el paciente se ve repentinamente expuesto a una experiencia extremadamente
negativa (aunque potencialmente podría haberle salvado la vida). Estos pacientes con DCI tienen las
asociaciones negativas más extrañas con las cosas de su vida. Steve quería saber qué hizo que el paciente
decidiera que el culpable era el tenedor y no la cuchara, o que era el acto de sentarse en una silla y no reírse
con los amigos. Claramente, tiene algo que ver con lo que estos sujetos estaban atendiendo en ese momento,
pero nos hizo pensar en la cuestión de cómo decidimos qué señales son importantes.

En la literatura sobre robótica, informática y psicología que estudia el aprendizaje por refuerzo, esto se
6
denomina el problema de asignación de créditos . En general, la suposición en
estos modelos y experimentos es que hay un pequeño subconjunto de señales potenciales que
Machine Translated by Google

Las historias que contamos 109

Puede ser importante y el agente (el animal o la simulación por ordenador) tiene que averiguar
cuál es la clave para tomar la decisión correcta. Pero sabemos por otros experimentos (como el
laberinto acuático de Morris y otros experimentos de navegación espacial) que a menudo es una
constelación de señales la que informa al animal. 7 Se puede eliminar un subconjunto

de las señales y el animal seguirá encontrando su camino correctamente, siempre que haya suficientes señales
disponibles. Ninguna señal es clave.
Nos dimos cuenta de que la mayoría de los modelos informáticos de toma de decisiones asumían que el
agente sabía qué situaciones posibles estaban disponibles (lo que se conoce técnicamente como espacio de
estados ) y, a menudo, sabía cómo cambiaban de una a otra (lo que se conoce técnicamente como matriz de
transición ), pero que, en realidad, los animales creaban situaciones a partir de señales. Los animales reales
8
(incluidos los humanos) categorizaban las señales en situaciones . La categorización simple en sistemas
neuronales se entiende bien y se puede modelar con memorias direccionables por contenido . De

hecho , existen sistemas de aprendizaje muy bien estudiados que categorizan automáticamente las
entradas, incluso sin supervisión.
10 Estos sistemas se denominan algoritmos de aprendizaje no supervisado.
y trabajar identificando regularidades en las entradas.
Utilizando un algoritmo estándar de aprendizaje no supervisado, construimos un modelo que incorporaba
un componente de categorización de situaciones en un agente estándar de aprendizaje de refuerzo (un
agente que aprendía qué hacer en qué situación, esencialmente un agente de aprendizaje procedimental en
la terminología utilizada en este libro). 11 Descubrimos que este componente de reconocimiento de
situaciones resultó cambiar la psicología observada de nuestro agente de varias maneras importantes. La
más importante fue que la decepción (falta de entrega de recompensa) se volvió diferente del castigo (entrega
de un estímulo negativo). En nuestro modelo, la decepción condujo al reconocimiento de un cambio en la
situación, mientras que el castigo condujo a una nueva asociación.
(Hemos hablado de las diferencias entre recompensa, refuerzo y decepción, y sus contrapartes negativas
[castigo, aversión y alivio] en el Capítulo 4.)
Este modelo sugiere que existe un efecto de contexto significativo en el reconocimiento de cambios en
nuestras expectativas de recompensa o castigo. Esto puede explicar por qué, por ejemplo, los adictos que se
desintoxican en los hospitales recaen al ser dados de alta y volver a su vida normal, o por qué los estudiantes
que aprenden las respuestas correctas sobre electricidad en la clase de física siguen siendo incapaces de
construir correctamente circuitos cuando se les da un conjunto de baterías reales y otros componentes
12
eléctricos para construir.
También pudimos manipular parámetros en nuestro modelo para producir simulaciones de problemas de
juego debido al reconocimiento incorrecto de situaciones, ya sea porque el agente pensó que podía controlar
una situación aleatoria (la ilusión de control , creer que dos resultados se debían a dos situaciones cuando
en realidad ocurrieron debido al azar dentro de una sola situación) o porque el agente no pudo reconocer un
cambio en una situación (lo que llevó al fenómeno de perseguir pérdidas y continuar jugando incluso ante
, es solo una casualidad). 13
una pérdida devastadora porque el agente piensa que la diferencia

Aunque nuestro modelo fue capaz de explicar una serie de fenómenos psicológicos (como por
qué la extinción conductual no es lo mismo que el olvido o por qué los animales tardan más en
extinguir recompensas que se les entregan de forma variable) y una serie de fenómenos clínicos
(como la recaída relacionada con el contexto en la adicción o la ilusión de control en el juego), 14
el algoritmo de aprendizaje no supervisado que utilizamos fue un mecanismo estático de
categorización de señales. El algoritmo tomó el conjunto de señales actualmente disponibles y
determinó si era parte de una situación conocida o si tenía que declararse una
15situación
El mundonueva.
real es,
por supuesto, mucho más complejo.
Machine Translated by Google

110 El sistema de toma de decisiones

El reconocimiento de situaciones es complejo, dinámico y jerárquico.

Por supuesto, el reconocimiento de situaciones no es todo o nada: las situaciones son similares y
diferentes a otras situaciones. Tomar decisiones correctas requiere que seamos capaces de reconocer
tanto las similitudes como las diferencias entre las situaciones. La afirmación habitual atribuida al filósofo
griego Heráclito es que “nunca te metes dos veces en el mismo río”, pero los fragmentos que tenemos del
griego real sugieren que una mejor interpretación es que algunas cosas permanecen constantes a pesar
aprender, tienes que tener cierta constancia entre tu pasado y tu futuro. del cambio. 16 Si vas a
Necesitas reconocer las similitudes entre tu pasado y tu presente para poder traducir los éxitos y fracasos
pasados en planes presentes. Para resolver esta paradoja, necesitamos un sistema que pueda categorizar
las situaciones, reconociendo tanto las similitudes como las diferencias entre tu pasado y tu presente.

Hago muchas presentaciones científicas para distintos públicos. Cuando preparo las diapositivas para
una presentación, trato de asegurarme de que sean las adecuadas para el público al que voy dirigidas.
Recuerdo la primera vez que fui a dar una charla en Japón. Mi esposa me señaló que la mayoría de los
científicos japoneses podían leer el inglés escrito mucho mejor de lo que podían entender el inglés hablado.
Así que añadí una sección a cada una de mis diapositivas en la que describía los resultados básicos de
esa diapositiva (después descubrí que esto también ayuda a los hablantes nativos de inglés). Pero aunque
la situación era ligeramente diferente, no pensé que dar una charla en Japón fuera una situación nueva,
sino que la definí como un caso especial de mi categoría de dar una charla. Esta naturaleza jerárquica es
17
una clave para la categorización humana. Un pingüino es un pájaro, pero también
nada en el agua y no vuela. Así como clasificamos nuestros conceptos en una jerarquía compleja con
casos especiales que no encajan del todo en las categorías, también debemos clasificar las situaciones
de maneras complejas.
Las situaciones también son dinámicas. No nos limitamos a ver un conjunto de señales, clasificarlas
como una situación y responder a ellas, sino que reconocemos una secuencia de situaciones y viajamos
a través de ella. Yo viajo por el aeropuerto de MinneapolisSt. Paul (MSP) aproximadamente una vez al
mes (a veces más, pero trato de limitarme a viajar menos de una vez al mes). A veces llevo mi computadora
portátil, a veces no. A veces llevo a mi familia conmigo, a veces no. A veces he facturado una maleta, a
veces llevo solo equipaje de mano. Pasar por el control de seguridad con mi computadora portátil es
diferente a no hacerlo. De manera similar, el control de seguridad es diferente si estoy solo o si tengo a
mis hijos, y es diferente si mis artículos de tocador están en mi bolso de mano o los despacho. Y, sin
embargo, no tuve que volver a aprender a pasar por el control de seguridad desde cero la primera vez que
me dijeron que tenía que sacar mis artículos de tocador de mi equipaje de mano y pasarlos por la máquina
de rayos X por separado. Pude tomar lo que sabía sobre pasar por la seguridad del aeropuerto y modificarlo
para incluir sacar mis artículos de tocador de mi maleta de mano.

Pasar por el control de seguridad del aeropuerto es un buen ejemplo de una situación dinámica, lo que
podríamos llamar un guión . 18 Las acciones en cada etapa son muy diferentes, y sin embargo todas
van juntas en una secuencia reconocible. Primero, necesitas tu identificación y tarjeta de embarque.
Una vez que las revisas, debes esperar en la fila para que te entren los recipientes de plástico donde
colocar tus cosas. En los aeropuertos estadounidenses, debes quitarte los zapatos. (Una vez
comencé a quitarme los zapatos en un aeropuerto europeo y el agente de seguridad me miró con
sorpresa y preguntó: "¿Qué estás haciendo?"). Pasar por el control de seguridad del aeropuerto es
una secuencia de sustituciones y acciones.
Machine Translated by Google

Las historias que contamos 111

Un guión es una línea argumental, una categorización de una secuencia que puede modificarse en
sus subetapas. Los puntos importantes aquí son tres. Primero, categorizamos las situaciones del mundo
para actuar dentro de él ( ¿Cuáles son las claves importantes aquí? ). Segundo, esas categorías son
complejas y jerárquicas ( Dar una charla en Japón es un caso especial de mi categoría de dar una
charla ). Tercero, estos guiones son dinámicos ( Pasar por la seguridad del aeropuerto es una secuencia
compleja y dinámica de situaciones y acciones ). Estos guiones son narrativas, historias que nos
contamos a nosotros mismos sobre nuestras vidas.

Narrativa y literatura

El éxito de la gran literatura se debe generalmente a la reconocibilidad de los personajes.

Nos preguntamos: “¿Es eso lo que haría este personaje en esta situación?”. Los dramaturgos suelen
hablar de “mantener las cosas dentro del personaje”. Cuando una persona hace algo que está “fuera de
su personaje”, todo el mundo lo nota. Como Fergus (interpretado por Stephen Rea) le explica a Dil
, en mi naturaleza”. Y luego,
(interpretada por Jaye Davidson) en The Crying Game de Neil Jordan : “Está
para explicarle completamente sus acciones, le cuenta la fábula de la rana y el escorpión. Reconocemos
la autoconsistencia de sus acciones como una definición de su naturaleza. Esto es cierto tanto si las
historias son realistas como fantásticas. Incluso las obras explícitamente irreales se basan,
fundamentalmente, en personajes reconocibles. Recuerdo la primera vez que vi Krapp's Last Tape de
Samuel Beckett y me di cuenta de que en realidad se trataba de un escritor viejo y alcohólico que
recordaba una historia de amor del pasado. A pesar de todas sus implicaciones existencialistas, Sin
salida, de JeanPaul Sartre , es una interacción dramática sencilla entre tres personas muy reales.
Incluso las obras absurdas como El rinoceronte, de Eugene Ionesco, tienen interacciones humanas
reconocibles en todas partes.
De hecho, en toda la literatura, las historias que sobreviven son aquellas en las que reconocemos
características humanas. Ya sean las características extraordinariamente humanas de los dioses griegos
o nórdicos, o las debilidades de los personajes bíblicos, las historias que sobreviven son las que captan
algo “verdadero” sobre la naturaleza humana.
En gran parte, el éxito de la literatura se debe al hecho de que la naturaleza humana no ha cambiado
en miles de años. Nos reconocemos en los griegos pendencieros de la Ilíada de Homero y en el soldado
que se recupera y trabaja lentamente para volver a casa en la Odisea de Homero . Nos reconocemos en
la indecisión de Hamlet , en la temeridad de El rey Lear .
La telenovela de Shakespeare El sueño de una noche de verano es reconocible en cualquier grupo de
estudiantes de secundaria. Las fábulas de África, América del Norte y la Italia medieval nos hablan de
manera confiable.
Incluso podemos encontrarnos en los mundos imaginados de la fantasía y la ciencia ficción,
ya sean los hobbits aprendiendo a mantenerse erguidos en El Señor de los Anillos de J. R. R. Tolkien o
las maquinaciones políticas en Dune de Frank Herbert .
Es importante reconocer que esto no significa que la literatura sea una obra moral; las verdaderas
obras morales tienden a ser aburridas y se olvidan rápidamente. La literatura exitosa es más como un
experimento, una forma de probar "qué pasaría si". La literatura es una forma de aprendizaje ficticio,
una forma de ver qué sucedería si alguien con un cierto carácter se enfrentara a una situación específica.
Nos permite preguntarnos: "¿Haría eso?" Ya sea que nos preguntemos si cometeríamos los mismos
errores o si tendríamos la fuerza para tomar la acción correcta, la literatura es una forma de probar
hipótesis sobre las consecuencias, muy similar a los experimentos Gedanken (experimentos mentales)
en la ciencia.
Machine Translated by Google

112 El sistema de toma de decisiones

Los instructores de escritura les dicen a los escritores noveles que encuentren el personaje y
luego lo pongan en la situación más difícil posible.20 Lo que hace que una situación sea difícil depende del
personaje sobre el que se está escribiendo. En cada etapa de una historia, nos preguntamos: “¿Qué haría este
personaje en esta situación?” Somos muy buenos para reconocer la ficción forzada, donde los personajes hacen algo
que no es propio de ellos para avanzar en la trama.
21 Nos contamos historias de nuestras
Fundamentalmente, los humanos somos criaturas narrativas.
vidas y definimos nuestras vidas en términos de esas historias. Usamos la narrativa para explicar
nuestro pasado, reconocer nuestro presente y predecir el futuro. Planificamos el futuro contándonos
historias de lo que creemos que sucederá (véase el Capítulo 9). Reconocemos nuestro presente a
través de los guiones que estamos recorriendo e intentamos comprender nuestras acciones pasadas
y las cosas que nos han sucedido en términos de una estructura narrativa, contando historias. Por
supuesto, como vimos en el Capítulo 9, ese pasado se construye, se reconstruye, podríamos decir.
Al cambiar las historias que nos contamos, reinterpretamos por qué hicimos lo que hicimos y
cambiamos quiénes somos.

Por ejemplo, la simple frase “No existe tal cosa como una bebida para un alcohólico” implica que las opciones de
decisión que usted tiene en el futuro no son entre ir al bar y tomar una sola bebida o quedarse en casa y aburrirse,
sino más bien entre ir al bar y emborracharse mucho (y por lo tanto arrepentirse) o quedarse en casa y no hacerlo.
Este es un proceso llamado “agrupamiento” en la literatura de neuroeconomía. Al tomar decisiones futuras juntas, uno
22
ve tanto las consecuencias inmediatas como las de largo plazo. Mediante agrupamiento

Los modelos computacionales de esto muestran que estos efectos de agrupamiento pueden cambiar las decisiones
de maneras que las decisiones no agrupadas no pueden.
En este momento, no sabemos mucho sobre la neurofisiología de cómo se representan las historias dentro del
cerebro. Claramente debe involucrar representaciones de categorías y recuerdos direccionables por contenido.
Sabemos por la literatura psicológica que deben existir, y sabemos algo sobre cómo se representan las categorías
estáticas dentro del cerebro, pero la complejidad de los sistemas de reconocimiento de situaciones (como la naturaleza
jerárquica) y la dinámica de esas representaciones (como la estructura narrativa y el efecto de esa estructura narrativa
en la toma de decisiones) todavía son preguntas muy abiertas en la literatura científica actual.

Libros y artículos para leer más En lugar de recomendarte

artículos científicos sobre el papel de la narrativa, simplemente te sugeriré que leas ficción. Los grandes autores son
B
agudos observadores de la condición humana.

B
La buena ficción puede ser tremendamente informativa, pero, como sucede con cualquier artículo científico, hay que involucrarse.

Trabajar en diálogo y afrontar las observaciones con espíritu crítico.

Machine Translated by Google

Motivación

Montañas tropicales a
través de la red de una hamaca azul,
acurrucados juntos,
leyendo,
despertando.

Los objetivos específicos que los sistemas de toma de decisiones intentan

satisfacer surgen de funciones de objetivos intrínsecos preprogramados
evolutivamente en nuestro cerebro. Sin embargo, también podemos aprender
a identificar nuevos objetivos que hemos aprendido que conducen a esas

recompensas intrínsecas o evitan esos castigos intrínsecos. El vigor con el

que intentamos alcanzar esos objetivos depende del nivel de necesidad
intrínseca y del costo de oportunidad de perseguir esos objetivos a expensas de otros.

Hasta ahora, hemos hablado de las decisiones como resultado de reflejos aprendidos evolutivamente
y de sistemas pavlovianos, deliberativos y procedimentales que aprenden de recompensas y
castigos. Hemos hablado de cómo los animales integran información sobre el mundo y categorizan
situaciones para tomar sus decisiones. Sin embargo, a lo largo de nuestra discusión hemos eludido
una pregunta fundamental: ¿qué define el objetivo? Identificamos la señalización opioide como la
medición de los componentes positivos y negativos de recompensa y castigo, y la señalización
dopaminérgica como la medición de las diferencias entre lo previsto y lo esperado (véanse los
capítulos 3 y 4). Pero ninguna de estas define cuáles son esas recompensas positivas o castigos negativos .
Los primeros modelos explícitos de toma de decisiones asumieron que el objetivo era maximizar
su propia utilidad .
2;A Desde el comienzo mismo de la literatura económica, quedó
inmediatamente claro que era imposible definir la utilidad de una manera general que fuera la

A
Aunque generalmente se cita a Adam Smith por el concepto de que cada individuo maximiza su propia
utilidad, es importante señalar que reconoció que esto no era estable en su forma más simple.
La conceptualización de Smith era en realidad bastante compleja, y sugería que el éxito económico nacional
dependía de lo que hoy conocemos como empatía, simpatía y castigo altruista. Por ejemplo, reconocía la
importancia de las garantías gubernamentales de equidad en el mercado, así como los peligros de los
3
monopolios y otras complejidades más allá de la simplicidad de la maximización de las ganancias individuales.

113
Machine Translated by Google

114 El sistema de toma de decisiones

lo mismo para todas las personas, por lo que los matemáticos Nicolaus Bernoulli (16951726) y su hermano menor
Daniel Bernoulli (17001782) propusieron la idea de utilidad subjetiva, que sugiere que cada uno de nosotros tiene una
B Pero todavía no define
medida interna de esa utilidad.
cómo nuestra interacción con el mundo se traduce en recompensas y castigos.
De manera similar, los modelos computacionales originales de toma de decisiones definieron el objetivo a
Estos
maximizar como una función de recompensa del tiempo o la situación, pero nunca definieron cuál era la recompensa.

modelos de computadora hicieron esto para evitar explícitamente la pregunta que estamos tratando de abordar aquí.
Los autores de esos modelos informáticos intentaban comprender los algoritmos de toma de decisiones en un mundo
informático imaginario (sin cuerpo). Cuando esos algoritmos se tradujeron a la robótica, los autores tuvieron que
8
codificar los objetivos en los robots.

B La historia de por qué los hermanos Bernoulli idearon la utilidad subjetiva es interesante, particularmente porque da una
idea de los problemas que surgen al intentar derivar la microeconomía a partir de los primeros principios.
4 Los hermanos estaban tratando de entender cómo incorporar la probabilidad a la utilidad: ¿cuánto
debería gustarle a uno una probabilidad del 10% de obtener $50? Para simplificar, asumieron que uno debería gustarle
un 10% más. Por lo tanto, el 10% de $50 debería ser equivalente a $5. El problema con esto es que se pueden crear
paradojas a partir de esta suposición que son claramente erróneas.
El caso que los hermanos Bernoulli idearon se llama “la paradoja de San Petersburgo” porque fue presentado por
primera vez en la Academia Imperial en la corte de Pedro el Grande en San Petersburgo. Imaginemos un juego con las
siguientes reglas: pagamos una tarifa para entrar y luego se lanza una moneda al aire. El juego se detiene cuando la
moneda sale cruz. El juego paga $1 por cada lanzamiento de moneda. Por lo tanto, si sale cruz en el primer lanzamiento,
ganamos $1, pero si obtenemos 99 caras seguidas de una cruz, ganamos $100. La pregunta es ¿ cuánto pagaríamos
por jugar a este juego? Debido a la forma en que está construido el juego, el pago matemáticamente esperado es
infinito, y una persona lógica (a la que los economistas llaman “racional”) debería estar dispuesta a pagar cualquier
cosa para jugar a este juego.
Por supuesto, la gente sólo está dispuesta a pagar una pequeña cantidad para jugar a esto. (Compare la paradoja
de San Petersburgo, que parece errónea aunque sea lógica, con las distorsiones que vieron Kahneman y Tversky, 5
que parecen correctas aunque sabemos que son ilógicas, como el ejemplo de la gripe asiática, donde describir el
problema en términos de personas salvadas o personas perdidas cambia la elección [ver Capítulo 3]).
Los hermanos Bernoulli propusieron que la razón por la que la gente no pagaba grandes sumas para jugar a este
juego era que en realidad estaban maximizando la “utilidad subjetiva”, en la que los pagos cada vez más altos tenían
cada vez menos valor. Por lo tanto, 200 dólares no valían el doble que 100. Bernoulli sugirió específicamente una
función de raíz cuadrada, es decir, el valor subjetivo es la raíz cuadrada del valor real ofrecido.
Sin embargo, no es difícil modificar la paradoja de San Petersburgo para destruir cualquier función de valor
ilimitada. Una posible explicación es que nuestras funciones de valor subjetivas no son ilimitadas. Al final, no importa
cuánto dinero se paga, es sólo una "gran victoria". El problema con esta hipótesis es que está muy claro (al menos en
lo que respecta al dinero) que esto no es cierto. Los multimillonarios que han visto saciados todos sus deseos durante
mucho tiempo siguen luchando por más dinero. (Veremos por qué más adelante en este capítulo). Las explicaciones
actuales para la paradoja de San Petersburgo se basan en las diferencias en cuanto a cuánto nos gustan las ganancias
y las pérdidas (la gente odia las pérdidas más de lo que le gustan las ganancias) y el reconocimiento de que nunca se
te puede ofrecer una cantidad infinita de dinero porque, al final, te arruinarás.
Mi intuición es que parte de la respuesta puede ser que la valoración se hace en línea y que el sistema de
valoración en nuestros cerebros no puede hacer la suma infinita necesaria para que valga la pena pagar por la paradoja
de San Petersburgo. Si la persona suma sólo los primeros casos y luego dice que la probabilidad de que salgan 10
caras seguidas es tan improbable que no vale la pena pensar en ello, entonces el pago máximo no es infinito. (Por
supuesto, la gente juega a la lotería, que tiene una probabilidad de pago mucho menor). Aunque la explicación de los
hermanos Bernoulli de la paradoja de San Petersburgo como una transformación de la utilidad ya no es la historia
6
aceptada, el concepto de una modificación interna de la utilidad subjetiva sigue vigente.
Machine Translated by Google

Motivación 115

Funciones de recompensa intrínsecas

Los teóricos que estudian cómo los animales buscan comida en la naturaleza han argumentado que los animales
(incluidos los humanos) están maximizando sus ganancias de energía y minimizando su consumo de energía. 9
costos.Por ejemplo, imaginemos a un colibrí recolectando néctar de una flor. Para obtener el néctar, el colibrí se

cierne frente a la flor, extrayendo el néctar. A medida que el ave bebe el néctar se vuelve cada vez más difícil
extraerlo. En algún momento, la energía que se gasta para batir sus alas lo suficientemente rápido para flotar es
mayor que la energía que está extrayendo de la flor, y debería ir a otra flor. Ir a otra flor es riesgoso porque el
ave no sabe cuánto néctar hay disponible en esa otra flor.

Tal vez ya se haya agotado. Tal vez el pájaro busque durante mucho tiempo. Es posible calcular el tiempo óptimo
que el pájaro debería pasar en un área de alimento y cuándo debería irse. Este tiempo óptimo depende del
tamaño de la área, la expectativa de cuánta comida queda en ella, cuál es el tiempo de viaje esperado hasta la
siguiente área y la cantidad probable de comida que el pájaro esperaría encontrar en la siguiente área.

Estas ecuaciones predicen correctamente los tiempos de permanencia y salida de aves, mamíferos e insectos
que buscan alimento y cazan, las transiciones en los experimentos de toma de decisiones de los monos, incluso
para los cazadores y recolectores humanos que deciden cuándo y dónde buscar comida, y para las personas
que buscan información en la Web y en el mundo. 10
Pero estas teorías de búsqueda de alimento se basan en el supuesto de que el único propósito de estos
animales es la supervivencia. La teoría de la selección natural de Darwin nos dice que lo que realmente impulsa
el éxito no es la supervivencia sino la procreación de genes en futuras generaciones, en particular la procreación
11
exitosa de futuros procreadores exitosos. Existen numerosos ejemplos de
animales que se sacrifican por su futuro genético. Incluso algo tan simple como que un padre alimente a sus hijos
es una prueba de que hay algo más en juego que la supervivencia individual. Todos conocemos ejemplos de
padres que se sacrifican por sus hijos, ya sean pingüinos que se mueren de hambre para mantener calientes los

huevos, estorninos que llevan comida a un nido, una osa polar que protege a sus cachorros o inmigrantes
humanos que sacrifican sus sueños para que sus hijos puedan triunfar en una nueva tierra.

Por supuesto, también existen los estudios clásicos de los insectos sociales (abejas, hormigas), que viven
en grandes colonias donde los zánganos se sacrifican por una reina y sus hijos. 12 La razón de

esto ahora se entiende bien, y se debe al hecho de que, debido a la forma en que funciona la genética de los
insectos, un zángano es genéticamente más similar a sus hermanas que a sus propios hijos, por lo que
evolutivamente prefiere tener más hermanas que tener más hijos.
Estas descripciones presuponen que los animales están calculando cómo maximizar su éxito genético. No
sé lo que piensa usted, pero yo no suelo pasarme todas las mañanas pensando: “¿Cómo puedo aumentar mi
éxito genético hoy?”. Estoy bastante seguro de que ningún otro animal lo hace. En gran parte, esto se debe a
que determinar qué es lo que conducirá al éxito genético es muy difícil de predecir. Un cálculo de este tipo
requeriría una enorme cantidad de capacidad mental; es poco probable que un individuo que pase demasiado
tiempo preocupándose por ello lo consiga y pronto se vería superado genéticamente.

Entonces, ¿qué define los objetivos que queremos? Una sugerencia es que tenemos funciones de objetivos
intrínsecos preprogramados evolutivamente en nuestros cerebros, 13 pero eso no dice cuáles son esos objetivos.

Apuesto a que nunca pensaste que cocinar para tus hijos tuviera tanto significado.
do
Machine Translated by Google

116 El sistema de toma de decisiones

Estamos de vuelta a los objetivos codificados de forma rígida que los especialistas en robótica pusieron en sus robots. Estos autores

sostienen que nuestra historia evolutiva ha codificado de forma rígida nuestros cerebros con objetivos que luego buscamos

independientemente de su uso evolutivo real. Por ejemplo, a los perros les gusta perseguir cosas, presumiblemente porque en el

pasado evolutivo, las principales cosas que perseguían eran animales grandes como ciervos, alces y wapitíes. Para muchos perros,

las principales cosas que persiguen ahora son automóviles. Estos conceptos se impulsaron en la década de 1970 bajo el disfraz de

la sociobiología , generalmente enunciados de forma demasiado simple y demasiado poco dispuestos a abordar la complejidad de

las interacciones de los primates.

14 ;D

Los orígenes de la sociobiología se encuentran en los estudios de etología animal, particularmente en los estudios de insectos.
Años 18 .
Mientras que los insectos suelen ser interpretados como pequeños robots, con rutinas simples que a menudo son

reconocibles (las polillas vuelan en espiral hacia las luces) y a menudo con modos de falla simples (como puede ver cualquiera que

observe a una polilla volar hacia una llama), las aves y los mamíferos son más complejos, y los humanos en particular. Los modos

de falla humanos también son particularmente complejos, pero eso no significa que no sean identificables. (Abordaremos muchas

de las formas en que los sistemas de toma de decisiones fallan [sus modos de falla ] en la siguiente sección del libro).

Las interacciones sociales humanas son increíblemente complejas, pero esto no implica que sean aleatorias, inobservables o

no identificables. Como se ha comentado en el capítulo 12, los novelistas y dramaturgos llevan milenios observando a los seres

humanos. Como público, reconocemos que cada individuo tiene un carácter coherente. En una novela, una obra de teatro o una

película, si alguien hace algo que “no es propio de él”, se nota como un pulgar dolorido. Tenemos una gran parte de nuestro cerebro

dedicada a reconocer las interacciones sociales. ¿Significa esto que sabemos hacia dónde saltará un individuo? No a la perfección,

pero podemos predecir lo que es probable que haga un individuo y hacemos nuestros planes en función de esas predicciones.

¿Cuáles son, entonces, esas funciones intrínsecas de recompensa? Obviamente, cuando tenemos hambre, queremos comida;

cuando tenemos sed, queremos agua. Y, obviamente, deseamos sexo. Observemos que el deseo de sexo es diferente al deseo de

tener hijos. El desarrollo evolutivo del deseo de sexo como medio para impulsar la procreación, en lugar del deseo de tener hijos

como medio para la procreación, es un ejemplo clásico de una función intrínseca de recompensa. Por supuesto, algunas parejas

tienen relaciones sexuales porque están tratando de tener un bebé, pero, a menudo, el sexo es por sus propios placeres, y las

parejas se sorprenden ante el embarazo inesperado.

D
La sociobiología ha adquirido una mala reputación en las últimas décadas porque sus conclusiones se han
considerado prescriptivas en lugar de descriptivas , y porque a menudo han creado amplias generalizaciones a
partir de observaciones limitadas. 15 Más adelante (en el capítulo 23) analizaremos la cuestión de las diferencias

entre prescripción y descripción. En resumen, el objetivo de la ciencia es comprender la causalidad en el mundo:

si el mundo está en esta configuración, entonces eso sucederá. Por ejemplo, la teoría de la gravedad galileana/
newtoniana implica que si dejo caer un martillo y una pluma al mismo tiempo en el vacío, caerán al suelo al mismo
tiempo. (Esto, por supuesto, fue probado por los astronautas del Apolo 15 y se demostró que era completamentecierto. 16 )
Llamamos a esto descriptivo porque describe el mundo. Por otra parte, lo que deberíamos hacer con este
conocimiento es prescriptivo . Decir que el doble rasero de la sexualidad relajada (las mujeres pierden rango por
promiscuidad sexual, mientras que los hombres lo ganan) surge de las diferencias en el esfuerzo que las mujeres
y los hombres tienen que poner en la crianza de los hijos (es más fácil para los hombres dejar la promiscuidad que
para las mujeres) 17 no implica que se deba alentar ese doble rasero, o que una sociedad que lo acepte será mejor
que una que no lo haga. Volveremos a las cuestiones de “mejor” y sociedad en nuestro análisis de la moralidad en
el capítulo 23. Como esta cuestión de la sociobiología no es el tema de este libro, lo dejaré aquí, con la simple
afirmación de que el hecho de que la biología no sea el destino no significa que no sea verdad.
Machine Translated by Google

Motivación 117

Lo interesante, por supuesto, es que los humanos (como todos los animales) en realidad somos muy selectivos
con el sexo: las parejas que tienen más probabilidades de producir hijos fuertes, saludables e inteligentes son más
20
atractivas sexualmente. Además, debido a que los seres humanos requieren de
largos compromisos para criar hijos exitosos, los humanos, particularmente las mujeres, a menudo exigen algún tipo
de compromiso antes de tener relaciones sexuales.Se han realizado numerosos estudios que examinan la compleja

interacción que surge en el juego de apareamiento humano y que muestran, por ejemplo, que la belleza no está en
los ojos de quien la mira, sino que existen estándares de belleza que son consistentes en todas las culturas e
individuos y que señalan información sobre la salud, la fecundidad y la inteligencia .
22

Sin duda, algunos componentes de la belleza parecen variar de una cultura a otra, pero estos componentes
tienden a implicar preparativos elaborados que demuestran que tenemos amigos y tiempo para cuidar nuestra
apariencia. Debido a que los seres humanos viven en comunidades (realmente se necesitan 23 años ), muchos de
a un niño en sociedades humanas normales, las definiciones de los componentes variables de una aldea para criar
belleza requieren una interacción compleja con otros miembros de la comunidad para mantenerse. (Piense en lo
difícil que es cortarse el cabello uno mismo). Los detalles de estos preparativos pueden cambiar culturalmente, pero
indican constantemente el tiempo y el esfuerzo invertidos en la apariencia.
Pero la comida, el agua y el sexo no nos bastan: también queremos ser respetados y buscamos música, emoción,
familia y amigos. Los bebés buscan a sus madres; las madres y los padres buscan a sus hijos. Como caso específico,
tomemos las interacciones maternas. En una de las historias clásicas de la secuencia de la ciencia, los primeros
estudios de la interacción sugirieron que los animales hacían cosas sólo para obtener una recompensa de comida.
24 Esto sugiere a los investigadores que los niños estaban "apegados" a sus madres porque eran alimentados por
ellas . En particular, el
conductista John Watson (a quien hemos conocido antes como uno de los principales actores en el desarrollo del
concepto de “hábitos” de estímulorespuesta) argumentó que tocar a los bebés solo podía transmitir enfermedades y,
por lo tanto, los niños no deberían ser tocados más de un tercio de siglo después, un joven psicólogo llamado Harry
25
Harlow, que Harlow,
estaba creando un nuevo laboratorio en la Universidad de Wisconsin, se encontró con una descripción de cómo los
niños que eran separados de sus madres al ingresar en un hospital gritaban y lloraban. Unas semanas después,
cuando su laboratorio de ratas aún no estaba listo para los experimentos, observó a los monos jugando en el
zoológico de Madison y se dio cuenta de que podía comprobar directamente si esta ansiedad se debía a la separación
de sus madres o si se trataba de un estrés generalizado, como el de ir al hospital. Harlow inició una serie muy
famosa de experimentos sobre la maternidad y descubrió que los bebés necesitaban el calor de una madre (o un
análogo de la madre) tanto como necesitaban comida.
26

Aunque estos experimentos galvanizaron el movimiento por los derechos de los animales27 y todavía se
consideran experimentos terribles y de pesadilla (y sería muy difícil obtener una F ), fueron clave para entender que
el cuidado de los animales. se aprueben bajo las regulaciones actuales sobre

E Esto nos parece una tontería ahora, pero se debió a la incapacidad de cuantificar el componente de
apego no relacionado con la comida. Recordemos que la psicología pasó de los teóricos de la Gestalt (a
finales del siglo XIX), que utilizaban la introspección, a los conductistas (principios del siglo XX), que solo
examinaban conductas cuantificables.
F La cuestión de los derechos de los animales es muy compleja y queda fuera del alcance de este libro. Sin
embargo, para quienes estén interesados en este tema, recomiendo empezar por dos libros de Deborah Blum,
Guerras de monos, The
, que describe las interacciones entre los movimientos de derechos de los animales y los científicos, y
Amor en Goon Park, que describe la vida de Harry Harlow y la influencia de su obra en el mundo.
Machine Translated by Google

118 El sistema de toma de decisiones

interacciones maternas. Como consecuencia de estos experimentos, se modificaron los procedimientos

hospitalarios. Por ejemplo, ahora los padres o la enfermera tocan regularmente a los bebés en la unidad de
cuidados intensivos neonatales (UCIN), lo que tiene un efecto drástico en la supervivencia del bebé. Estos
procedimientos cambiaron gracias a John Bowlby y su trabajo sobre la teoría del apego.
28
Aunque las hipótesis iniciales de Bowlby surgieron simultáneamente con los primeros experimentos
de Harlow (1958/1959), a lo largo de las décadas posteriores, el cuidadoso trabajo experimental de Harlow formó
la base de la exitosa campaña de Bowlby para cambiar los procedimientos hospitalarios, como lo demuestra el
lugar destacado que ocuparon los experimentos de Harlow en el influyente libro de Bowlby sobre la teoría del
apego. Cada niño que ha sobrevivido a la UCIN debe su vida en parte a Harry Harlow y esos terribles experimentos.
GRAMO

Ahora sabemos que las interacciones maternas entre los niños y sus padres (en los humanos, tanto madres
como padres) son impulsadas en parte por el neurotransmisor oxitocina.
, Una sustancia química que se libera en el hipotálamo tanto en las madres como en los bebés poco después
Cintura

del nacimiento. La oxitocina parece ser un componente clave del pegamento social que mantiene unidas a las
32
parejas y a las familias. La oxitocina administrada externamente hace que las personas tengan más
probabilidades de confiar en su pareja en los juegos de decisiones económicas. En las madres y los bebés, la
oxitocina se libera en respuesta a sostener a los niños. (Este fue uno de los puntos del trabajo de Harlow, parte de
El vínculo maternal se debe al contacto social. 33 De hecho, la oxitocina induce el acicalamiento
mutuo y se libera durante el acicalamiento mutuo en varias especies de mamíferos, incluidos los humanos.) El
simple hecho de sostener y jugar con un niño libera oxitocina, incluso en los hombres. Todavía recuerdo
vívidamente la primera vez que sostuve a cada uno de mis hijos y los alimenté y la emoción absolutamente
abrumadora asociada con eso. Incluso hoy, me gusta mucho cocinar para mis hijos y ver que les gusta la comida
que he preparado.
Al igual que comer, beber y tener relaciones sexuales, el cuidado parental es una función intrínseca. No
comemos ni bebemos porque sea necesario para la supervivencia, comemos y bebemos porque lo disfrutamos,
porque satisface una necesidad que sentimos en nuestro cuerpo. De manera similar, no tenemos relaciones
sexuales porque estemos tratando de procrear (por lo general). La prueba de que el cuidado parental es una
función intrínseca se puede ver en la forma en que las personas tratan a sus mascotas (y, tal vez, incluso en el
hecho de que las personas tengan mascotas en primer lugar). En algún momento, podría haber sido cierto que
los perros eran compañeros de caza y que los gatos mantenían los graneros limpios de roedores, pero la mayoría de los hogar

Algunos lectores pueden quejarse de la secuencia que he presentado aquí. En 1900, John Watson, un
GRAMO

psicólogo de primera línea, sostiene que no se debe abrazar ni acurrucar a los niños, lo que conduce, en realidad,
a altas tasas de mortalidad en orfanatos y hospitales. Se necesita una interacción entre John Bowlby
29

Observando lo que ahora identificamos como ansiedad por separación en los niños de los hospitales y haciendo
experimentos terribles con monos, Harry Harlow desmintió esta opinión y recomendó que los niños necesitan
(como dice el dicho popular ahora) “ocho abrazos al día”. La ciencia tardó medio siglo en corregir este error.
¿A qué errores nos enfrentamos hoy? ¿Qué errores científicos se esconden en este libro? ¿Deberíamos confiar en
la ciencia actual? Este tema es demasiado largo y complejo para abordarlo en este libro, pero la respuesta breve
es que la ciencia es un sistema que se autocorrige. Se podría argumentar que la autocorrección es la clave de la
ciencia: puede llevar años o incluso décadas, pero la ciencia se revisa y se corrige a sí misma. 30 Eso es lo que ha
permitido todos los avances que hemos visto hoy, desde los vuelos hasta las computadoras. Newton corrigió a
Aristóteles y Einstein corrigió a Newton. En lugar de decir "la ciencia a veces se equivoca, deberíamos ignorarlo",
necesitamos identificar dónde creemos que las teorías actuales están equivocadas y proponer experimentos que
las prueben directamente, y luego confiar en las respuestas que esos experimentos nos dan. (Compare esto con
los paradigmas alternativos de descripción del mundo que afirman haber conocido la respuesta durante cientos o
miles de años, pero no tienen medios para cambiar las hipótesis en respuesta a su relación con los hechos. 31 )
Machine Translated by Google

Motivación 119

Los entornos urbanos y suburbanos no cazan para sobrevivir ni tienen graneros que se mantengan libres de
roedores. Sin embargo, más de la mitad de los hogares estadounidenses tienen mascotas de un tipo u otro. Las
personas con mascotas viven más y son más felices que las personas sin ellas. 34
Las mascotas, en particular los perros y los gatos, cumplen parte de esa función intrínseca de cuidado parental.
Así como los perros persiguen coches porque les encanta perseguir cosas, nosotros tenemos mascotas porque
necesitamos esa interacción social. Se ha demostrado que los perros son relajantes terapéuticos tanto para
niños traumatizados como para estudiantes universitarios que están estudiando para los exámenes finales. En
la universidad, durante la semana de exámenes finales, grupos locales venían con sus perros de terapia. Puedo
decir por experiencia personal que hay algo extraordinariamente relajante en tomarse un descanso de los
estudios para jugar con un gran San Bernardo.
¿Cuáles son, entonces, las funciones intrínsecas de los seres humanos? La lista sería probablemente muy
larga y puede resultar difícil de precisar directamente, en parte porque algunas de estas funciones intrínsecas
se desarrollan en momentos diferentes. Es bien sabido que el interés por el sexo opuesto fluctúa desde no notar
las diferencias en los muy jóvenes (digamos, menores de siete años), hasta no querer hablar con el otro sexo
(la famosa etapa de la “inhibición”, digamos, de los siete a los once años), pasando por la intriga (doce, trece) y,
finalmente, hasta la obsesión total (digamos, diecisiete). Los intereses maternales y paternales también se
activan a ciertas edades.
Pero todas estas funciones intrínsecas de los objetivos también contienen algo de aprendizaje. Aunque las
chicas adolescentes suelen estar obsesionadas con los bebés, los chicos adolescentes suelen ser desdeñosos.
Sin embargo, los adolescentes, en particular los chicos adolescentes, con hermanos mucho más jóvenes suelen
ser más paternales (en el sentido de tener reacciones positivas ante niños muy pequeños) que los adolescentes
sin hermanos menores.
Muchas de las funciones intrínsecas de los objetivos en los seres humanos son cognitivas. Una de las más
interesantes que encuentro es la satisfacción que produce la finalización de un trabajo bien hecho. Existe una
sensación inherente de éxito no sólo en la finalización, sino en el conocimiento de que el trabajo en cuestión se
ha hecho bien. 35 El acto de descubrimiento es en sí mismo una fuerza impulsora notablemente fuerte. Aunque
ha habido quienes han argumentado que la curiosidad se debe en realidad a cuestiones de recopilación de
información necesaria para un comportamiento adecuado dentro de un entorno, varios estudios computacionales
recientes han descubierto que un impulso inherente a la exploración produce un mejor aprendizaje que los
simples algoritmos de maximización de recompensas y que los seres humanos y otros animales parecen tener
36
un optimismo excesivo que produce exploración. Incluso otros primates trabajarán Muchos
para la curiosidad que para las recompensas de comida. científicos (¡incluido yo mismo!) tienen más dificultades
37 fuerte sentimiento emocional de logro cuando identifican un nuevo descubrimiento: ahora sabemos algo que
no se sabía antes, y esa emoción de logro es una fuerza fuertemente motivadora. 38

De manera similar, muchas de las funciones intrínsecas de los humanos son sociales, el respeto de los
pares (como, por ejemplo, las estrellas del deporte que quieren ser "el receptor abierto mejor pagado" o las
celebridades que no pueden renunciar a ser el centro de atención). Este respeto a menudo se llama
incorrectamente "rango" social, pero las sociedades de primates son muy complejas y difieren de las especies
hembras y machos,a las especies. 39 Por ejemplo, las sociedades de babuinos incluyen jerarquías paralelas de
40 y una notable jerarquía inversa en los machos, donde los machos más exitosos (los que toman decisiones
que todos siguen y los que tienen éxito) son los que tienen más éxito.

yo
Aunque cuando mi esposa y yo estábamos en la universidad teníamos un apartamento que Koshka, nuestro
excelente gato cazador, mantenía libre de ratones, cuando nos mudamos había ratones viviendo en la sala de la
caldera, pero no duraron mucho.
Machine Translated by Google

120 El sistema de toma de decisiones

los que más apareamientos y más hijos) son los que pierden las peleas (porque se alejan). 41;I

Las sociedades humanas son particularmente complejas y los roles de liderazgo varían según la situación. En grupos y tribus
42 contexto. pequeñas, el rango social puede ser muy dinámico. La experiencia individual proporciona roles de liderazgo

transitorios y aumentos de rango correspondientes. En uno de mis ejemplos favoritos de esto, para su tesis de maestría, mi esposa

cuidó niños en el Museo Carnegie en Pittsburgh.

43 Algunos niños son expertos en dinosaurios, mientras que otros no. En la sección de dinosaurios del museo,

los niños expertos en dinosaurios eran tratados con más respeto y deferencia que sus compañeros. Como control, también observó

a esos mismos niños en la sección de geología, donde su experiencia ya no les daba ese impulso de rango. Por supuesto, el rango

puede traspasarse de la experiencia de uno a otros aspectos de la vida. Los niños expertos en dinosaurios tenían más

probabilidades de que se les pidiera que tomaran decisiones no relacionadas (como dónde ir a comer) que los niños no expertos.

Vemos esto, por ejemplo, en celebridades (como actores o expertos de televisión) a quienes se les pide que comenten las

decisiones como si fueran expertos científicos.

En el plano neurofisiológico, muchos estudios han descubierto que estas funciones intrínsecas de los objetivos aumentan la

actividad de los sistemas dopaminérgicos (recuerde que la dopamina envía señales de error en la predicción de valores y sirve

como señal de entrenamiento) y aumentan la actividad de un conjunto específico de estructuras ventrales que se sabe que están

implicadas en el placer, el displacer y el impulso. En general, estos estudios se han preguntado qué activa estas estructuras

ventrales de toma de decisiones, incluido el cuerpo estriado ventral, que se encuentra debajo del resto del cuerpo estriado, y la

ínsula (que también se encuentra en el lado ventral del cerebro, pero más anterior, hacia adelante, que el cuerpo estriado ventral).

44 Aunque estos estudios no pueden responder si estas funciones son intrínsecas o aprendidas porque tienen que ser estudiadas

en adultos, los estudios encuentranuna lista intrigante de señales que impulsan esta actividad, incluyendo comida, dinero, drogas,

caras atractivas, jugar videojuegos con éxito, música, emociones sociales como el amor y el dolor, incluso el altruismo (por

ejemplo, dar a la caridad) y la justicia (por ejemplo, castigar la injusticia). 45

En particular, los humanos parecen tener objetivos codificados que fomentan las relaciones sociales positivas.
46 Los humanos parecen tener una capacidad intrínseca
interacciones, particularmente dentro de grupos definidos. objetivo de un

sentido de justicia, o al menos de castigar a los jugadores injustos. En uno de los estudios más interesantes, las personas

interactuaron con dos oponentes, uno de los cuales jugó limpio y otro no. 47 Las personas y los dos oponentes recibieron luego

pequeñas (pero desagradables ) descargas eléctricas. La pregunta clave en el experimento fue la activación de las estructuras

relacionadas con la recompensa ventral del sujeto que observaba a los dos oponentes recibir descargas electrónicas. Tanto en

hombres como en mujeres, hubo más activación en la ínsula (señalando un afecto negativo) cuando el oponente justo recibió la

descarga que cuando el oponente injusto recibió la descarga. En los hombres, incluso hubo actividad en el estriado ventral

(señalando un afecto positivo) cuando el oponente injusto recibió la descarga. Parte del objetivo intrínseco

Una de las funciones más importantes de la moral en los seres humanos es el sentido de justicia en nuestras interacciones con los

demás. Veremos que esto aparece nuevamente en nuestro análisis de la moralidad y el comportamiento humano (Capítulo 23).

I
Para quienes estén interesados en este tema, hay muchos libros excelentes sobre el tema de las
jerarquías de los primates y su complejidad. Véase, por ejemplo, A Primate's Memoir (Robert Sapolsky),
Sex and Friendship in Baboons (Barbara Smuts), Almost Human (Shirley Strum), Chimpanzee Politics
(Frans de Waal) y, por supuesto, toda la serie de divulgaciones de Jane Goodall de sus estudios sobre los
, A través ofde Man
chimpancés de Gombe ( In the Shadow , otros).
y muchos
una ventana

Es notable lo desagradable que puede llegar a ser incluso una pequeña descarga eléctrica . 48
Machine Translated by Google

Motivación 121

En los capítulos anteriores sobre la toma de decisiones, analizamos cómo tomamos decisiones en función de
nuestros objetivos, pero no identificamos cuáles eran esos objetivos. Hemos mencionado algunos de ellos aquí,
pero estos varían en gran medida de una especie a otra y de un individuo a otro dentro de una misma especie.
Identificar los objetivos que se generalizan en el comportamiento humano y las distribuciones de objetivos que
varían entre los seres humanos son dos áreas de investigación activa en la actualidad.
49 Algunas de esas metas se aprenden a lo largo de escalas temporales evolutivas
y están incorporadas en el individuo, mientras que otras son de naturaleza sociológica, dependen de procesos
inherentes a nuestras interacciones culturales y deben aprenderse a lo largo de la vida, y algunas se deben a una
interacción entre la genética y la cultura. 50 Sin embargo, el punto clave aquí es que, aunque las metas
evolucionan a lo largo de generaciones y se aprenden con el tiempo de tal manera que han ayudado a procrear
nuestra genética, las metas que se aprenden solo apuntan indirectamente a una procreación exitosa. Ya se trate
de perros persiguiendo autos o de chicos universitarios navegando por Internet en busca de pornografía, son las
metas intrínsecas las que estamos tratando de satisfacer. Los sistemas de toma de decisiones que hemos
explorado han evolucionado para satisfacer estas metas. En secciones posteriores, veremos cómo estas metas
intrínsecas indirectas pueden llevarnos por mal camino.

Aprendiendo lo que es importante

El hambre nos informa cuando necesitamos alimento, la sed cuando estamos deshidratados, pero las personas
también comen cuando no tienen hambre y beben cuando no tienen sed. En realidad, esa no es toda la historia:
una afirmación más cuidadosa sería que podemos tener sed incluso cuando no estamos deshidratados y hambre
incluso cuando no necesitamos comida. Esto ocurre porque ciertas señales (señales visuales, señales olfativas)
pueden hacer que tengamos hambre y deseemos comida o que tengamos sed y deseemos agua.

El olor del pan recién horneado, la imagen de una pizza en la pantalla… son señales que nos recuerdan la comida
y que pueden hacernos sentir hambre. Los animales que encuentran una señal que predice la comida suelen sentirse
impulsados a comer.
51
De manera similar, las señales que aparecen antes de algo malo nos hacen sentir miedo. 52
Ya hemos visto cómo estas señales pueden llevarnos a la selección de acciones pavloviana, que, como vimos en
el capítulo 8, involucraba principalmente emociones y acciones somáticas. Además, estas señales pueden crear
una motivación que impulse los demás sistemas de selección de acciones. 53; K

Estos efectos se conocen como transferencia pavloviana a instrumental (PIT, por sus siglas en inglés) porque
implican un entrenamiento similar al aprendizaje que vimos en los sistemas pavlovianos de selección de acciones
(Capítulo 8) y una influencia en los otros dos sistemas de selección de acciones (deliberativo y procedimental,
que históricamente se conocían como aprendizaje “instrumental”; ver nota al pie 6C). 55 En la PIT, como en la
selección de acciones pavloviana, se presentan dos señales de manera que una informa sobre si la otra llegará
(Pavlov hace sonar una campana significa que pronto se entregará la comida). Sin embargo, aquí, en lugar de
impulsar la selección de acciones (salivar), la contingencia aprendida cambia su motivación, su deseo de ese
resultado.
En cierto sentido, la campana hace que el perro piense en comida, lo que le provoca hambre.
Los científicos que estudian los efectos del marketing han sugerido que los íconos de los restaurantes (como
los “arcos dorados” de McDonald's o los símbolos instantáneamente reconocibles de CocaCola o Pepsi) tienen
un efecto similar en las personas, haciéndolas sentir hambre (o sed) incluso cuando

K Varios autores han sugerido que esto es lo que es el anhelo : la motivación para una cosa predicha
54
señales. por Volveremos a la cuestión del anhelo en nuestro análisis de la adicción (Capítulo 18).
Machine Translated by Google

122 El sistema de toma de decisiones

No lo son. Es de suponer que esto sólo funciona en personas con asociaciones positivas con estos
símbolos. Podría ser muy interesante medir las asociaciones emocionales con ciertos restaurantes de
comida rápida (que tienden a producir emociones fuertemente positivas en algunas personas y emociones
fuertemente negativas en otras) y luego medir los efectos de sus símbolos en las elecciones, pero, que yo
sepa, esto aún no se ha hecho. Sin embargo, Sam McClure, Read Montague y sus colegas descubrieron
que las preferencias individuales por CocaCola o Pepsi se reflejaban en las preferencias por vasos
idénticos de refresco etiquetados con diferentes etiquetas. 56 Encontraron que la etiqueta cambiaba lo
que a la gente le gustaba: las personas a las que les gustaba Pepsi preferían el vaso con la etiqueta de
Pepsi, aunque los dos vasos hubieran sido servidos de la misma botella. De manera similar, Hilke
Plassmann y sus colegas estudiaron los efectos del precio en la percepción del vino y descubrieron que
las personas pensaban que los vinos más caros sabían mejor, incluso cuando se les ofrecía vinos
idénticos en botellas caras y baratas. 57
La influencia de este aprendizaje pavloviano de contingencias (la señal implica un resultado) en la
selección de acciones instrumentales (deliberativa, procedimental) puede ser general , lo que lleva a un
aumento de la excitación y un aumento de la velocidad y la probabilidad de realizar acciones en general,
o específica , lo que lleva a una mayor probabilidad de realizar una acción específica. En la PIT
generalizada, una señal con asociaciones positivas produce un aumento general en todas las acciones,
mientras que en la PIT específica, la señal produce un aumento en las acciones que conducen al resultado
58 resultados.
recordado pero no a otros. Abordaremos la PIT generalizada en la siguiente sección, cuando hablemos
vigor y costos de oportunidad; en esta sección, quiero analizar los efectos de un PIT específico.
Imaginemos, por ejemplo, que entrenamos a un animal para que empuje una palanca para las uvas y
otra para las frambuesas (simplemente, hacemos que el animal tenga hambre, le damos palancas y lo
recompensamos adecuadamente por empujar cada palanca. Por supuesto, en experimentos reales, esto
se hace con bolitas de comida con sabor, que se combinan en cuanto a nutrición, tamaño, etc., de modo
que la única diferencia es el sabor). Luego, imaginemos que entrenamos al animal (en otro entorno) para
que cuando escuche un tono, obtenga una uva (simplemente, tocamos el tono y luego, rápidamente, le
damos la uva al animal. Si hacemos esto lo suficiente, el animal esperará que obtener una uva seguirá
al tono). Si volvemos a poner al animal en el entorno de la palanca, cuando tocamos el tono, el animal
tendrá más probabilidades de empujar la palanca para las uvas. Podemos comprobar si el PIT es
generalizado o específico examinando si el animal presiona ambas palancas (un aumento generalizado
de la actividad) o solo la palanca de las uvas (un aumento específico de la acción que lleva a obtener las
uvas). Lo que sucede aquí es que el animal recuerda la posibilidad de obtener uvas mediante el tono, lo
que lleva a un aumento de la probabilidad de realizar una acción que lleve a obtener uvas. En cierto
sentido, el tono hizo que el animal sintiera hambre de uvas.
Por supuesto, esto también ocurre en los seres humanos. Ver los accesorios de una droga que un
adicto suele consumir provoca ansias por consumirla. 59 Algunos fumadores prefieren autoadministrarse un cigarrillo
60
sin nicotina en lugar de una inyección intravenosa de nicotina, lo que sugiere que la señal motivacional condicionada puede ser incluso más

fuerte que la sustancia adictiva. Y, en los ejemplos a los que volvemos una y otra vez en esta sección, los símbolos de marketing aumentan

nuestras percepciones internas de hambre y sed. 61 La semana pasada llevé a mis hijos al cine y, mientras estaba sentado esperando la

película, mi hijo se quejó de que todos los anuncios de comida eran demasiado pequeños para ser verdad .

Le estaban dando hambre, a pesar de que acababa de comer un gran

almuerzo. Dijo: “Ojalá no mostraran esos anuncios, para no tener hambre porque ya estoy muy lleno”.

yo
¡Algunos de los anuncios eran de pizza! ¿Quién come pizza en el cine?
Machine Translated by Google

Motivación 123

Vigor: Necesidad y costos de oportunidad

La mayoría de las decisiones que tomamos en la vida implican hacer una cosa a expensas de otra: si estamos
trabajando en nuestro escritorio, no estamos haciendo ejercicio; si estamos durmiendo, no estamos trabajando...
Existen docenas, si no cientos, de libros de autoayuda orientados a la gestión del tiempo. Las pérdidas que se
producen por no hacer algo se pueden definir como un coste de oportunidad62 : ¿qué oportunidades estás
perdiendo al elegir la opción A en lugar de la opción B?
Yael Niv y sus colegas Nathaniel Daw y Peter Dayan sugirieron recientemente que el nivel promedio (tónico)
de dopamina es una buena medida de la recompensa total disponible en el entorno. 63;M Esto sugiere que la
dopamina tónica está relacionada con el costo de oportunidad en el entorno. Un animal que sea inteligente en
el uso de su energía debería cambiar el vigor con el que trabaja en función de este costo de oportunidad. (Si
hay muchas otras recompensas en el entorno, uno debería trabajar más rápido, para poder llegar a esas otras
recompensas más rápido. Por otro lado, si no hay muchas otras recompensas, entonces no desperdicie la
energía haciendo este trabajo rápidamente.)

Curiosamente, esta hipótesis de la dopamina tónica como vigor unifica el papel de la dopamina en el
aprendizaje (las ráfagas fásicas impulsan el aprendizaje), la relevancia del incentivo (la dopamina implica una
señal que conduce a la recompensa) y los efectos motores de la dopamina en la enfermedad de Parkinson, la
66
enfermedad de Huntington y otras disfunciones de los ganglios basales.
La enfermedad de Parkinson ocurre cuando las células dopaminérgicas mueren, dejando a la
del Capítulo 10 que los ganglios basales usan la dopamina para persona con una 67 (Recuerde
aprender e impulsar el aprendizaje procedimental). Durante años, se pensó que la dopamina
impulsaba el movimiento porque los excesos de dopamina en los ganglios basales producían
movimientos inapropiados (llamados discinesias , del griego δυσ [ dis , malo] + κινησία [ kinesia ,
movimiento]), mientras que las deficiencias de dopamina en los ganglios basales producían una
dificultad para iniciar movimientos y una desaceleración general del tiempo de reacción (llamada
acinesia o bradicinesia , del griego α [ a , sin] y el griego βραδύ [ brady , lento]). 68

La otra cosa que impulsa la motivación y la voluntad de trabajar es, por supuesto, la necesidad.
Como ya hemos comentado en este capítulo ( Funciones intrínsecas de los objetivos , más arriba), un papel
importante de la motivación es identificar tus necesidades: un estado de deshidratación significa que necesitas
agua. Esto es casi demasiado obvio para decirlo, pero es importante recordar que no se trata de opciones
binarias: no se trata de “¿Tengo hambre?”, sino de “¿Cuánta hambre tengo?”. Cuanto más hambre tengas, más
dispuesto estarás a probar nuevos alimentos, más dispuesto estarás a trabajar para conseguir comida y mejor
69
sabrá esa comida. El vigor también depende de lo mucho que necesites ese resultado.
Varios autores han sugerido que los niveles de dopamina impulsan el vigor, tanto desde
El costo de oportunidad y las perspectivas de necesidad.70 Básicamente, estos autores sugieren que el tónico
Los niveles de dopamina permiten que un animal supere el esfuerzo: cuanto más dopamina esté disponible,
más dispuesto estará el animal a trabajar para obtener un resultado. Curiosamente, esto tiene similitudes
evolutivas con el papel de la dopamina en vertebrados muy simples, donde la dopamina vigoriza
movimiento de tasas.71

M Recuerde que las ráfagas fásicas de la señal de dopamina hacen que las transiciones en valor sean mejores que lo esperado, 64 Estas

las pausas de la señal de dopamina hacen que las transiciones en valor sean peores que lo esperado, son como ráfagas fásicas, mientras que

tomar una derivada de la señal de valor esperada. La dopamina tónica tomaría entonces la integral de esta señal de valor, que es la recompensa
65
promedio en el entorno.
Machine Translated by Google

124 El sistema de toma de decisiones

Las manipulaciones de la dopamina pueden llevar a un animal a trabajar más para obtener una
recompensa específica, estimulada por la presencia de señales visuales o auditivas cuando aumenta esa dopamina. 72
Las interacciones específicas entre la dopamina, el aprendizaje, la estimulación y la recompensa son un
área de investigación activa en muchos laboratorios alrededor del mundo y una fuente de mucha
controversia en la literatura científica. 73 Lo más probable es que la dopamina esté cumpliendo múltiples
funciones, dependiendo de su fuente, momento y objetivos neuronales.
En cualquier caso, la disposición de un animal a trabajar por una recompensa o a evitar un castigo es
74
Este es un tema motivacional un factor que está muy relacionado con el problema del PIT general.
importante, del que hablamos antes en este capítulo. La presencia de señales que indican la presencia
de recompensas probablemente implica que el mundo que te rodea es más rico de lo que pensabas. Si
hay más recompensas por conseguir, trabajar despacio significa gastar más de ese costo de oportunidad,
y un agente inteligente debería hacer el trabajo más rápido para poder volver a esas otras recompensas.

Resumen
En capítulos anteriores hablamos de la selección de acciones, pero no de lo que motiva esas
acciones. La motivación puede verse como la fuerza que impulsa las acciones. La motivación para
recompensas específicas depende de las necesidades específicas del animal (funciones intrínsecas
de meta), que pueden variar de una especie a otra. Curiosamente, los humanos parecen tener
funciones intrínsecas de meta para las recompensas sociales. Además de las funciones intrínsecas
de meta, también se pueden aprender señales que pueden impulsar la motivación, ya sea para
resultados específicos (Transferencia Pavloviana a Instrumental específica) o para vigorizar al
animal en general (Transferencia Pavloviana a Instrumental general). Estos componentes
motivacionales son una parte importante del sistema de toma de decisiones, porque definen los
objetivos y cuánto estás dispuesto a trabajar para alcanzarlos, incluso si no seleccionan
directamente las acciones a tomar para lograrlos.

Libros y artículos para lectura adicional • David W.

Stephens y John R. Krebs (1987). Foraging Th eory . Princeton, NJ: Princeton University Press . • Robert
Wright (1995). The Moral Animal:
Why We Are the Way We Are: The New Science of Evolutionary Psychology . Nueva York: Vintage . •
Kent C. Berridge (2012). From prediction error to incentive
salience: Mesolimbic computation of prize motivation . European Journal of Neuroscience, 35 1124–1143 .
,

• Yael Niv, Nathaniel D. Daw, Daphna Joel y Peter Dayan (2006). Dopamina tónica: costos de oportunidad
y control del vigor de la respuesta. Psicofarmacología, 191 507–520. ,
Machine Translated by Google

El equilibrio entre exploración

y explotación

Cascada al borde de las montañas

Más allá del caos arremolinado, el río

desaparece en el bosque oscuro, corriendo hacia el

mar. . . .

Para tomar las acciones correctas dentro de un entorno, uno debe conocer la estructura

del entorno y las consecuencias de esas acciones.

La exploración es el proceso mediante el cual un entorno nuevo se vuelve familiar. La

explotación es el proceso de utilizar ese conocimiento para sacar el máximo provecho

de un entorno familiar. Existe una disyuntiva entre estos dos procesos: la exploración

puede ser peligrosa, pero no saber si hay mejores opciones disponibles puede resultar

costoso.

Un tema que surge a menudo en los debates teóricos sobre la toma de decisiones es que existe una disyuntiva entre

aprender más sobre el mundo y utilizar lo que se ha aprendido para tomar las mejores decisiones. Imagine que está en un

casino con muchas máquinas tragamonedas diferentes disponibles para jugar. No sabe cuáles son las probabilidades de

pago de ninguna de ellas; para averiguarlo, tiene que jugar con ellas. A medida que juega con una máquina, aprende sobre

sus parámetros (qué probabilidad hay de que pague cuánto dados sus costos). Pero no sabe si una de las otras máquinas

sería una mejor opción. Uno puede imaginar dónde se ubicaría en este continuo de exploración para ver cuáles son los

pagos de las diversas máquinas y explotar el conocimiento que ya tiene para elegir la mejor opción que conoce. A Esta es

una tarea llamada la tarea 1 de la máquina tragamonedas de n brazos (como una extensión de la tarea original de la

máquina tragamonedas ).
de.

máquina, conocida como la “bandida manca” porque te robaba todo el dinero).

En un mundo estable, es mejor explorar un poco al principio y disminuir el tiempo de exploración.

2
Cambia con el tiempo a medida que aprendes sobre el mundo. Un buen sistema que se utiliza a menudo en robótica.

A El uso de “explotar” aquí tiene connotaciones desafortunadas en términos de “explotar a otros”. Lo que se quiere decir
aquí con “explotar” es simplemente usar el conocimiento que uno ha aprendido al explorar para tomar las mejores decisiones.

125
Machine Translated by Google

126 El sistema de toma de decisiones

y la literatura de aprendizaje automático B es darse la oportunidad de probar una máquina aleatoria en cada ronda.
Este nivel aleatorio se llama є (épsilon) y la estrategia se llama "estrategia épsilon". La pregunta, entonces, es ¿qué
debería ser épsilon en cada ronda? Las estrategias simples con un épsilon bajo y constante se llaman "épsilon
codicioso". Por ejemplo, puede intentar una acción aleatoria una ronda en cien y usar su conocimiento para elegir la
mejor opción en los otros noventa y nueve intentos de los cien. C En un mundo estable, debe explorar temprano y
luego establecerse en la mejor opción más tarde. En la literatura de aprendizaje automático, una estrategia común para

un mundo estable es usar una probabilidad exponencialmente decreciente de intentar una acción aleatoria. Esto es
explorar temprano y explotar después de haber aprendido la estructura del mundo en el que vive, pero nunca dejar de
explorar por completo.

Por supuesto, el mundo real no suele ser estable y no sería seguro tener una fase pura de exploración seguida de
una fase pura de explotación. Los algoritmos de aprendizaje automático más recientes se han basado en el seguimiento
explícito de la incertidumbre en cada opción.
6 Cuando la incertidumbre se vuelve demasiado grande en relación con lo que espera ganar con la
opción que está jugando actualmente, es hora de intentar explorar de nuevo. Esto requiere llevar un registro tanto de
la incertidumbre como del valor esperado de una opción. Como veremos a continuación, ahora hay evidencia conductual
de que las personas llevan un registro de la incertidumbre, que la incertidumbre está representada dentro del cerebro
y que las diferencias genéticas afectan la sensibilidad de los individuos a la incertidumbre (su disposición a cambiar del
modo de explotación al de exploración). 7

El valor esperado de una opción es cuánto espera ganar en promedio si continúa jugando con la opción; la
incertidumbre es qué tan inseguro está acerca de ese valor esperado.
A esto a menudo se le llama “riesgo” en los mercados financieros. 8 Imagina que sabes que una vez de cada veinte,

cuando pones un dólar en el juego, obtienes veintiún dólares. Ese juego tiene un pago positivo de $21/$20 o 1,05, lo
que significa que ganas el 5 % jugando. Por otro lado, otra máquina podría pagar $105 una vez de cada 100, lo que
D
juego.

B El aprendizaje automático es una rama de la informática en la que se desarrollan algoritmos para aprender del
mundo. 3 Aunque el aprendizaje automático suele vivir en las divisiones de inteligencia artificial de los
departamentos de informática, en realidad el aprendizaje automático es distinto de la inteligencia artificial. La
"inteligencia artificial" trata de intentar igualar (ya sea mecánica o computacionalmente) las habilidades humanas.
El "aprendizaje automático" trata de intentar construir el mejor algoritmo que pueda resolver el problema. Los
científicos que trabajan en el aprendizaje automático creen que una máquina que puede aprender del mundo
puede ser más eficiente y funcionar mejor que una máquina preprogramada. (Por ejemplo, imagina si tu termostato
pudiera aprender cuándo llegas a casa normalmente o cuándo te despiertas normalmente por la mañana. Podría
aprender a configurarse para calentar la casa antes de que llegues o justo antes de que te despiertes. Por
supuesto, podría programarse para hacer eso, pero entonces tendría que programarse por separado para cada
persona. Un solo algoritmo de aprendizaje 4 ) podría programarse una vez para aprender el momento adecuado para cada pers

C Esto se puede implementar más fácilmente seleccionando un número aleatorio entre 1 y 100 en cada intento. Si el
número aleatorio es 100, entonces realizas una acción aleatoria. Si es cualquier otra, eliges la mejor opción que puedas.
También se podría simplemente elegir la acción aleatoria cada 100 intentos, pero el peligro es que si las probabilidades de
ganar tienen alguna oscilación, entonces cada 100 intentos podría coincidir con la oscilación y no te darías cuenta. La
aleatoriedad es mejor. Por supuesto, los humanos somos terribles en lo que respecta a la aleatoriedad. 5
D
Sí, sé que las máquinas tragamonedas siempre tienen un pago menor al 100% porque el objetivo de los casinos es
obtener ganancias. Si lo desea, puede pensar en estos juegos como si estuviera depositando dinero en cuentas de ahorro. Una
cuenta de ahorro en un banco puede estar asegurada por la FDIC y, por lo tanto, ser muy segura (porque la única forma de
perder dinero es que Estados Unidos se hunda), pero solo obtendría un interés del 1% cada año. Por otro lado, una cuenta de

ahorro mutua (continúa)

Machine Translated by Google

Exploración y Explotación 127

También tiene un pago positivo de $105/$100 o 1,05 o 5%, pero es mucho más variable. Si jugaras a cualquiera
de los dos juegos durante mucho tiempo, el valor esperado de jugar sería el mismo. Pero si juegas a cada
juego solo unas pocas veces, podrías perder más (o ganar más) en el segundo juego. El segundo es más
riesgoso.

Incertidumbre

Es útil pensar en tres tipos diferentes de incertidumbre: incertidumbre esperada , incertidumbre inex
10
esperada y ambigüedad .
En el primer tipo (incertidumbre esperada), se reconoce que existe una imprevisibilidad conocida en el
mundo. Vemos esto cuando un meteorólogo dice que hay un “60% de probabilidad de lluvia”. Si el meteorólogo
está en lo cierto, entonces 6 de cada 10 veces que el meteorólogo dice “60%”, debería llover y 4 de cada 10
veces, debería estar seco.
El segundo tipo (incertidumbre inesperada) implica el reconocimiento de que las probabilidades han
cambiado. Esto es lo que se prueba en las tareas de aprendizaje de inversión , en las que las probabilidades
de entrega de recompensa se modifican de repente sin una señal explícita que indique al sujeto que las
probabilidades han cambiado. Las ratas, los monos y los humanos pueden rastrear de manera confiable tales
11
Los cambios. Dado que la inversión no tiene ninguna señal, el reconocimiento del cambio en las
12 probabilidades. Los humanos y otros animales pueden cambiar com
cambios se convierten en un problema de teoría de la
información, tan rápido como dice la teoría de la información. Cuando se enfrentan a un cambio repentino en
la probabilidad de entrega de recompensas (como en la extinción, cuando las recompensas de repente ya no
se entregan, véase el Capítulo 4), los animales muestran frustración y aumentan su exploración de opciones
13
alternativas.
La diferencia entre incertidumbre esperada e inesperada fue expuesta de manera más famosa (infame) por
el Secretario de Defensa Donald Rumsfeld en su conferencia de prensa defendiendo los fracasos de la invasión
estadounidense de Irak, en la que afirmó que había “incógnitas conocidas” (incertidumbre esperada) y
“incógnitas desconocidas” (incertidumbre inesperada) y que no se le debía culpar por juzgar mal las “incógnitas
desconocidas”. 14 Por supuesto, la queja no era que hubiera una incertidumbre inesperada, sino que Rumsfeld
y su equipo no habían planificado la incertidumbre inesperada (lo que cualquier planificador militar debería
hacer 15 ) y que Rumsfeld y su equipo deberían haber esperado que hubiera una incertidumbre inesperada.

16
El tercer tipo de incertidumbre es la ambigüedad , a veces llamada incertidumbre de estimación ,
incertidumbre debida a una falta conocida de exploración. Esto es lo que a menudo se denomina en la literatura
sobre aprendizaje animal como la transformación de algo nuevo en algo familiar y es el objetivo principal de la
17
exploración. En este caso, la incertidumbre se debe a que solo se dispone de un número
limitado de muestras. Cuantas más muestras se tomen, mejor será la estimación que se puede obtener. La
exploración implica tomar más muestras, con lo que se obtiene una mejor estimación de la incertidumbre esperada.
Los humanos encontramos la ambigüedad muy desagradable. El ejemplo clásico de ambigüedad es
imaginar dos frascos que contienen canicas y tener que decidir de cuál frasco escoger. 18 Cada frasco contiene
una mezcla de canicas rojas y azules. Ganarás $5 si escoges una canica roja y

Es posible que la cuenta de fondos no esté asegurada por la FDIC (y, por lo tanto, puede perder dinero), pero podría obtener
un interés promedio del 5 % cada año. Comprar acciones puede ser muy variable: ganar un 10 % un año y perder un 10 %
el siguiente. Por eso, una buena planificación financiera requiere una cartera diversificada para equilibrar el riesgo. 9
Machine Translated by Google

128 El sistema de toma de decisiones

1 si sacas una canica azul. Imagina que ves que se llena el primer frasco, de modo que sabes que la mitad de las
canicas son rojas y la otra mitad son azules. (Aún tendrás que escoger con los ojos cerrados y el frasco sobre tu
cabeza, de modo que la canica que escojas será aleatoria, pero conoces la distribución de canicas en el primer
frasco). Sin embargo, imagina que el segundo frasco se llenó mientras no estabas allí y todo lo que sabes es que
hay una mezcla de canicas rojas y azules. ¿De qué frasco escogerás? En el primero, sabes que tienes una
probabilidad del 50:50 de que te salga roja o azul. En el segundo, podrías tener una probabilidad del 90:10 o una
probabilidad del 10:90. Sumando todas las probabilidades posibles, resulta que también tienes una probabilidad del
50:50 de que te salga roja o azul. (La probabilidad de ver una mezcla 90:10 de canicas rojas y azules es la misma
probabilidad de ver una mezcla 10:90. Como 90:10 es lo opuesto a 10:90, en promedio son equivalentes a una
mezcla 50:50 tanto en el promedio de primer orden [valor esperado] como en la variabilidad de segundo orden
[riesgo].) Sin embargo, las personas prefieren confiablemente el primer frasco, incluso cuando se les señala el
hecho de que el segundo frasco suma la misma probabilidad. El primer frasco contiene riesgo (incertidumbre
esperada; podría obtener rojo o azul). El segundo frasco, sin embargo, también contiene ambigüedad ( ¿Cuál es la
mezcla? ) así como riesgo ( ¿Cuál es la variabilidad? ). Esto se conoce como aversión a la ambigüedad .

mi
y es técnicamente un ejemplo de la paradoja de Ellsberg.
Se han sugerido varias explicaciones para la paradoja de Ellsberg que son reacias a la ambigüedad debido a
F
incluyendo que los humanos una consecuencia de ser más sensibles.
son más propensos a las pérdidas que a las ganancias o a la incapacidad de hacer el cálculo completo de
probabilidades necesario para el caso de ambigüedad. Alternativamente, la paradoja de Ellsberg podría surgir
21
porque los humanos tienen heurísticas inherentes destinadas a evitarComo el sujeto no conoce la mezcla del
el engaño.
segundo frasco, es posible que se haya elegido que sea particularmente malo, solo para que el experimentador no
tenga que pagarle mucho al sujeto. (Las reglas sobre los estudios con sujetos humanos generalmente no permiten
que un experimentador mienta a un sujeto, por lo que cuando el experimentador le dice al sujeto que hay una
mezcla 50:50, tiene que ser verdad, pero cuando el experimentador le dice al sujeto que solo hay una "mezcla",
podría haber sido elegido para que sea particularmente malo. Por supuesto, no está claro que los sujetos
GRAMO

Pero,

de estos experimentos crean eso).

Los animales dedicarán esfuerzos de manera confiable para reducir la incertidumbre (esto significa que el
conocimiento realmente es gratificante por sí mismo). La gente suele decir que descubrir algo les da una sensación
positiva fuerte, tanto de logro como de saber cómo funcionan las cosas ( sin duda, puedo decir personalmente que
no hay sensación como el momento en que un problema complejo de repente se vuelve claro con una solución, o
el momento en que me doy cuenta de cómo un conjunto complejo de experimentos que parecen incompatibles
entre sí se pueden unificar en una sola teoría). No solo los humanos, sino también otros animales gastarán energía
simplemente para reducir la ambigüedad. Ethan BrombergMartin y Okehide Hikosaka probaron esto.

La paradoja fue introducida por Daniel Ellsberg (de los famosos Papeles del Pentágono 19 ) en su tesis doctoral en economía
20
de 1962. Se llama paradoja porque las simples ecuaciones de los economistas no
pueden explicar por qué los humanos son reacios a la ambigüedad.
F
Hasta donde yo sé, aunque la paradoja ha sido demostrada sólidamente en humanos, no ha sido probada en
animales no lingüísticos, probablemente porque depende de que el experimentador le diga al sujeto las dos
probabilidades.

Estas reglas se establecieron debido a experimentos atroces como el experimento de sífilis de Tuskegee, donde se mintió
a los sujetos sobre los objetivos y las consecuencias de los experimentos. Hoy en día, estas reglas

se siguen de forma muy estricta y resulta excepcionalmente difícil obtener aprobación para mentirle a un sujeto experimental.
Machine Translated by Google

Exploración y Explotación 129

en monos y encontraron que la información que reduce la incertidumbre, incluso si no tiene efecto sobre
la cantidad final de recompensa que el animal obtiene, ha obtenido o espera obtener, produce 24 (que,
neuronas de dopamina “mejor si recuerdan, vimos que representaba cosas que se activaban en las
de lo esperado”, Capítulo 4).

Recopilación de información

Las teorías computacionales han propuesto que una buena manera de alentar a un agente computacional
o robot a explorar es proporcionar “bonificaciones de exploración”, donde el sistema proporciona una
señal “mejor de lo esperado” cuando el agente ingresa a una nueva parte del mundo. 25
Desde el punto de vista computacional, si esto se corresponde con una señal “peor de lo esperado”
cuando el agente regresa a su zona familiar, entonces la función de valor total se aprenderá correctamente.
Pero no está claro si la señal contrarrestante de que “es peor de lo esperado” aparece al regresar.
Las personas y los animales que regresan a una zona segura y familiar tienden a mostrar alivio más
26
que una señal de decepción del tipo “oh, bueno, eso ya Aunque es posible demostrar estabilidad,
pasó”. Simulaciones han demostrado que, en muchos mundos simulados simples, el hecho de no tener
una señal de novedad “peor de lo esperado” al regresar no altera demasiado la función de valor, ya
que, si bien el agente solo tiene una señal de novedad positiva “mejor de lo esperado”, lo hace tan bien
o mejor que los agentes sin señales de novedad.

27 Un agente de este tipo sería demasiado optimista sobre las posibilidades

futuras. Esta idea de que el agente debería recibir una bonificación por la exploración se refleja en la
creencia humana de que las cosas siempre podrían ser mejores en otro lugar. Como Tali Sharot analiza
, son bastante contundentes en el sentido de que los humanos
en su libro The Optimism Bias, los datos
son optimistas en ese sentido: “la hierba siempre es más verde en el otro lado”. Los humanos tienden a
sobrestimar la expectativa de recompensas positivas en elecciones novedosas, lo que conduce a la
28
exploración.
Varios estudios han encontrado este tipo de “bonificaciones por novedad” en las señales de
dopamina en monos y en la actividad fMRI de las áreas de proyección de dopamina en humanos. 29
Los animales encuentran gratificante la novedad y naturalmente irán a explorar un objeto nuevo
ambiente. colocado en su 30 Esto es tan natural que no requiere ningún entrenamiento. Harry
Harlow, en sus primeros experimentos con monos, descubrió que los monos completamente alimentados
trabajarían más duro para ver objetos nuevos que los monos hambrientos para conseguir comida. Las
ratas hambrientas explorarán un nuevo entorno antes de comer. Esto sugiere que la exploración (la
búsqueda de conocimiento o información) es una meta intrínseca del tipo discutido en el Capítulo 13.

Aprendiendo de los demás

En el mundo real (fuera del laboratorio), por supuesto, esta exploración también puede ser peligrosa.
Una ventaja que tienen los humanos es que pueden imaginar futuros ( pensamiento futuro episódico ,
capítulo 9) y pueden explorar posibilidades imaginando esas posibles opciones futuras, incluso sin
probarlas necesariamente. Una forma en que esto puede ocurrir es con el aprendizaje ficticio , en el
que uno aprende observando a otros. Uno puede observar el comportamiento de otra persona.
Machine Translated by Google

130 El sistema de toma de decisiones

éxitos y fracasos y aprender sobre lo que le sucede sin experimentarlo directamente. 31

Por supuesto, este es uno de los aspectos más poderosos del lenguaje humano, porque el lenguaje
puede utilizarse para informar y enseñar. Varios autores han observado que la cultura humana es
fundamentalmente lamarckiana; los padres realmente transmiten las lecciones que aprenden en sus vidas a
sus hijos. 32 (Aunque esas lecciones no siempre perduran...) Sin embargo, esta naturaleza lamarckiana de
la cultura es una de las razones por las que los humanos se han extendido tan rápidamente a todos los
rincones del planeta, desde las selvas más cálidas hasta las tundras más frías, incluso enviando hombres a
la Luna y robots a los demás planetas del sistema solar.
Ahora sabemos que cuando un mono observa a otro mono realizando una tarea con la que está
familiarizado, el conjunto de neuronas corticales que normalmente se activan cuando el observador está
realizando una tarea también se activan cuando el observador simplemente está mirando al otro mono
realizar la tarea. 33 Estas neuronas se denominan "neuronas espejo" porque reflejan el comportamiento que
está realizando el otro mono. Un conjunto similar de circuitos corticales humanos está activo (como se
determina mediante fMRI) ya sea que uno esté realizando la acción uno mismo 34 Aunque la conclusión
o mirándola. Las opiniones sobre algunos de estos resultados son controvertidas (¿ Son las neuronas espejo
realmente fundamentales para la imitación, o solo reconocen señales relacionadas? ¿Simplemente reflejan
interacciones sociales? ), ciertamente, todos sabemos que aprendemos mucho observando a otros. 35
De manera similar, también sabemos que aprendemos indirectamente sobre la recompensa y el fracaso
al observar a los demás. Parece existir un sistema de espejo similar para las emociones, donde reconocemos
e interpretamos las emociones de los demás. 36;H Este reconocimiento está relacionado con las emociones
de empatía, envidia y arrepentimiento. 39 Estas emociones dependen de una interacción entre las
capacidades hipocampales para imaginarse a uno mismo en otra situación y las capacidades
orbitofrontales para conectar la emoción con esas situaciones. 40
En la empatía,
reconocemos el éxito o la pérdida de otro y sentimos una emoción similar. En la envidia, reconocemos
la ganancia de otro y deseamos haberla logrado. Hay una contraparte interesante de la envidia, el
regodeo o schadenfr eude , que significaalegrarse de la adversidad de otro (de , alegría), que también
que la envidia, que reflejan las emociones de las depende de las mismas estructuras cerebrales
palabras alemanas schaden , daño y fr eude . Y, en el arrepentimiento, reconocemos un camino que
podríamos haber elegido pero no lo hicimos.

En gran medida, esta es la clave del poder de la narrativa y la literatura. Identificamos las grandes
historias como aquellas que colocan a personajes realistas en situaciones, observando cómo reaccionan. La
gran literatura nos permite experimentar indirectamente opciones y situaciones que tal vez nunca
experimentaríamos. Si observamos las grandes obras de la literatura, ya sean clásicas o populares,
I
encontramos Se encuentra que describen consistentemente la toma de decisiones humanas desde
perspectivas notablemente realistas y complejas. Esto es cierto tanto si hablamos de

Hay cierta evidencia de que parte del problema con los psicópatas puede deberse a una disfunción en este sistema
de espejo y su capacidad para reconocer las emociones de los demás, 37 pero otros han argumentado que esta disfunción
38
se debe principalmente a una incapacidad para representar correctamente las emociones internas derivadas socialmente.
I
Probablemente no se debería hacer una distinción entre “clásico” y “popular”. La mayor parte de la literatura
que hoy llamamos “clásica” fue inmensamente popular en su época. Shakespeare, por ejemplo, fue con diferencia el
dramaturgo más popular de su época, y sus obras están llenas de chistes groseros para el público popular. (Véase,
(Por ejemplo, la escena de la muerte de Mercutio en Romeo y Julieta , la mayor parte de El sueño de una noche de verano, , por ejemplo,

Porter en Macbeth, por nombrar solo tres). A menudo he pensado que Shakespeare en su época probablemente estaba cerca de...
es como Steven Spielberg en nuestros días, con aventuras taquilleras como Indiana Jones y críticamente
(continúa)
Machine Translated by Google

Exploración y Explotación 131

Dramas realistas, mundos mágicos o ciencia ficción; incluso la ciencia ficción y el realismo mágico dependen de personajes

que se comporten de manera realista en situaciones extrañas. Aunque los lectores generalmente están dispuestos a

aceptar situaciones extrañas en otras galaxias o personajes con poderes mágicos, los lectores generalmente no están

dispuestos a trabajar con personajes poco realistas .

Al leer o ver estas narraciones, nos colocamos en esos mundos e imaginamos qué haríamos en esas situaciones, y

empatizamos con los personajes y sentimos envidia y arrepentimiento por las decisiones que toman.

Exploración y explotación a lo largo del ciclo de vida

El trabajo computacional de la literatura de aprendizaje automático ha demostrado que, en un mundo inmutable, la solución

óptima para el equilibrio entre exploración y explotación es explorar temprano y explotar tarde. 42 Por supuesto, “temprano”

y “tarde” deben definirse según la vida útil esperada del agente. Esto predeciría que uno vería a los jóvenes explorando y a

los adultos explotando. Si bien esto es cierto, en general, hay otras diferencias importantes que cambian la forma en que

cambia el equilibrio entre exploración y explotación a lo largo de la vida.

En primer lugar, como hemos comentado en otras ocasiones, no vivimos en un mundo inmutable. Por lo tanto, no se

puede explorar al principio y ya está. En cambio, hay que medir la exploración en función de lo bien que se está haciendo

en general. 43 Cuando las recompensas que se reciben empiezan a disminuir, hay que aumentar la exploración. Cuando se

enfrentan a una disminución de las recompensas entregadas, los animales se estresan y se frustran y muestran un aumento

de una serie de comportamientos, tanto el comportamiento que solía impulsar las recompensas como otros comportamientos

exploratorios, empezando por comportamientos similares al que solía impulsar la entrega de la recompensa. Todos nos

hemos visto hacer esto, empezando por probar el comportamiento de nuevo ( ¡Esto solía funcionar! ), pasando a cambios

menores ( ¿Por qué no funciona esto? ) y luego a nuevos comportamientos ( Quizás esto funcione en su lugar ).

En segundo lugar, la exploración es peligrosa. Esto significa que la evolución preferirá a las criaturas que desarrollen

habilidades básicas antes de salir a explorar. En los seres humanos, los niños pequeños exploran dentro de límites muy

estrictos establecidos por los padres, y esos límites se expanden a medida que crecen. Como todo padre sabe, los niños

quieren saber que hay límites. Quieren poner a prueba esos límites, pero también quieren que esos límites existan. Esto

sugiere que el período exploratorio primario en los seres humanos debería ocurrir después de que la persona desarrolle

talentos suficientes para permitirle manejar los peligros de explorar el mundo.

Los años de la adolescencia, la juventud y los primeros años de la universidad son conocidos por sus altos niveles de

44 Estos son los años exploratorios, donde los humanos

consumo de drogas, sexo exploratorio y toma de riesgos en general.

están determinando cuál es la forma del mundo fuera de los confines de su

Películas tan aclamadas como La lista de Schindler . De manera similar, toda la ciudad de Atenas acudía a las funciones
anuales de Esquilo, Sófocles y Eurípides, cada uno de los cuales ganaba regularmente el premio a la mejor obra.
Las comedias de Aristófanes contienen lo que hoy llamamos humor de “chicos de fraternidad”, con mucho sexo
( Lisístrata ), personajes exagerados ( Las nubes ) y chistes sobre pedos ( Las ranas ).
J Surge una pregunta interesante cuando los personajes son explícitamente no humanos, ya sean extraterrestres,
criaturas mágicas o robots. En estas historias, las criaturas no humanas tienden a estar basadas en culturas humanas
41
específicas o a tener rasgos exagerados pero notablemente humanos. Se puede decir que la ficción Escribir ciencia
sobre extraterrestres trata de encontrar el equilibrio entre hacer que los extraterrestres sean demasiado humanos y
hacerlos demasiado extraños.
Machine Translated by Google

132 El sistema de toma de decisiones

Estructura familiar. En general, la mayoría de los seres humanos superan estos vicios con la edad y se asientan a
medida que pasan de una estrategia de exploración a una de explotación.
En el próximo capítulo veremos cómo la corteza prefrontal desempeña un papel en la medición del
riesgo y el control de la exploración peligrosa. Uno de los resultados más interesantes descubiertos
en las últimas décadas es que la corteza prefrontal en los humanos no se desarrolla completamente
hasta mediados de los veinte años. 45 Esto significa que los adolescentes no tienen la misma
evaluación prefrontal del riesgo y la misma inhibición conductual de hacer cosas estúpidas que los
adultos. Como hemos visto a lo largo del resto de este libro, las conductas son generadas por el
cerebro físico, y los cambios en la conducta a menudo son causados por cambios físicos en el cerebro .

Libros y artículos para lectura adicional • Tali

Sharot (2011). El sesgo del optimismo: un recorrido por el cerebro irracionalmente positivo .
Nueva York: Pantheon .

• Abram Amsel (1992). Teoría de la frustración . Cambridge, Reino Unido: Universidad de Cambridge.
Prensa .

• BJ Casey, Sarah Getz y Adriana Galvan (2008). El cerebro adolescente.

Revisión del desarrollo, 28 , 62–77 .

K
Como he dicho en otras partes de este libro (ver Capítulo 24 para una discusión detallada), el reconocimiento de que
existen causas físicas y evolutivas para una mayor asunción de riesgos en los adolescentes no exime al adolescente de la
responsabilidad por sus acciones. Es importante reconocer que las tendencias sociobiológicas no son el destino y no
eximen a uno de la responsabilidad. Aunque la mayoría de los consumidores de drogas comienzan a consumirlas en sus
años de adolescencia y muchos de ellos dejan de consumir drogas y se asientan en una vida normal (no
46
La gran mayoría de los adolescentes, que llevan una vida basada en las drogas, no sucumben a la presión de Uno

grupo ni al consumo de drogas. Se espera que antes de enviarlos a la universidad o al mundo para que exploren, se les
haya enseñado a los adolescentes cuáles son sus límites y tengan una idea precisa de los riesgos y peligros.
Machine Translated by Google

Autocontrol

una piedra es un espejo

Sin concentración la luz se

refleja en todas direcciones

Tenemos la experiencia consciente de que a veces podemos “pasar por

alto” las respuestas emocionales o habituales. Esto significa que algún
proceso debe mediar entre los múltiples sistemas de toma de decisiones.
Los mecanismos de ese proceso de “anulación” aún se están estudiando,
pero se sabe que algunos componentes neuronales, como la corteza
prefrontal, están involucrados.

Como hemos visto en los capítulos anteriores, el sistema de toma de decisiones humano contiene
múltiples componentes de selección de acciones. Los reflejos son impulsados en gran medida por el
control espinal, pero pueden ser anulados por otros sistemas en el cerebro (como vimos con Lawrence de
Arabia sosteniendo la cerilla). Los sistemas de respuesta emocional (pavlovianos) liberan conductas
aprendidas a lo largo de escalas de tiempo evolutivas, pero, nuevamente, pueden ser anulados por otros
sistemas (controlando el miedo). Los sistemas de aprendizaje procedimental son hábitos que se
desarrollan en respuesta a contingencias de recompensa consistentes, pero nuevamente, estos pueden
ser anulados por otros sistemas (como en el caso de recordar tomar la ruta alternativa para ir al trabajo).
Y finalmente, está el sistema deliberativo, que busca entre las posibilidades futuras pero no tiene (en
general) que elegir la opción más deseada. (Tomemos, por ejemplo, la capacidad de seleccionar una
pequeña recompensa en lugar de una droga muy deseada; el deseo por una opción de alto valor puede
ser anulado para tomar lo que a primera vista parece ser una opción de menor valor).
La palabra “anular” proviene de la capacidad de la nobleza de dominar las decisiones (ya que la
nobleza servía como caballería y podía literalmente anular la oposición si llegaba el caso) y se hace eco
del concepto platónico de dos caballos que conducen un carro: un caballo salvaje e incontrolable
(dionisíaco) y un caballo intelectual, racional y razonado (apolíneo), así como de los conceptos
agustinianos y freudianos de la razón humana que controla un pasado animal salvaje.
1 Estos conceptos se hacen eco del concepto popularizado de caballo y jinete, donde el
2
caballo impulsa las respuestas emocionales y el jinete las respuestas razonadas.

133
Machine Translated by Google

134 El sistema de toma de decisiones

Como sabe cualquiera que haya montado a caballo, montar a caballo es muy diferente a conducir un
coche. El caballo tiene sensores internos y hará algunas de las tareas básicas por ti (como no chocar
contra las paredes), mientras que un coche hará lo que le digas. Por supuesto, esto significa que a veces
tienes que luchar contra el caballo (por ejemplo, si necesitas conducirlo a la batalla) de una manera en la
que no tienes que convencer a un coche. (Sin embargo, me recuerda la escena de la película Dark Star de
John Carpenter, de humor negro , en la que el teniente Doolittle tiene que convencer a la “inteligente”
Bomba Nº 20 de que realmente “quiere” lanzarse y hacer estallar el planeta).
Será interesante ver cómo cambia la conducción de un automóvil a medida que introducimos en ellos
sistemas de decisión cada vez más autónomos (como el control de velocidad basado en sensores, la
dirección automática y los sistemas de navegación GPS). 3Haidt ha popularizado esta analogía como un
Jonathan
elefante y un jinete en lugar del tradicional caballo y jinete, porque el elefante es una criatura más poderosa
4
y ningún jinete puede controlar completamente al elefante.
(Por supuesto, esto pasa por alto la posibilidad de que el jinete y el caballo puedan entenderse tan bien y
estar tan sincronizados como para ser un equipo aún más capaz que cualquiera de ellos individualmente).

En todas estas analogías, existe la creencia de que el “yo” tiene que trabajar para ejercer control sobre
el “otro”. Como señalamos al principio del libro (capítulo 1), usted es tanto el caballo como el jinete (o el
elefante y el jinete). Robert Kurzban, en su nuevo libro, rechaza el concepto del yo individual y sugiere que
el “autocontrol” se entiende mejor como un conflicto entre múltiples módulos. 5 En el lenguaje de este libro,
el sistema de toma de decisiones que es usted incluye los reflejos que heredó, el aprendizaje pavloviano
que lo impulsa, los hábitos que ha aprendido, las historias que cuenta y la deliberación que lleva a cabo.
Sin embargo, el autocontrol es algo que nos parece muy real como humanos.

De manera consciente, sabemos cuándo ejercemos con éxito nuestro autocontrol y (posteriormente)
sabemos cuándo no lo hacemos. Por lo tanto, es importante comprender en qué consiste este proceso.

Estudiando el autocontrol en el laboratorio

Antes de poder desmantelar los mecanismos del autocontrol, necesitamos encontrar una manera de hacer
que un sujeto demuestre autocontrol en el laboratorio y medirlo. En primer lugar, queremos ser cuantitativos
en cuanto a cuándo las personas muestran autocontrol y cuándo no. Esto nos permitirá examinar los
mecanismos de las fallas del autocontrol. En segundo lugar, nos gustaría poder acceder al autocontrol
directamente y no tener que esperar a que una persona se salga del camino.
En tercer lugar, nos gustaría poder examinar los fallos de autocontrol en situaciones no peligrosas.
En cuarto lugar, nos gustaría poder utilizar nuestras grandes máquinas de medición (fMRI, EEG, registros
neuronales) para ver los correlatos físicos del autocontrol. Y en quinto lugar, nos gustaría poder
Examinar el autocontrol en animales no humanos.

El autocontrol ha sido un tema de estudio desde el inicio de la psicología moderna.

(El concepto de Freud del ello, el yo y el superyó es una teoría de múltiples etapas del autocontrol. 6 )
A lo largo de los años se han introducido varias medidas particularmente sensibles de autocontrol, entre
ellas la tarea Stroop y la tarea de la señal de stop, así como tareas, que colocan a los sujetos en situaciones
más realistas, como la tarea del malvavisco y sus análogos animales que comparan representaciones
abstractas y concretas (el chimpancé y las gominolas). 7
Por último, está la tarea de rechazo de dulces, , que nos llevará a cuestiones de carga cognitiva y de
cómo el autocontrol puede cansarse. 8
Machine Translated by Google

Autocontrol 135

Quizás el experimento más simple para abordar la cuestión del autocontrol es el experimento de Stroop.
Tarea de Stroop, una tarea notablemente simple pero sutil en la que se le muestra a una persona una palabra en
un color y se supone que debe nombrar el color del texto. Esto normalmente es muy fácil. Pero si la palabra en sí
es un color (como la palabra "rojo" escrita en azul), entonces aparece una interferencia entre la lectura de la
palabra en sí y el reconocimiento del color en el que está impresa. Esta interferencia produce una ralentización
del tiempo que se tarda en decir la palabra (el tiempo de reacción) y aumenta la probabilidad de cometer un error.
Ambas medidas producen medidas cuantitativas de disonancia cognitiva y rastrean otras medidas de autocontrol.
9 El aumento y la disminución de los tiempos de reacción en la tarea de Stroop es tan confiable que ahora se
utiliza para probar la disonancia cognitiva y la atención a otros conceptos, por ejemplo, para palabras relacionadas
con alimentos en personas obesas y palabras relacionadas con drogas en adictos. 10

La tarea Stroop no se puede utilizar con animales (que no saben leer), y en este caso la tarea de la señal de
stop ha sido muy útil. En la tarea de la señal de stop, se entrena al sujeto para que reaccione lo más rápido
posible a una señal de avanzar (como “cuando se encienda la luz, presiona el botón”), pero a veces aparece una
señal diferente (una señal de ¡Alto! ) entre la señal de avanzar y la reacción del sujeto. Si el sujeto ve la señal de
stop, se le recompensa por no reaccionar y se le castiga por reaccionar: el sujeto tiene que detener la secuencia
de acción motora ya iniciada. La tarea de la señal de stop se ha utilizado con éxito en ratas, monos y humanos, y
el rendimiento es similar en las diferentes especies.
11

En general, la descripción más acertada de la tarea es que hay procesos separados, cada uno de los cuales
corre hacia un umbral (un proceso de ¡adelante! y un proceso de ¡Alto! ). Se supone que la señal de ¡Alto! se
ejecuta más rápido que la señal de ¡adelante !, pero también que comienza más tarde. Si la señal de ¡Alto!
alcanza el umbral antes que la señal de ¡adelante !, el sujeto puede cancelar la acción y detenerse 12 Los registros
o ella misma. neuronales han encontrado una actividad creciente en ciertas áreas (estructuras de control motor

cortical y el núcleo subtalámico [una parte de los ganglios basales]) que rastrean los dos componentes de la
13
carrera y su interacción.
Tanto la tarea de Stroop como la de la señal de stop son tareas controladas por computadora y cronometradas.
Las otras tareas mencionadas anteriormente dependen de objetos físicos reales que se ofrecen a los sujetos;
esto produce resultados diferentes a los de los símbolos o imágenes de objetos. 14 En los primeros
capítulos del libro nos encontramos con un experimento (la Parábola de las Gominolas, Capítulo 1)
en el que los chimpancés tenían que elegir entre dos juegos de gominolas.
La clave de esta tarea fue que el sujeto obtuvo la bandeja que no eligió: para obtener la bandeja con más
caramelos, tuvo que alcanzar la otra. 15 Sarah Boysen y Gary Berntson
descubrieron que sus sujetos elegían mucho mejor la “porción humilde” si utilizaban símbolos en lugar de
caramelos de verdad. Los seres humanos también muestran preferencia por los objetos reales, en particular los
objetos sensorialmente positivos, cuando se enfrentan a tareas de decisión experimentales.
16

Esta preferencia por los objetos reales nos deja con una inconsistencia importante (e interesante) en los
sistemas de toma de decisiones y subyace a algunos de los problemas con la valoración que vimos en nuestro
análisis inicial del “valor” (Capítulo 3). La idea de una cosa y la cosa física pueden tener valores muy diferentes.
Esto ocurre porque hay múltiples sistemas de toma de decisiones que compiten por esa valoración. Si se utiliza
el sistema pavloviano (Capítulo 8) (cuando el objeto está físicamente frente a nosotros), hacemos una valoración,
pero si no lo está (si estamos utilizando el sistema deliberativo, Capítulo 9), hacemos otra.

17
Esto crea una inconsistencia interesante en la toma de decisiones. Aunque un alcohólico puede

negar el deseo de beber cuando está sentado en su casa, ese mismo alcohólico sentado en su casa puede sentir el impulso de beber.
Machine Translated by Google

136 El sistema de toma de decisiones

El bar una hora más tarde aceptará esa bebida. Algunos autores han sostenido que la forma de
pensar en esto es que hay dos yoes: que tu yo actual está en conflicto con tu yo futuro. Otros
autores han sugerido que hay dos módulos, uno que piensa a largo plazo y otro que responde de
manera más inmediata. Creo que es más sencillo reconocer que somos inconsistentes e
irracionales y averiguar cómo manejar nuestras vidas en torno a esa inconsistencia e
irracionalidad. Una forma de ejercer autocontrol es reconocer esta inconsistencia y comprometerse
de antemano con una condición que no te permita alcanzar esa difícil elección futura. 18 Por
ejemplo, el alcohólico puede darse cuenta de que será muy difícil no beber en el bar y puede
decidir no ir al bar en primer lugar. Un jugador con un problema conocido puede tomar una ruta
diferente a casa para no pasar por el casino.
19

Esto sugiere la importancia de la atención y la distracción en el autocontrol 20 —si podemos mantener

nuestra atención en la otra opción, podemos estar en mejores condiciones de evitar la elección pavloviana.
De manera similar, si podemos prestar atención a aspectos específicos de una alternativa, podemos ser
capaces de cambiar la valoración de esa alternativa frente a la tentación. Esta puede ser una de las razones
por las que la religión personal es a menudo una fuente de fortaleza frente a un peligro o tentación graves.
La religión puede permitir a las personas mantener su atención en una opción alternativa que les impida
cometer el “pecado” que están tratando de controlar. 21
Pero ¿qué pasa si uno se enfrenta a esa elección inmediata? ¿Es una causa perdida? ¿Cuáles son los
mecanismos de autocontrol? Incluso el alcohólico que se enfrenta a una bebida en un bar puede negar a
veces esa necesidad imperiosa de beber.
22
En la clásica tarea del malvavisco , Introducido por Walter Mischel en la década de 1960, Se
lleva a un niño a una habitación, se coloca un malvavisco (o un dulce o juguete equivalente de alto
valor) frente al niño y se le dice: “Si puedes esperar quince minutos sin comer el malvavisco, te
daré dos malvaviscos”. Luego el adulto sale de la habitación.
Los videos de los experimentos originales son ahora famosos en la literatura psicológica porque los niños
muestran conductas clásicas de autocontrol. Tratan de distraerse del malvavisco. Se cubren los ojos para
no tener que mirar el malvavisco. Se dan la vuelta. Realizan otras acciones, como dar patadas al escritorio.
El problema es que es difícil mantener la atención fuera del malvavisco. Los experimentos de seguimiento
han demostrado que la capacidad de esperar está sorprendentemente bien correlacionada con el éxito
posterior, incluyendo mantenerse fuera de la cárcel, evitar la adicción a las drogas, obtener buenas
calificaciones en la escuela secundaria, puntajes en el SAT y éxito laboral.

Los adultos generalmente pueden rechazar un solo malvavisco en esta situación, pero rechazan...
23
Comer malvavisco requiere un esfuerzo cognitivo. Esto nos lleva a la tarea de rechazar el dulce .
En esta tarea, se pide a mujeres jóvenes que han expresado interés en hacer dieta que vean una película
con un plato de bocadillos con alto contenido de azúcar colocado al lado de ellas. Al medir cuantitativamente
cuántos de los bocadillos se comen, se puede medir cuantitativamente su falta de autocontrol. A algunas de
las mujeres se les pide que no respondan a la película, mientras que a otras se les dice que simplemente la
vean. Cuanto más tienen que controlar sus emociones mientras ven la película, más comen. Se pueden
utilizar una serie de pruebas similares de autocontrol y fatiga como prueba cuantitativa, incluida la disposición
a beber un medicamento de sabor amargo, la disposición a sostener la mano en un baño de hielo frío y la
resistencia física en una tarea de tirar de una palanca o apretar una manija. Todas estas requieren algún
aspecto de autocontrol, y se deterioran (disminuyen) si se las precede con tareas que involucran un exceso
de actividad emocional y/o física.
o componentes cognitivos.
Machine Translated by Google

Autocontrol 137

Esto nos lleva al concepto de carga cognitiva . Muchas de estas tareas, como la de rechazar
caramelos e incluso la de Stroop, dependen de la capacidad de asignar algún tipo de recurso cognitivo
24
limitado al componente de autocontrol. Esto se ve claramente en la tarea Podemos ver esto más

de rechazar caramelos: dedicar la atención y el esfuerzo de autocontrol a mantener las emociones

bajo control reduce la capacidad de rechazar la tentación y aumenta la cantidad de caramelos que se
comen. Poner las capacidades de anulación en otro lugar permite que el sistema pavloviano tenga
rienda suelta. (Pregúntenle a cualquiera que esté mordisqueando patatas fritas y pretzels en un bar deportivo).
De hecho, vemos este tipo de efecto todo el tiempo: cuando uno está distraído, tiende a olvidarse de
anular las acciones prepotentes, ya sea que estén impulsadas por el sistema emocional (pavloviano)
o por el sistema sobreaprendido (procedimental), o ya sean objetivos altamente motivados en el
sistema deliberativo. 25 Esta es una instancia específica del proceso general de tener
recursos limitados. Los procesos complejos, que incluyen la memoria, la navegación y el autocontrol, requieren un
conjunto similar de recursos limitados. Si estos recursos son utilizados por una tarea, no pueden ser utilizados por
otra. 26

En uno de mis ejemplos favoritos de recursos cognitivos limitados, siguiendo un experimento

presentado por Ken Cheng y Randy Gallistel para ratas, 27 Linda Hermer y Elizabeth Spelke probaron
qué tan bien los niños (de dos años) podían encontrar su juguete escondido favorito.
28 El juguete se colocó en una de dos cajas en las esquinas de una habitación
rectangular. La clave es que una habitación rectangular tiene una simetría rotacional de 180 grados.
Los niños vieron cómo colocaban el juguete en la caja y luego los hicieron girar hasta marearse.
Aunque los niños habían visto cómo colocaban el juguete en la caja solo unos minutos antes, no
pudieron recordar dónde estaba; pudieron usar la geometría de la habitación para identificar dos de
las cuatro esquinas, pero no pudieron recordar en cuál de las dos esquinas opuestas estaba la caja.
A Incluso con cajas de colores y señales salientes en la pared (una pared pintada de blanco, otra
pintada de negro), los niños no pudieron romper esa simetría de 180 grados. (Los niños que no fueron
girados no tuvieron ningún problema en encontrar el juguete favorito). Por supuesto, los adultos
pudieron recordar incluso a través de los giros. (Por supuesto, lo que los adultos estaban haciendo
era decir: "Está a la izquierda de la pared negra" o "Está en la caja azul"). Si a los adultos se les daba
una tarea de bloqueo lingüístico al mismo tiempo (para evitar que repitieran la ubicación una y otra
vez, lingüísticamente), terminaban igual que los niños: incapaces de recordar dónde habían dejado el
juguete. Las tareas clásicas de carga cognitiva utilizadas en los experimentos incluyen decir el
alfabeto al revés y contar hacia atrás desde 1000 de siete en siete. (Contar hacia atrás desde 1000
de siete en siete es realmente difícil de hacer y realmente distrae).

Las personas distraídas recurren a otros sistemas. Hace poco cambié la ruta por la que voy al
trabajo. Si me distraigo (por ejemplo, pensando en cómo voy a solucionar un problema en el trabajo
o en casa, o incluso simplemente pensando en escribir este libro en lugar de conducir), me paso de la
curva y sigo directamente por la ruta anterior. Estoy segura de que si contara de siete en siete desde
1000 mientras conducía por esa esquina, me la perdería todas las veces.

A
Se entrenó a ratas para que encontraran comida. Incluso con pistas muy destacadas en cada esquina
(diferentes olores, cantidad de luces de colores, etc.), las ratas que se desorientaron cada vez antes de ser colocadas
29 Las ratas que no estaban desorientadas pudieron
en la caja no pudieron romper esa simetría rotacional de 180 grados.
romper la simetría con facilidad. Véase mi libro anterior Beyond the Cognitive Map para una discusión detallada del
experimento con ratas y lo que se sabe sobre sus correlatos y mecanismos neurofisiológicos.
Machine Translated by Google

138 El sistema de toma de decisiones

La neurofisiología de la fuerza de voluntad

El uso de estos recursos limitados requiere energía. Una de las cosas más interesantes del autocontrol es que no sólo depende

de prestar atención, y no sólo de ser consciente de ello. Hablamos de “fuerza de voluntad” como si fuera un recurso limitado

conservar para cuando lo necesitemos. De hecho, si se les dice a los sujetos que necesitarán utilizar su que debemos

autocontrol más adelante, pueden conservarlo, mostrando menos autocontrol en tareas anteriores pero luego siendo más

capaces de expresar autocontrol en tareas posteriores.) Incluso algo tan simple como resistir la tentación (como no comer el

chocolate que nos ofrecen) puede tener un efecto sobre la capacidad de uno para realizar alguna tarea física que requiera

resistencia.

Muchos científicos sostienen que ésta es una de las razones por las que el estrés a menudo conduce a volver a caer en

hábitos que se habían abandonado, como fumar o consumir drogas. Afrontar el estrés agota el autocontrol y deja a la persona

vulnerable a tareas que dependen de ese recurso de autocontrol, como la prevención de recaídas. De hecho, se ha sostenido

que una de las razones por las que las reuniones periódicas (como las de Gestión de Contingencias o los programas de 12

pasos como Alcohólicos Anónimos y sus primos más regulados) funcionan tan bien es que proporcionan recompensas diarias

por lograr el autocontrol, lo que ayuda a fortalecer esos "músculos" del autocontrol. 32 En una línea similar, Walter Mischel ha

sostenido que gran parte de lo que llamamos buena crianza implica un entrenamiento explícito del autocontrol 33 (como decirles

a los niños que "está bien esperar a que les den dos malvaviscos").

Estos recursos de autocontrol se pueden reponer a través del sueño, el descanso o la relajación. 34

Roy Baumeister y sus colegas han sugerido que este recurso limitado depende de los niveles de glucosa en el torrente

sanguíneo; versial. 36 La glucosa (azúcar) es un recurso35 Sin embargo, esta sugerencia es extremadamente controvertida.

necesario para que las neuronas alimenten su función. 37

Los niveles de glucosa en sangre en sujetos que realizaron una tarea de autocontrol fueron mucho más bajos que en sujetos

que realizaron una tarea de control similar que no requirió autocontrol, y los sujetos que bebieron una bebida azucarada

mostraron un mejor autocontrol en relación con los que bebieron una bebida igualmente dulce pero con sabor artificial. 38

Aparentemente, comer azúcar realmente ayuda con el autocontrol, lo que puede ser la razón por la que las personas estresadas

anhelan dulces. B Si esta teoría de la glucosa es

correcta, entonces el autocontrol puede ser en realidad como un músculo, en el sentido de que se cansa porque se queda sin

recursos. Sin embargo, otros científicos han sugerido que el sabor de la glucosa puede estar preparando expectativas de

objetivos y cambiando la distribución de los sistemas que impulsan la toma de decisiones. El simple hecho de probar (pero no

tragar) una solución dulce puede aumentar el rendimiento deportivo.

39
Tal vez las soluciones de glucosa estén cambiando la motivación y

vigorizando al sujeto (Capítulo 13).

Tampoco está claro por qué el autocontrol requiere glucosa adicional en comparación con otros fenómenos que requieren

un uso intensivo del cerebro, como una mayor atención (escuchar un sonido muy pequeño), una mayor percepción (encontrar

una imagen oculta en una imagen), un control motor fino (tocar el piano o el violín) o incluso resolver un problema cognitivamente

difícil (un examen de matemáticas).

Hasta donde yo sé, la teoría de la glucosa no se ha probado en estos otros estudios que requieren un uso intensivo del cerebro.

B
Sé que cuando estoy escribiendo una solicitud de subvención o trabajando muy duro en un artículo, a menudo descubro
que necesito una dosis regular de azúcar fuerte para mantener mi resistencia para escribir. Se nota que estoy trabajando
duro cuando como un donut como refrigerio a media mañana.
Machine Translated by Google

Autocontrol 139

do
fenómenos. Ir Puede ser que el autocontrol simplemente involucre más sistemas neuronales que solo
con la corriente lo hace, y esos sistemas neuronales requieren recursos.
También hay evidencia de que el autocontrol se puede entrenar, 42 pero aún no está claro si esto es
más parecido a un efecto de la práctica (a través del cual los sistemas neuronales aprenden a realizar
mejor las tareas) o a un cambio homeostático (como los músculos que aumentan sus reservas de recursos
a partir del ejercicio).

Entonces, ¿por qué el autocontrol involucra partes adicionales del cerebro y requiere más recursos
neuronales?

El autocontrol y la corteza prefrontal

Dos estructuras del cerebro humano aparecen una y otra vez en las tareas de autocontrol: la corteza
prefrontal dorsolateral (dlPFC) y la corteza cingulada anterior (ACC). 43 A menudo se habla de estas
estructuras como involucradas en el "control de arriba hacia abajo" porque están involucradas en las
habilidades para reconocer y cambiar objetivos y tareas. 44 Estas dos estructuras parecen estar
involucradas en el monitoreo de la información y los deseos conflictivos, el establecimiento de tareas y la
frontal del cerebro humano, y a anulación de planes. 45 Ambas estructuras están ubicadas en la parte
D
menudo se las menciona como parte de la corteza "prefrontal".

do
Como se analiza en el Apéndice B, las mediciones de resonancia magnética dependen del aumento del flujo
sanguíneo porque las neuronas “altamente activas” requieren recursos adicionales (pero no oxígeno adicional) de la sangre.
40
Aunque no se sabe cuáles son todos esos recursos adicionales, un candidato probable es la glucosa.
Así, cuando una estructura neuronal aumenta su actividad (lo que sea que eso signifique en realidad 41 ), el cerebro se
adapta a esas necesidades aumentando el flujo sanguíneo. Sin embargo, el aumento del flujo es mucho mayor que el
aumento de las necesidades de oxígeno, por lo que con un aumento del flujo sanguíneo y las mismas necesidades de
oxígeno, queda más oxígeno en el torrente sanguíneo, que es lo que se detecta mediante la resonancia magnética y
sistemas de imágenes similares. El aumento de la actividad también se puede rastrear utilizando una molécula de glucosa
radiactiva, la 2desoxiglucosa. La 2desoxiglucosa radiactiva se inyecta en el torrente sanguíneo de un animal y luego es
absorbida por neuronas particularmente activas. La presencia de la 2desoxiglucosa marcada se puede detectar post
mortem en ciertos tejidos, que han sido "muy activos". La 2desoxiglucosa tiende a marcar las mismas estructuras que la resonancia mag
El hecho de que la resonancia magnética identifique ciertas estructuras como “involucradas” en ciertas tareas sugiere que
diferentes habilidades requieren diferentes partes del cerebro y que la hipótesis de la glucosa puede afectar a más
sistemas que sólo los sistemas de autocontrol.

D El término “prefrontal” proviene de la idea de que se encuentra en la “parte delantera de la corteza frontal”. Debido a que esta parte de la

corteza es una de las más diferenciadas entre los primates y otros mamíferos y se la identificó históricamente como el lugar de las capacidades
46
entre humanos y otros primates, consideradas exclusivamente humanas (como el “superyó”).

47 ). Sin embargo, a medida que los estudios anatómicos se han vuelto más

detallados y más desarrollados, se ha hecho posible identificar áreas homólogas en las regiones cerebrales frontales de otros animales también. 48

(Una estructura homóloga es una que cumple el mismo propósito entre dos especies y comparte una historia evolutiva. Por ejemplo, nadie negaría que

el corazón de la rata, el corazón del mono y el corazón humano son estructuras homólogas. Como hemos visto a lo largo de este libro, muchas

estructuras cerebrales también se conservan entre estas especies). De manera similar, a medida que hemos comenzado a desarrollar tareas de

autocontrol que se pueden usar en animales (como la tarea de la señal de stop), hemos comenzado a identificar vías, estructuras y mecanismos de

procesamiento de información específicos a través de los cuales funciona el autocontrol. 49 Los detalles exactos de la homología entre especies y los

detalles exactos de sus respectivos roles en la toma de decisiones son un área de investigación activa. 50
Machine Translated by Google

140 El sistema de toma de decisiones

La implicación de que la corteza prefrontal está involucrada en el autocontrol surgió originalmente de

estudios de lesiones accidentales, incluidos soldados que regresaron de las guerras de fines del siglo XIX.
51
y principios del siglo XX. La Pero la primera y más importante indicación de que el prefrontal
corteza desempeñaba un papel en el autocontrol, en particular su naturaleza agustiniana, proviene de 52
Phineas Gage, a quienes conocimos en nuestra discusión sobre la emoción (Capítulo 8). Para recordarle,
Phineas Gage era un trabajador ferroviario al que le dispararon una púa de hierro en la cabeza,
destruyendo sus cortezas frontales. Una de las descripciones clave de Phineas Gage después de su
accidente fue su falta de autocontrol, en particular en situaciones emocionales. Resultados más modernos,
que incluyen datos de fMRI de humanos y registros neuronales en monos, han encontrado que la actividad
cortical prefrontal dorsolateral está relacionada con la memoria de trabajo, el autocontrol y la construcción
y el mantenimiento de planes alternativos (como los que uno podría adoptar ante una contingencia
53
relacionada con un error), en particular planes alternativos complejos.
Dado que la tarea de dar la señal de parada se puede entrenar en animales, en particular en monos,
las vías anatómicas a través de las cuales se logra la conducta de “parar” son bien conocidas. En un par
de artículos recientes notables, Masaki Isoda y Okehide Hikosaka descubrieron que una zona situada en
la parte delantera de la corteza motora (el “área motora suplementaria” [SMA]) detiene las conductas no
54
deseadas a través de su fuerte proyección al núcleo subtalámico en los ganglios basales.
En nuestro análisis del sistema de selección de acciones procedimentales (Capítulo 10), hablamos de
vías de ir/no ir en los ganglios basales: la entrada cortical ingresa al cuerpo estriado en los ganglios
basales y luego pasa a través de dos vías (una vía de “ir”, a menudo llamada vía “directa”, en la que el
cuerpo estriado inhibe un área que inhibe acciones, creando una doble negación que aprende a alentar
acciones, y una vía de “no ir”, a menudo llamada vía “indirecta”, en la que hay una triple negación que
aprende a desalentar acciones).
También existe una tercera vía a través de los ganglios basales en la que las áreas frontales de la corteza
se proyectan directamente al núcleo subtalámico, que se proyecta directamente a la etapa negativa final
de las dos vías. (Véase la Figura 10.1.) El núcleo subtalámico es excitador (positivo) y excita la etapa
inhibitoria final, lo que hace que una sola vía negativa...
una vía de ¡Alto! Para diferenciarla de la vía directa de “seguir” y de la vía indirecta de “no seguir”, a
55
veces se la denomina vía “hiperdirecta”.
Esto puede verse como un fenómeno general: las cortezas frontales proporcionan señales que
56
El sistema de inhibición conductual permite que otras estructuras cambien históricamente han sido...
las respuestas aprendidas previamente. Se lo ha llamado sistema de inhibición conductual porque
generalmente se prueba en experimentos en los que se detienen las conductas en lugar de cambiarlas,
57 pero siempre he sospechado que la corteza prefrontal se entiende mejor como un sistema de sesgo
que permite que planes complejos controlen la conducta mediante la manipulación de sistemas más
simples. Esta arquitectura refleja la arquitectura de subsunción propuesta por Rodney Brooks 58 en la
que los sistemas más complejos se superponen a los sistemas más simples. Los sistemas más complejos
escuchan las entradas e intervienen si es necesario, ya sea modulando los sistemas más simples
(proporcionándoles entradas adicionales) o controlando directamente la salida por sí mismos.
En los roedores, la corteza cingulada anterior (CCA) y la corteza frontal medial (en particular las
cortezas infralímbica y prelímbica) proporcionan señales a la amígdala para anular las respuestas
aprendidas relacionadas con el miedo. 59 En el mono, la corteza prefrontal anula las respuestas
habituales para permitir respuestas más controladas. En general, esto puede verse como una forma de lo que
60
a veces se denomina procesamiento de arriba hacia abajo, en el que los sistemas corticales frontales modulan
los sistemas “inferiores” para cambiar las expectativas, la atención y los comportamientos. Los reflejos pueden
ser impulsados por la médula espinal, pero hay un circuito a través del cual el cerebro controla la respuesta.
Machine Translated by Google

Autocontrol 141

El cerebro examina las entradas a los reflejos y puede modularlos si es necesario. El ACC modula los sistemas
de selección de acciones emocionales. 61 Las áreas motoras frontales (como la AMS)
modulan el aprendizaje procedimental. 62 Y la corteza prefrontal dorsolateral modula los sistemas de
63
evaluación para seleccionar opciones a largo plazo en los sistemas deliberativos.
Para ver cómo funciona esto, podemos tomar un ejemplo específico. En un estudio reciente de fMRI,
Yadin Dudai y sus colegas en Israel estudiaron a humanos que superaban su miedo a las serpientes. 64
Encontraron personas que tenían fobias específicas a las serpientes y les dieron la oportunidad de tirar de una
cuerda que acercaba una serpiente hacia ellos. La visión de la serpiente produjo actividad en la amígdala y
en las áreas emocionales límbicas, que desde hace mucho tiempo se han asociado con el miedo tanto en
animales como en humanos. (Podemos reconocerlos como circuitos de selección de acción pavlovianos
[emocionales], Capítulo 8.) Las personas que pudieron superar su miedo (tirando de la cuerda) tuvieron una
actividad reducida en la amígdala, pero una actividad aumentada en la corteza cingulada anterior subgenual
(sgACC), un área de la corteza prefrontal que se proyecta hacia la amígdala. De alguna manera, la actividad
en la sgACC ha inhibido la actividad en la amígdala y ha permitido a estas personas superar su miedo y tirar
de la cuerda hacia ellos.

Libros y artículos para lectura adicional • Roy F.

Baumeister, Todd F. Heatherton y Dianne M. Tice (1994). Losing Control: How and Why People Fail at SelfRegulation
[Perder el control: cómo y por qué la gente fracasa en la autorregulación ]. San Diego, CA: Academic
Press. • George Ainslie (2001). Breakdown of Will [El colapso de la voluntad] . Cambridge, Reino Unido: Cambridge University.
Prensa .

• Robert Kurzban (2010). Por qué todos los demás son hipócritas . Princeton, NJ: Princeton
Prensa Universitaria .
• Uri Nili, Hagar Goldberg, Abraham Weizman y Yadin Dudai (2010). No temas: Actividad de los circuitos
frontales y temporales en momentos de valentía en la vida real. Neuron, 66
, 949–962 .
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

TERCERA PARTE

EL SUJETADOR CON MENTE

POR SÍ PROPIA
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

La mente física
Entre dos espejos la luz
llega al infinito, ver requiere
una
interrupción encarnada.

La mente está físicamente instanciada por el cerebro, pero la mente no es

simplemente un software que se ejecuta en el hardware del cerebro. La
estructura física del cerebro modifica los cálculos disponibles.
Hemos visto antes que existen múltiples sistemas de selección de acciones,
cada uno con diferentes ventajas y desventajas. Aunque es posible aprender
nuevas tareas después de una lesión cerebral, no es que el mismo software
se esté ejecutando en otra parte del cerebro, sino que otros sistemas de
selección de acciones están haciendo todo lo posible para realizar las tareas.

Históricamente, los debates sobre la relación entre la mente y el cerebro han sido entre aquellos que
sostenían que eran cosas fundamentalmente diferentes ( dualismo ) y aquellos que sostenían que la mente
estaba instanciada en el cerebro. 1 Hay pruebas sólidas contra el
dualismo porque las manipulaciones del cerebro afectan a la mente. No hay pruebas de
que exista una entidad no física y pocos científicos aún la consideran una posibilidad. Sin
embargo, más recientemente, los debates sobre el dualismo se han centrado en si la
mente depende del cerebro físico o si es un software que funciona en un hardware neuronal. 2
Ahora tenemos ejemplos de cosas que pueden ser traducidas físicamente de una instancia a otra sin
ninguna pérdida. Cuando descargamos una canción de Internet, la música ha sido traducida de ondas
sonoras en el aire a través de un micrófono a una representación digital en el disco duro de una computadora,
traducida de ahí a una serie de pulsos eléctricos a través de un cable, a menudo a través de un paso
intermedio de pulsos de luz a través de un cable de fibra óptica, luego nuevamente a pulsos eléctricos,
nuevamente a una representación digital en su disco duro local, y luego nuevamente a ondas sonoras en el
aire a través de parlantes conectados a su computadora. Aunque hay algún cambio de las ondas sonoras a
la representación digital y viceversa, no hay cambio alguno de una representación digital a otra. La naturaleza
física de la mente no es así. Para entender

145
Machine Translated by Google

146 El cerebro con mente propia

Cómo la naturaleza material de cómo el cerebro procesa la información es diferente de la naturaleza

inmaterial de la información digital, tomémonos un momento para entender qué es la información digital.

¿Qué hay de malo en la analogía software/hardware?

Dentro de una computadora, la información puede transferirse de un lugar de la memoria a otro (como
cuando se copia un archivo del disco a la memoria) o, dentro de una red, de una computadora a otra. La
información puede almacenarse en mecanismos físicos diferentes, pero la información en sí es la misma.
Por ejemplo, la información digital almacenada en forma de orientaciones magnéticas en un disco duro
puede escribirse en un disco compacto (CD) en forma de puntos oscuros en un disco óptico.
Esto ha llevado a los científicos informáticos a separar
el concepto de hardware (la entidad física) del concepto de software (la información digital).

Existen casos en biología en los que la información se almacena digitalmente. Por ejemplo, el
ADN almacena la secuencia genética como una serie de cuatro aminoácidos (guanina, citosina,
timina y adenina, generalmente etiquetados como GCTA). Se puede argumentar que la información
contenida en el ADN es un software y que los complejos mecanismos de la célula que convierten
esa información en proteínas y otros cambios físicos en la célula son el hardware que lee y opera
B
sobre el software.
En las décadas de 1970 y 1980, la analogía hardware/software se hizo popular, tanto entre los
científicos como entre el público, como explicación del problema mente/cerebro, con la idea de que
el cerebro era el hardware y la mente el software. 4 Este es software/
El dualismo de hardware era particularmente atractivo porque significaba que la mente se encontraba en
un nivel diferente al del cerebro y podía estudiarse por separado. También ofrecía la esperanza de que

A
Un disco duro (HD) almacena información como una serie de pequeñas piezas de materiales magnetizables llamados
ferromagnéticos. Bajo la influencia de un campo magnético, estos pequeños puntos (llamados dominios) pueden orientarse en
una de dos direcciones (arriba o abajo). El disco duro almacena una serie de ceros y unos como una secuencia de dominios arriba
y abajo. Un disco compacto (CD) almacena información como una serie de pequeños hoyos en un plástico de color, formando una
serie de puntos oscuros y claros. Los discos duros y los CD pueden almacenar exactamente la misma serie de ceros y unos.
Aunque se instancian en el ámbito físico (dominios magnéticos, hoyos oscuros/claros), la información real es la secuencia de
ceros y unos.

B El mecanismo real por el cual una célula lee la información almacenada en el ADN es extremadamente complejo,
con nuevos mecanismos descubiertos en las últimas décadas donde el ambiente físico dentro y alrededor de la célula
cambia qué componentes del ADN son leídos. 3 Por ejemplo, unas proteínas
especializadas llamadas histonas pueden impedir que se lea parte del ADN, mientras que otras proteínas llamadas factores de
transcripción pueden estimular la lectura de parte del ADN. En este punto, los genetistas han creado estructuras de control lógicas
completas (si esta proteína está presente pero aquella proteína no, entonces se lee esta parte del ADN para crear una tercera
proteína). El entorno físico de la célula puede cambiar qué parte del programa se lee. Pero esto no es tan diferente de los
programas informáticos actuales, que tienen mecanismos para verificar los aspectos físicos del ordenador para decidir qué partes
del programa deben ejecutarse. Por ejemplo, cuando el ordenador se inicia, comprueba si tiene instalado un lector de DVD o una
tarjeta de red.
(Hoy en día, los programas no suelen decirle a los usuarios lo que están haciendo, por lo que es posible que solo le muestren una
pequeña barra azul circulando o un logotipo corporativo para mirar, pero lo que realmente está haciendo es verificar el hardware).
Si encuentra ese hardware, instala los controladores apropiados (pequeños fragmentos de software) para él.
Machine Translated by Google

La mente física 147

que se podría construir un programa de computadora usando un hardware completamente diferente y aún así crear una

inteligencia artificial.

En ese momento, el software estudiado era generalmente simbólico: conjuntos de símbolos arbitrarios que se manipulaban

mediante algoritmos específicos. 5 En 1956, Allen Newell

y Herb Simon demostraron que un algoritmo de búsqueda que examinaba las posibilidades de los pasos matemáticos podía

encontrar pruebas matemáticas básicas, mostrando que

6
Podría replicar muchas de las pruebas de los Principia Mathematica de Bertrand Russell .

De hecho, su programa encontró una prueba más elegante de uno de los teoremas de los Principia de Russell que la que

había encontrado Russell. 7

Con computadoras más rápidas y más grandes, el proceso de búsqueda que fue desarrollado por estos primeros —es
8
Los investigadores de inteligencia artificial han sido capaces de hacer cosas notables tanto tan bueno como lo
do
como los médicos humanos o incluso mejores que ellos en la identificación usan las empresas de exploración petrolera—

de enfermedades, las industrias han sido capaces de encontrar yacimientos de petróleo en las profundidades del
suelo y, como es bien sabido, han vencido al mejor jugador de ajedrez del mundo. Recientemente, la combinación
de procesos de búsqueda con una base de conocimiento profunda de relaciones semánticas venció a los mejores
jugadores humanos en el programa de televisión Jeopardy . Sin embargo, es importante recordar que esta teoría de
búsqueda a través de posibilidades es una hipótesis sobre cómo los humanos toman decisiones. Extensas pruebas
psicológicas han demostrado que los humanos no buscan tantos pasos en el futuro como lo hacen estos programas.
10 Los mejores jugadores de ajedrez no miran más allá que los jugadores de ajedrez más débiles. Los médicos

tienen que ser entrenados explícitamente para utilizar paradigmas de diagnóstico diferencial , e incluso los médicos
bien entrenados tienden a utilizar el reconocimiento de patrones basado en la experiencia en lugar del razonamiento
explícito en la práctica.
La teoría de la búsqueda a través de posibilidades requiere una manipulación de símbolos. La razón por la que los

investigadores de inteligencia artificial comenzaron con la manipulación de símbolos (como lo cuenta 11 ) fue que Allen Newell,

últimas conferencias públicas dadas en los científicos de Carnegie Mellon, pensó que "la percepción iba a en una de sus

ser fácil", por lo que comenzarían con la parte difícil de la cognición. Al final de su carrera, Allen Newell llegó a la conclusión

de que, de hecho, habían estado yendo al revés, que la percepción estaba lejos de ser fácil y que la cognición era en realidad

percepciones aplicadas a los mecanismos de percepción. Pero en ese momento (desde la década de 1950 hasta la de 1980),

la inteligencia artificial implicaba manipulaciones de símbolos y condujo a lo que Newell y Simon llamaron "la hipótesis de los

sistemas de símbolos físicos", que proponía que la cognición consistía enteramente en la manipulación de símbolos

abstractos.

Incluso en la década de 1980, el concepto de que la mente implicaba la manipulación de

símbolos fue atacado, principalmente por John Searle, un filósofo de la Universidad de California,
Berkeley. Searle atacó la hipótesis de la manipulación de símbolos con un experimento mental
que llamó la habitación china . Es 13
Para entender el experimento mental de Searle, debemos:
14
necesario comenzar primero con el famoso test de Turing , propuesto por Alan Turing en 1950.
¿Cómo sé que eres consciente? Turing reformuló esta pregunta en términos de pensamiento, como en ¿ Puede pensar

una máquina? Como hemos visto a lo largo de este libro, para poder ser científicos al respecto, necesitamos operacionalizar

esta pregunta. Turing sugirió que

do
Aunque los primeros programas de inteligencia artificial (1979) superaron a los de la facultad de medicina en
comparaciones controladas, estos programas fueron abandonados debido a preocupaciones sobre cuestiones legales:
¿quién sería responsable de los errores en el diagnóstico? Una preocupación similar puede limitar el éxito de los
9
programas de conducción automática.
Machine Translated by Google

148 El cerebro con mente propia

Podemos operacionalizar el concepto de pensamiento al intentar determinar si la persona con la

que estamos conversando es una computadora o un ser humano. Desafortunadamente, los
humanos son muy malos en esto y a menudo atribuyen características humanas a objetos no
humanos (como nombrar un GPS).
El experimento mental de la habitación china de Searle es un ataque directo al concepto de la
prueba de Turing. En el experimento mental de Searle, imaginemos que un hablante chino está
manteniendo una conversación por correo electrónico con alguien que habla chino. D Nuestro
hablante escribe ideogramas chinos en la computadora y lee ideogramas chinos en la computadora.
En otro lugar, un hablante que no habla chino está sentado en una habitación cerrada con un
juego de fichas. Aparecen caracteres chinos en la pantalla frente a él, y él hace coincidir los
ideogramas (que no reconoce, pero suponemos que puede hacerlos coincidir gráficamente) con
fichas que tienen complejas declaraciones de tipo "sientonces". Algunas de esas fichas le indican
que dibuje ideogramas específicos en una tableta, que luego se traducen al exterior. E Searle
señala correctamente que incluso si el hablante chino externo (nuestro usuario) no puede notar la
diferencia entre la habitación cerrada y otro hablante chino (es decir, la habitación pasa la prueba
de Turing), no podemos decir que nuestro hombre interno habla chino. Esto es completamente correcto.
Sin embargo, también pasa por alto por completo el objetivo de la prueba de Turing. Si bien nuestro
hombre interno no habla chino, la sala (el hombre que manipula las fichas, las reglas de las fichas
mismas y el sistema de entradasalida) sí lo hace .
Este es un error común que cometen las personas que intentan comprender el funcionamiento
del cerebro. Seguimos buscando mecanismos en los que reside la conciencia (en un subtipo
específico de neurona o en las fluctuaciones cuánticas de los microtúbulos 16 ), pero el cerebro no
funciona así. El cerebro es una máquina interactiva y computacional que recibe información del
mundo, la procesa y luego toma medidas para responder a ella.
Hay muchos módulos en el cerebro (exploramos algunos de ellos en la sección anterior de este
libro), pero, al final, es la persona en su conjunto la que realiza una acción. Cuando usted sostiene
en sus brazos a su hija dormida por primera vez, esa emoción incontrolable y abrumadora creada
por su sistema pavloviano de selección de acciones es usted, no otra persona; cuando su sistema
procedimental pisa a fondo los frenos de su coche y evita el accidente, esa fue la elección correcta.
Consciente o no, sigue siendo usted.
Hay dos hipótesis importantes que subyacen a la distinción hardware/software.
La primera hipótesis es que existen diferentes niveles de descripción de un objeto. Se 17 Uno
puede describir la información digital almacenada en un disco duro o DVD en términos del objeto
físico en el que está almacenada (por ejemplo, como cambios en la orientación de los dominios
ferromagnéticos en el disco duro) o en términos de la información que está almacenada (como la secuencia

D
En la época en que Turing propuso su prueba, obtener información y resultados de las computadoras era muy
complicado, y Turing dedicó gran parte de su propuesta original a asegurarse de que la prueba no pudiera ser
engañada al ver u oír a la persona o la computadora. Ahora estamos muy familiarizados con el concepto de
comunicarse con entidades invisibles a través de redes informáticas y, de hecho, la prueba de Turing se realiza
regularmente en el contexto de interacciones de videojuegos, donde algunos de los personajes están controlados por
la computadora y otros por humanos.
mi
Al parecer, así fue como se implementó la primera versión del Solucionador de problemas generales de Newell
y Simon. En esa época (en 1956) las computadoras eran demasiado difíciles de programar, por lo que lo codificaron
en fichas de 3 × 5 e hicieron que sus familias manipularan las fichas simbólicamente siguiendo reglas específicas,
15
produciendo así, literalmente, la habitación china.
Machine Translated by Google

La mente física 149

La segunda hipótesis es que el nivel de información es independiente de la descripción física 18 (es decir, la
secuencia de ceros y unos almacenada en el disco duro es la misma que la secuencia de ceros y unos
almacenada en el DVD). Ambas afirmaciones son incorrectas cuando se aplican al cerebro físico. Si bien
encontraremos útiles tanto los niveles físico como computacional o informativo para comprender la función
cerebral, la evidencia experimental sugiere que la hipótesis de que se trata de descripciones distintas y
separables no se aplica al cerebro.
F

La analogía hardware/software surgió de dos literaturas científicas (una incapacidad para explicar la
conciencia a partir de efectos físicos20 y observaciones de pacientes recuperándose de estudios de lesiones21 )
y ganó fuerza a medida que los investigadores de inteligencia artificial intentaron Los experimentos de psicología
22
Demuestran que la manipulación de símbolos podría explicar la inteligencia. han encontrado que la
manipulación de símbolos es particularmente difícil para los humanos, y que cuanto más experiencia se tiene
con un tema, menos manipulación de símbolos parece hacerse. 23 Esto sugiere que hay algo más sucediendo
más allá de la manipulación de símbolos.
Resulta tentador darse por vencido y decir que, como todavía no podemos explicar cómo surge la conciencia
en el cerebro, no puede ser un objeto físico. Sin embargo, las manipulaciones físicas afectan al pensamiento
consciente, 24 y la operacionalización de la conciencia ha sido difícil de alcanzar. 25 Cada vez que los científicos
operacionalizan una parte de la conciencia para poder estudiarla experimentalmente (por ejemplo, concentrándose
en un aspecto como la atención, la percepción, la emoción o el control motor voluntario), estos estudios han
producido explicaciones físicas (y computacionales) detalladas de cómo funciona el proceso en el tejido cerebral.
26

De manera similar, cuando realmente probamos el momento en que ocurre la conciencia, gran parte de ella
parece ocurrir después y no antes de la conducta. 27 No tener una explicación para la conciencia parece ser un

punto de partida bastante débil para la teoría principal de que la conciencia es el software que se ejecuta en el
hardware del cerebro.
Sin embargo, históricamente, lo que realmente parecía impulsar la analogía del software era el observador.
28 Pacientes
Los animales y los pacientes a veces podían recuperarse de una lesión cerebral. Los animales con
afasia (problemas del lenguaje) debido a daños en una parte del cerebro a veces (con suficiente entrenamiento)
recuperaban algunas habilidades del lenguaje. 29 Los animales con lesiones cerebrales a veces podían aprender
a hacer tareas que no podían hacer poco después de la lesión. 30 Y, lo más importante, los recuerdos a largo
plazo parecían almacenarse en una parte del cerebro diferente de los recuerdos almacenados recientemente.
31

Aprender nuevas tareas con diferentes estructuras cerebrales

La idea de que el cerebro es un contenedor amorfo y que todas sus partes son equivalentes se remonta a un
famoso experimento de Karl Lashley en la década de 1920 en el que observó ratas que corrían por laberintos a
los que se les habían extirpado grandes franjas de tejido cerebral. 32 Lashley ciertamente reconoció que había
una diferencia entre las partes de la corteza (por ejemplo, visual 33 ), pero Lashley descubrió que la corteza
la visión, incluso en la rata. La capacidad de las ratas para resolver un estaba obviamente especializada para
laberinto dependía de la cantidad de tejido cerebral extirpado: la

F La hipótesis de la manipulación de símbolos es una hipótesis acerca de cómo procesamos la información. 19

Es errónea, no porque no pueda ser cierta, sino porque no parece ser así como el cerebro procesa la información.
Machine Translated by Google

150 El cerebro con mente propia

Cuanto más tejido extraía, peor le iba al animal. En general, Lashley no vio mucha diferencia entre
lesiones de tamaño similar pero que afectaban a distintas partes de la corteza, pero tampoco estaba
observando a las ratas hacer mucho en primer lugar. Cuando realmente observamos no sólo si un animal
realiza una tarea, sino cómo la realiza, lo que encontramos es que los animales (incluidos los humanos)
evitan las lesiones cerebrales no moviendo información sino resolviendo tareas utilizando otros sistemas.

Ya hemos visto una diferencia entre la toma de decisiones deliberativa (Capítulo 9) y la toma de
decisiones procedimental (Capítulo 10). Esta distinción coincide muy de cerca con una distinción observada
en la literatura psicológica humana entre la memoria declarativa y procedimental . La distinción específica
34
entre la memoria Aunque la idea de que existían memorias múltiples y disociables
declarativa y procedimental en el aprendizaje humano se remonta a la década de 1970, la distinción
específica entre la memoria declarativa y procedimental en el aprendizaje humano, y la idea específica de
35
que eran disociables, se remonta a un artículo de 1980 de Neal Cohen y Larry Squire y el famoso paciente HM
HM (ahora conocido como Henry Molaison G ) era un joven que sufría terribles ataques
epilépticos debilitantes e intratables que le impedían trabajar. 37 La epilepsia es una falla en los
sistemas de retroalimentación negativa del cerebro que normalmente impiden que las conexiones
positivas (excitatorias) altamente interconectadas entre las neuronas se descontrolen. Como una
avalancha o un incendio forestal, un evento sobreexcitado puede propagarse por todo el cerebro.
yo

En 1953, a la edad de 27 años, HM aceptó un procedimiento altamente experimental (y

presumiblemente desesperado) que estaba realizando William Scoville en el Hospital Hartford en
Connecticut: extirparían la parte del cerebro que contenía el foco epiléptico, el punto de inicio de la
avalancha epiléptica. 42 En el procedimiento posterior, Scoville extirpó ambos hipocampos de HM y gran
parte del tejido circundante (llamado "lóbulo temporal medial").

Tradicionalmente, se hace referencia a los pacientes por sus iniciales para preservar su privacidad. Cuando HM murió en 2008, se
GRAMO

reveló su nombre completo. 36 Pero incluso antes, conocido solo como HM, era posiblemente el paciente con lesión cerebral más conocido

en neurociencia, rivalizado solo por Phineas Gage, a quien conocimos en nuestro análisis de la corteza frontal y la emoción (Capítulo 8).

yo
En los tejidos altamente interconectados (como el hipocampo y el neocórtex), las conexiones recurrentes excitatorias (que estimulan

la activación de las neuronas) se equilibran con conexiones recurrentes negativas locales (que desalientan la activación de las neuronas). Si

la excitación y la inhibición están desequilibradas durante un período de tiempo,

38
En un momento dado, puede producirse una excitación descontrolada que lleve a una activación
masiva de neuronas. Las zures pueden surgir de una excitación o inhibición transitorias excesivas. Función cerebral

En general, el sistema nervioso central se encuentra en equilibrio dinámico, lo que facilita la respuesta rápida y hace que el cerebro sea más

flexible en sus respuestas, pero también significa que un evento transitorio tarda un tiempo en volver a la normalidad. El evento epiléptico

es un fenómeno conocido en los campos de la física y la ingeniería eléctrica como "rebote": el sistema se empuja demasiado hacia un lado

y, cuando regresa a su punto de base, rebota demasiado hacia el otro lado, como un resorte que oscila cuando se lo tira o se lo empuja.

Por lo tanto, la epilepsia es incorrecta, una activación extraña de las neuronas. Dado que la activación de las neuronas es memoria,

percepción y cognición, esta activación adicional de las neuronas será percibida por otras partes del cerebro como real. Las convulsiones

epilépticas en la corteza auditiva suelen estar precedidas por la audición de música por parte de los pacientes, los eventos en las estructuras

del lóbulo temporal pueden desencadenar la memoria y las convulsiones en las partes emocionales del cerebro (como la corteza frontal ventral)
39
Puede desencadenar Dostoievski (un conocido epiléptico) describió las convulsiones en su novela El idiota como algo premonitorio.

sentimientos cedidos por un momento emocional de excepcional claridad de alegría, esperanza y vitalidad.
40 Este sentimiento emocional de profunda conexión

religiosa también se ha observado en algunos pacientes modernos con epilepsia del lóbulo temporal. 41
Machine Translated by Google

La mente física 151

Este procedimiento fue introducido por Wilder Penfield y Herbert Jasper en el Montreal
43
Instituto Neurológico a principios de los años 40. Todavía hoy se hace como último recurso para casos intra
44
epilepsia de mesa. Pero hoy, antes de extraer cualquier tejido, los médicos dedican tiempo a localizar el
sitio focal (el punto de inicio) de la epilepsia mediante el registro durante largos períodos de tiempo (incluso hasta
semanas) para asegurarse de que localizan el foco lo más exactamente posible, y luego dedican tiempo a
determinar, lo mejor que pueden, lo que hace esa parte del cerebro. En 1957, ninguna de estas técnicas estaba
disponible; todo lo que Scoville y sus colegas tenían disponible era el electroencefalograma (EEG), que no tiene
suficiente resolución para descomponer la información que se está procesando, y que solo era lo suficientemente
bueno para mostrarle que el foco epiléptico estaba en algún lugar de la región temporal medial. Entonces,
desesperado por detener las convulsiones epilépticas, HM aceptó que el cirujano le extirpara una gran parte de
su hipocampo y su lóbulo temporal medial de forma bilateral.

El cerebro (y la mente) son cosas físicas: si se elimina una parte del cerebro, se elimina una parte del
cálculo. (A veces, otras partes pueden intervenir para realizar una tarea de una manera diferente, pero a veces
no. Este es el error fundamental en la analogía software/hardware). En ese momento, en 1957, el papel
computacional del hipocampo todavía no estaba claro.
desconocido.

En términos de su efecto inmediato, la cirugía mejoró la epilepsia de HM de manera espectacular y permitió

controlarla con medicamentos. Su inteligencia general no parecía verse afectada y sus habilidades lingüísticas
se mantuvieron normales, pero la cirugía dejó a HM con un deterioro devastador de la memoria: no podía
recordar nada nuevo. Si bien podía recordar su pasado, la información nueva sólo podía recordarse si se distraía,
se perdía. Esta extraña discapacidad de la memoria ya se había observado antes y se conocía como amnesia
enfermedad causada por el anterógrada , que se observa en pacientes con síndrome de Korsakoff, una
46 A menudo era
alcoholismo crónico combinado con una deficiencia de vitamina B (tiamina). La amnesia se
describe hermosamente en El hombre que confundió a su mujer con un sombrero de Oliver Sacks.
47
Estudios de casos de amnesia anterógrada

(ver “El marinero perdido” y “Una cuestión de identidad”), en El hombre con una y de AR Luria (convertida en
Mundo destrozado , una compleja historia de misterio) en Christopher Nolan
Recuerdo .

HM era un paciente normal (salvo por su epilepsia), con una inteligencia superior a la media, que había
perdido de repente esa capacidad tan específica de aprender cosas nuevas. En esa terrible tragedia había una
oportunidad de aprender qué había salido mal y de entender cómo no cometer el mismo error en el futuro. 48
Scoville llamó a Brenda Milner, una neuropsicóloga que había estudiado con Donald Hebb y Wilder Penfield en
la Universidad McGill.
Aunque Milner descubrió que la incapacidad de HM para aprender nuevos recuerdos era generalizada y afectaba
a todos los sujetos y dominios (visual, auditivo, lingüístico, etc.), también descubrió que HM podía aprender una
tarea de trazado en espejo que tanto a HM como a los sujetos de control les llevaba varios días aprender. 49
Junto con su alumna Suzanne Corkin, descubrieron que HM podía, de hecho, aprender nuevas tareas, pero no
recordaba haberlas hecho. Estas tareas eran todas del tipo que requieren mucha práctica y se aprenden
lentamente, como escribir en espejo o trazar caminos intrincados. Corkin y Milner describieron cómo HM se
quedaba incrédulo de poder hacer una tarea porque no podía recordar que la hubiera intentado antes, pero la
velocidad a la que aprendía estas tareas de aprendizaje lento que requerían práctica era aproximadamente
normal.
Esto llevó a la sugerencia de que había dos sistemas de memoria: uno que aprendía hechos enunciables
(“Mi auto está estacionado en el aeropuerto”) y otro que aprendía habilidades (conducir).
Machine Translated by Google

152 El cerebro con mente propia

Una bicicleta, lanzar una pelota de béisbol). Los hechos se pueden declarar: puedo decirte dónde está
mi coche (“en el aeropuerto”) y lo sabrás de inmediato. Pero las habilidades son procedimientos que
solo se pueden aprender con la práctica. No importa cuánto te diga cómo lanzar una pelota de béisbol,
no podrás hacerlo hasta que lo intentes durante un tiempo. El primer tipo de memoria se denominó
memoria declarativa . tipo de procedimiento .50
, el segundo
Trabajos posteriores han sugerido que la memoria declarativa tiene dos componentes, un componente
episódico que incluye recuerdos de lugares y momentos específicos (la vez que olvidé el cumpleaños de mi
esposa) y un componente semántico que consiste en hechos (la fecha real del cumpleaños de mi esposa). 51
Ahora sabemos que la memoria episódica es una imaginación construida del pasado; probablemente
corresponde al mismo sistema utilizado para imaginar el futuro. 52 Este es el sistema deliberativo que
describimos anteriormente (Capítulo 9). La memoria semántica aún no tiene una correspondencia aceptada
en nuestra taxonomía de toma de decisiones, pero puede ser similar a los componentes de reconocimiento
de situaciones y narración (Capítulo 12).
Lo que importa aquí, y lo que condena la analogía hardware/software, es que los pacientes como HM no
están trasladando el software de una parte del ordenador a otra, sino que cada componente es capaz de
realizar determinados cálculos con la información entrante. Cuando el marinero perdido del caso de estudio
de Oliver Sacks aprende a familiarizarse con su vida entre las monjas y encuentra la paz en su jardín, no ha
encontrado una manera de recuperar su capacidad de aprender nuevos recuerdos, sino que ha encontrado
la paz en la forma en que utiliza otros sistemas para realizar sus tareas. Cuando HM aprendió a escribir en
espejo, lo hizo utilizando el sistema de memoria procedimental.

Estructuras corticales: ¿Puede la corteza visual reemplazar

a la corteza auditiva?

sus hipocampos y otras estructuras subcorticales especializadas. El procesamiento cortical es bastante diferente: 53 Subcortical y HM perdieron

mientras que las estructuras subcorticales tienden a estar especializadas, la corteza es una gran lámina bidimensional de unidades de

procesamiento repetidas, dispuestas en pequeñas columnas repetidas. 54

Las teorías actuales sugieren que cada parte repetida de la corteza realiza un cálculo similar sobre un
conjunto único de entradas. (Exactamente en qué consiste ese cálculo sigue siendo controvertido, pero
parece ser algún tipo de proceso de categorización que ocurre a través de un mecanismo de memoria
direccionable por contenido. 55 Véase el Apéndice C para una discusión de lo que se sabe sobre los cálculos
que ocurren en la corteza). Sin embargo, ese cálculo depende fundamentalmente de las entradas y, a
diferencia de las computadoras digitales, esas entradas son incompletas.
56 Es decir, no se puede enviar ninguna información a ninguna parte de la corteza. Cada
columna cortical recibe un conjunto limitado de entradas, y la información transportada por esas entradas es
todo lo que tiene disponible.
Podemos ver las limitaciones de esto al observar cómo las representaciones corticales pueden cambiar
con los cambios en las entradas sensoriales. Esto se ha estudiado con más detalle en el contexto de los
sistemas sensoriales primarios (en particular, los sistemas somatosensoriales [del tacto]). 57 Las células en
estas áreas sensoriales reciben entradas de una amplia gama de células de entrada, con entradas más
58
fuertes generalmente en el centro y la fuerza de la entrada disminuye a medida que Hablamos de “tuning”
la entrada cambia. curvas”, que generalmente tienen una sensibilidad máxima pero un rango amplio (ver Apéndice B).
Machine Translated by Google

La mente física 153

Las células compiten entre sí para determinar qué señales formarán el pico de cada curva de ajuste. Tomemos
como ejemplo la palma de la mano: en cada punto de la palma, una serie de mecanorreceptores tienen
mecanismos moleculares que detectan el tacto. Estos detectores hacen que la célula dispare picos, que se
transmiten a la médula espinal y luego, a través de múltiples pasos, a las cortezas sensoriales, donde se interpretan
como sensaciones táctiles. Aunque estos mecanorreceptores individuales cubren áreas muy grandes de la palma,
se puede localizar un toque de pinchazo en un punto pequeño porque la corteza somatosensorial implementa una
especie de proceso de ganador se lleva todo utilizando un mecanismo llamado inhibición lateral: las células
nerviosas inhiben a sus vecinas. Esto significa que, aunque muchas células reciben , en el que corti
información, solo las que representan la ubicación tocada permanecen activas. Este sistema integra información
de un área muy grande, pero proporciona una interpretación muy precisa de la sensación.

Hay más áreas de la corteza somatosensorial que son sensibles a la palma y las puntas de los dedos
que al brazo, lo que hace que la palma y los dedos sean sensores más sensibles que el brazo. Un
experimento clásico de secundaria consiste en cerrar los ojos y pedirle a un compañero de laboratorio que
toque dos lápices en la mano, el brazo o la espalda. ¿Puedes decir que son dos puntos o sientes que son
uno solo? (Como control, el experimento se realiza generalmente con el compañero de laboratorio a veces
usando un lápiz y a veces usando dos y luego preguntando al sujeto "¿uno o dos?") La sensibilidad de la
palma es mucho más precisa que la del brazo o la espalda. Esta distribución no uniforme ocurre en todos
los sistemas sensoriales. La corteza auditiva dedica más área cortical a interpretar las frecuencias en las
que se produce el habla humana que otras frecuencias, mientras que la corteza visual dedica más área
cortical a interpretar el centro de la visión (llamada fóvea) que la periferia.
59

Pero ¿qué sucede cuando se pierde parte de la información? Como las células en realidad
reciben información de grandes áreas del campo sensorial, pero las entradas lejanas suelen
quedar fuera de competencia, si se pierde la parte central de la información, las entradas lejanas
ganarán la competencia y la célula cambiará el área que escucha y mostrará respuestas a las áreas
que quedan. 60 Obsérvese que, si bien la compensación es un cambio en la información que procesa la
corteza, no se debe a un cambio en el software de la corteza que ya no se utiliza, sino a un cambio en el
cual se escuchan las entradas que ya están conectadas.

Este efecto produce consecuencias interesantes, sobre todo en las sensaciones en los miembros
fantasmas. Los pacientes que han perdido un miembro suelen sentir sensaciones en ese miembro desaparecido.

VS Ramachandran ha demostrado que estas sensaciones se deben a estímulos sensoriales que llegan a
61 estructuras primarias
representadas cerca de la corteza somatosensorial. La corteza somatosensorial
62
mate se conoce desde fines del siglo XIX. discontinuidades; por ejemplo, las Tiene algunas cosas extrañas

puntas de los dedos están representadas cerca de la cara. Los pacientes a los que les falta una mano a
veces sienten sensibilidad en la mano cuando se les toca la cara.
Los pacientes con amputaciones suelen quejarse de dolor o picor en el miembro fantasma; estas
sensaciones son extremadamente incómodas porque no pueden rascarse un miembro que no está allí. Sin
embargo, rascarse la zona adyacente representada a veces puede aliviar el dolor del miembro fantasma.

Si la inhibición entre áreas es incompleta o desinhibida o las conexiones no se podan completamente o

se conectan en exceso durante el desarrollo, estas conexiones pueden cruzarse entre sistemas sensoriales
y conducir a experiencias de relaciones entre sensaciones: uno puede oír colores o ver sonidos. 63 Este
proceso, llamado sinestesia (de syn ,
Machine Translated by Google

154 El cerebro con mente propia

que significa “con” o “juntos”, y astesia o estética ]), es , que significa “sentir” o “percibir” [como en anestesia ]
una interacción fascinante entre los sistemas sensoriales. Curiosamente, estas relaciones no son aleatorias; tienden
a ser constantes dentro de una persona determinada. Los sabores saben a formas. Los números tienen colores
asociados. 64
Hay algunas evidencias de que durante el desarrollo, las representaciones corticales pueden cambiar más que
durante la edad adulta. 65 En parte, esto parece deberse a que la conectividad cortical en los jóvenes y los niños es
más amplia y se reduce a medida que se desarrollan los sistemas corticales. Esto ha sido estudiado más
cuantitativamente por Eric Knudsen, observando cómo las representaciones en los colículos de los búhos cambian en
respuesta a los cambios sensoriales. Los colículos superior e inferior son estructuras cerebrales subcorticales en aves
y mamíferos que realizan una función de atención o de orientación: las células están organizadas de manera
topográfica que representa la posición alrededor de la cabeza del animal, horizontal y verticalmente. lleva a que el
atención a esa posición horizontal y vertical. Las células del colículo inferior responden animal preste

principalmente a la información auditiva (pero también más débilmente a la visual), utilizando señales auditivas
(volumen y diferencia de tiempo entre los dos oídos) para localizar un objetivo en el espacio, mientras que las células
del colículo superior responden principalmente a la información visual (pero también más débilmente a la auditiva y
táctil). Cuando escuchas un paso detrás de ti y te das vuelta para ver qué es, eso es el colículo en acción. El colículo
inferior deriva del tectum auditivo de los reptiles, mientras que el colículo superior deriva del tectum óptico en los
reptiles, que son sus sistemas sensoriales primarios. En las aves y los mamíferos, tanto el colículo inferior como el
superior se encuentran debajo de estructuras evolutivamente más nuevas, las cortezas auditiva y visual.

67
Como estos colículos están organizados topográficamente en términos de
una salida, los múltiples sistemas sensoriales tienen que estar alineados. Probablemente porque es más fácil calcular
una orientación a partir de señales visuales que auditivas, la alineación de ambos (incluso del colículo inferior) resulta
68
estar basada en señales visuales.
Eric Knudsen y sus estudiantes utilizaron este fenómeno para estudiar cómo el cúmulo inferior de las lechuzas
las entradas visuales. 69 Los búhos son particularmente buenos para localizar sonidos cambia cuando se modifican
en el espacio tridimensional (ya que generalmente cazan de noche).
Un búho puede seguir las pisadas de un ratón a metros de distancia, apuntarle y golpearlo con precisión.
70
A medida que el búho se desarrolla, necesita aprender a alinear la información espacial que obtiene
de las señales auditivas con la información espacial que obtiene de las señales visuales.
Knudsen y sus colegas equiparon a los búhos con gafas prismáticas que desplazaban las señales visuales hacia la
I
izquierda o hacia la derecha en un ángulo determinado.En el búho, el sistema auditivo se desplaza para
alinearse con el visual, por lo que las entradas auditivas al colículo inferior tenían que llegar a
lugares ligeramente diferentes.
Lo que Knudsen y sus colegas descubrieron fue que, inicialmente, las entradas auditivas al colículo inferior eran
muy amplias, pero que se reducían a medida que los animales progresaban.

I Estos prismas pueden resultar familiares a algunas personas que visitan museos de ciencias. Un juego típico de
neurociencia que se muestra en los museos de ciencias y durante las presentaciones a los estudiantes de la escuela es
pedirle a un voluntario que lance una bolsa de frijoles a una canasta con prismas puestos. Debido a que el prisma desplaza el
mundo visual hacia la izquierda en un ángulo determinado (digamos 20 grados), la persona normalmente falla la canasta por
20 grados en la dirección opuesta. Con intentos continuos, la persona puede aprender a compensar en el transcurso de unos pocos minutos.
Y luego, cuando se quitan los prismas, se produce un efecto posterior en el que la persona falla el tiro por 20 grados en la
dirección desviada, lo que lleva unos minutos corregir. Con más experiencia con y sin prismas, el tiempo que lleva cambiar
disminuye. 71
Machine Translated by Google

La mente física 155

a través del desarrollo. En particular, los búhos pasaron por una edad específica, llamada período
sensible , después del cual las entradas auditivas se cristalizaron en su lugar y ya no se volvieron
maleables. 72 Las manipulaciones de los prismas antes de la cristalización fueron mucho más efectivas
que las manipulaciones posteriores.
Este tipo de período sensible se observa en muchos sistemas, incluidos el sistema visual, el sistema
auditivo y otros. Se observan períodos sensibles similares en los gatos y los monos que aprenden a ver,
en los pájaros que aprenden a cantar y en los niños humanos que aprenden el lenguaje. 73 Por

eso los niños aprenden mucho mejor que los adultos lenguas extranjeras. La aparición de los períodos
sensibles se debe a un cambio fisiológico en el cerebro, que termina cuando la plasticidad se cristaliza en
74
diferentes estructuras cerebrales a distintas edades.
Pero, de nuevo, tal como se vio en los resultados del miembro fantasma, arriba, los cambios que los
búhos podían acomodar conductualmente coincidían completamente con el grado de cambios físicos .
es. 75 Los cambios disponibles dependían de los cambios de conectividad. Dependencias similares
76
Se han observado cambios en los sistemas somatosensoriales y auditivos que Cambios sensoriales
reflejan cambios reales en la conectividad física dentro del cerebro. Pero ¿qué pasa con los recuerdos?
¿No se puede traducir la información de la memoria de corto plazo a la de largo plazo?

Transferencia de recuerdos de una parte del cerebro a otra

Al recuperarse de la operación, HM mostró un nuevo y profundo déficit en su capacidad para aprender

nuevos recuerdos. Sin embargo, sus recuerdos anteriores parecían estar intactos. Los recuerdos más
77
antiguos estaban mejor representados que los más recientes. En su momento, esto se
interpretó como que los recuerdos se transferían de un almacén de memoria de corto plazo a un almacén
de memoria de largo plazo (como la información que se escribe desde la memoria de una computadora a
un disco duro o a un CD). Pero estudios posteriores han demostrado que estos recuerdos más antiguos
78
son diferentes de los más recientes. Algo ha cambiado en la transferencia.
Los recuerdos a largo plazo tienden a ser muy semánticos, almacenados como hechos, como
narraciones, como guiones e historias, mientras que los recuerdos a corto plazo tienden a ser episódicos,
con una emoción personal de "yo estaba allí" en ellos. 79 Esto no significa que no tengamos recuerdos a
largo plazo con fuertes emociones de "yo estaba allí", pero en HM y otros pacientes amnésicos similares,
esos recuerdos episódicos más antiguos desaparecieron junto con los recuerdos a cortoLo que parece
plazo.
ocurrir con los recuerdos es que, a corto plazo, se almacenan como eventos episódicos, pero con el
tiempo quedan relegados a un almacenamiento semántico que es fundamentalmente diferente.
Todos los recuerdos a largo plazo de HM, por ejemplo, eran descripciones semánticas y no contenían las
descripciones episódicas que normalmente asociamos con recuerdos importantes a largo plazo.
recuerdos.

¿Cómo puede surgir esta diferencia entre la memoria semántica y la episódica? A lo largo de este
libro, he intentado explicar el mecanismo con teorías que puedan explicar realmente cómo surge el nivel
de información a partir del físico. En este caso, necesitamos las respuestas a cuatro preguntas: (1)
¿Cómo se almacenan las memorias episódicas? (2) ¿Cómo se almacenan las memorias semánticas? (3)
¿Cómo se transfiere la información de una a otra? Además, sería bueno entender (4) ¿Por qué es útil
evolutivamente un mecanismo de este tipo?
Hemos encontrado recuerdos episódicos en otras partes de este libro (en el Capítulo 9). Observamos
que no se almacenaron de manera impecable, sino que se reconstruyeron a partir de componentes
almacenados en diferentes áreas corticales.
Machine Translated by Google

156 El cerebro con mente propia

hipocampo, que recibe información (a través de la corteza entorinal) de prácticamente todo el neocórtex, y
que envía información (de nuevo a través de la corteza entorinal) a prácticamente todo el neocórtex. en otra
82 También nos hemos encontrado con memorias semánticas.
parte de este libro (en el Capítulo 12).

¿Por qué necesitaríamos estos dos sistemas diferentes? Es de suponer que, como en los otros ejemplos
de sistemas de toma de decisiones múltiples que hemos encontrado hasta ahora, cada mecanismo tiene
ventajas y desventajas. Si utilizamos el adecuado en el momento adecuado, podemos aprovechar las
ventajas de cada uno y reducir las desventajas. Una teoría, propuesta por Jay McClelland, Randy O'Reilly y
Bruce McNaughton en la década de 1990, era que necesitamos dos sistemas de aprendizaje: un sistema
que pudiera almacenar unos pocos recuerdos rápidamente asegurándose de que las representaciones fueran
realmente separables, y otro sistema que pudiera almacenar muchos recuerdos, pero que se tomara el
tiempo de almacenarlos lentamente para que no interfirieran entre sí. 83 La teoría surgió del trabajo sobre los
aspectos computacionales de las memorias direccionables por contenido (véase el Apéndice C), en el que
se observó que almacenar recuerdos secuencialmente en un sistema neuronal donde los recuerdos estaban
distribuidos entre muchas neuronas producía una interferencia catastrófica : a medida que se almacenaba un
recuerdo, se perdían los recuerdos más antiguos. 84

Como estos sistemas almacenaban la información de manera distribuida, a través de pequeños cambios
en las conexiones individuales, cada conexión entre neuronas (cada sinapsis) participaba en muchos
recuerdos. Esto significa que si se almacenaba un recuerdo, los cambios en las sinapsis necesarios para
almacenar el nuevo recuerdo podrían deshacer algunos de los cambios necesarios para los recuerdos
anteriores. Este es un proceso llamado interferencia .
para que interfieran con los antiguos, es decir, si 85 Por otro lado, si intercalas los nuevos recuerdos
cambias las sinapsis un poco hacia lo que tendrían que ser para almacenar el primer recuerdo, y luego un
poco hacia lo que tendrían que ser para almacenar el segundo, las sinapsis podrían encontrar una manera
de almacenar ambos recuerdos simultáneamente.

En efecto, existe un equilibrio entre ser lo suficientemente maleable para aprender cosas nuevas
rápidamente y lo suficientemente estable para mantener recuerdos durante mucho tiempo. McClelland,
O'Reilly y McNaughton propusieron que si se tuviera un sistema que pudiera almacenar recuerdos
rápidamente, sin interferencias, se podría utilizar ese sistema de almacenamiento rápido para intercalar los
recuerdos en el almacenamiento más lento y de más largo plazo. Propusieron que el hipocampo, que
contiene mecanismos para reducir la interferencia entre los recuerdos almacenados (y por lo tanto puede
almacenar recuerdos rápidamente), servía como almacenamiento rápido y la corteza (que aprendía más
86
lentamente y contenía muchas más sinapsis) servía como almacenamiento lento. Aunque Aunque esto
esta teoría parece ser principalmente correcta, como hemos discutido en este capítulo, la transferencia es
una transferencia, no solo de información sino también de tipo, de una representación episódica a una
87
representación semántica.
Esto significa que el cerebro necesita transferir una memoria desde un sistema aprendido rápidamente,
que la reconstruye a partir de partes, a un sistema de almacenamiento aprendido lentamente, en el que se
88 Antes de analizar cómo se
almacena gracias a la fuerza de las conexiones entre las estructuras neuronales.
produce esta transferencia, es importante señalar que existen pruebas muy sólidas de que se trata de dos
sistemas separados, cada uno de los cuales puede aprender recuerdos por separado. Aunque el aprendizaje
generalmente procede de los recuerdos episódicos aprendidos rápidamente a los recuerdos semánticos
aprendidos más lentamente, si se dañan las estructuras críticas para los sistemas de memoria episódica, el
sistema de memoria semántica aún puede aprender. 89 Por ejemplo, los pacientes con hipocampo
Machine Translated by Google

La mente física 157

Los niños con daño cerebral tienen problemas para pensar en el futuro episódico, pero aún pueden aprender
a reconocer escenas familiares que experimentan varias veces y aún pueden construir narrativas.
90 activos. Un ejemplo de ello lo encontramos en el marinero perdido de Oliver Sacks, que encontró la manera
de sentirse cómodo en su nuevo jardín pero siguió siendo incapaz de aprender recuerdos explícitos
(episódicos). 91 Suzanne Corkin dice que a través de su larga interacción con él, HM comenzó
a reconocerla y pensó que la conocía de la escuela secundaria. 92 Esta construcción de una explicación a
veces se llama confabulación93 y es una consecuencia de la construcción de narrativas (Capítulo 12) a
través de procesos de memoria direccionable por contenido (Apéndice C).

Aunque es posible construir recuerdos semánticos a través de una experiencia prolongada, también es
posible tomar una experiencia única (codificada en la memoria episódica) y, a través de la repetición interna,
transferirla a una memoria semántica. Esta transferencia parece ocurrir principalmente durante el sueño.
94 Los científicos saben desde hace mucho tiempo que el sueño es
una parte fundamental del proceso de aprendizaje. Los animales y los seres humanos privados de sueño no
sólo no aprenden bien, sino que además no recuerdan fácilmente las tareas que aprendieron antes de quedar
95
privados de sueño.
Uno de los fenómenos más interesantes descubiertos en las últimas dos décadas es un fenómeno
llamado “reproducción”, en el que los patrones de activación neuronal observados durante la conducta se
reproducen durante el sueño después. 96 El fenómeno se observó originalmente en registros neuronales del
hipocampo, pero ahora se sabe que ocurre en todo el hipocampo, el neocórtex y algunas estructuras
subcorticales. Debido a que es tan difícil registrar señales neuronales de los humanos, el fenómeno de la
repetición se ha estudiado generalmente en ratas y monos, pero el momento de los eventos de repetición
se corresponde muy bien con el momento en que los estudios de privación del sueño han descubierto que el
sueño es fundamental para consolidar la memoria.
97 recuerdos.

La reactivación de patrones neuronales conductuales durante el sueño fue observada por primera vez en
1989 por Constantine Pavlides y Jonathan Winson, quienes registraron a partir de pares de células
98
células pal de ratas. hipocampales en ratas (células de lugar) que tienen la función de ajuste muy
conveniente de que responden solo cuando la rata está en una posición específica en un entorno (el campo
de lugar de la célula). Cada célula tiene un campo de lugar diferente. 99 Pavlides y Winson eligieron células
de lugar con campos de lugar no superpuestos; por lo tanto, pudieron exponer a la rata al campo de lugar de
una célula sin exponerla al campo de lugar de la otra. Luego descubrieron que durante el sueño después de
la conducta, la célula con el campo de lugar al que el animal había estado expuesto se activaba mucho más
que la célula con el otro campo de lugar, incluso aunque el animal no estuviera en ninguno de los campos de
lugar cuando se le permitió dormir.

Nuestra capacidad para observar la reactivación y la repetición dio un paso gigantesco con el desarrollo
en 1993 de la tecnología de grabación multitetrodo por Matt Hew Wilson y Bruce McNaughton, quienes
combinaron varias tecnologías y pudieron grabar de casi 150 células simultáneamente de sus ratas en
100 Porque cada uno
comportamiento. Como cada célula de lugar tiene un campo de lugar diferente, a partir
de la actividad en todo el conjunto de células, Wilson y McNaughton pudieron decodificar la posición de la
rata durante el comportamiento a partir de su conjunto neuronal. (Véase el Apéndice B para una descripción
de cómo funciona este proceso de decodificación). A partir de un gran conjunto neuronal, también se puede
determinar si los patrones observados durante el comportamiento se repiten (reactivan) posteriormente
101
durante el sueño. A partir de un
gran conjunto neuronal, se puede incluso determinar si las secuencias observadas durante el comportamiento
Machine Translated by Google

158 El cerebro con mente propia

repetir (replay) después durante el sueño. Una serie de estudios realizados en los años posteriores, a partir
del artículo de seguimiento de Wilson y McNaughton en 1994 y que culminó en docenas de artículos en la
última década, han demostrado que lo que se reactiva es en realidad el patrón neuronal completo: las células
que fueron coactivas durante la conducta siguen siendo coactivas durante la reactivación, mientras que las
células que no fueron coactivas no lo son, y que lo que se reproduce son las secuencias reales observadas
por la rata: las células se reactivan en el mismo orden durante el sueño que durante la conducta. 102 Los
estudios de control han demostrado que esta reactivación es una consecuencia de la conducta: no ocurre
durante el sueño antes de la conducta, solo después.
La reactivación y la repetición también se observan en los sistemas neocorticales durante el sueño. Al
igual que con la reactivación y la repetición del hipocampo, los mismos patrones neuronales observados
durante la conducta aparecen después durante el sueño. La reactivación y la repetición se han observado
en una serie de sistemas corticales, incluidos la corteza prefrontal, parietal e incluso la corteza visual
primaria. 103;J

En este punto, se desconoce la función computacional y neurofisiológica de la repetición. 106 ¿Es para
ayudar al almacenamiento de información dentro de la estructura misma (hipocampo o corteza)? 107 ¿Es para

transferir información desde el sistema episódico basado en el hipocampo? ¿Es para borrar viejos recuerdos
108
¿Tem al sistema semántico de base cortical? ¿pocampus de la cadera?
mientras mejora otros nuevos? 109 Aunque los investigadores todavía están abordando estas
cuestiones hoy en día, tenemos pistas intrigantes de que todas estas funciones pueden ser importantes. Lo
que se sabe es que el bloqueo de la repetición, ya sea farmacológicamente (a través de medios químicos) o
eléctricamente (estimulando el hipocampo cada vez que un evento de repetición está a punto de suceder ),
111
También se sabe quealtera
los eventos
la retención
de repetición
de la memoria.
en el hipocampo tienden a corresponder a eventos de
reactivación en las estructuras corticales, y que después de los eventos de repetición, los patrones neuronales
en las estructuras corticales se acoplan más estrechamente, incluso entre estructuras corticales, exactamente
como se predeciría por la transferencia e integración
112
hipótesis de gración.
A lo largo de esta discusión, he evitado llamar a estos eventos de repetición "sueños", porque no sabemos
si estos eventos de repetición vistos en animales corresponden a lo que experimentamos como sueños. (No
podemos preguntarle al animal si está soñando, y es muy difícil registrarlo en humanos durante los sueños).
Pero, por supuesto, es muy probable que este fenómeno de reactivación/reproducción que se está estudiando
en animales sea la instanciación física del fenómeno al que nos referimos como sueños. Los sueños a
menudo son secuencias desordenadas Aunque los experimentos con animales informan de la repetición real
113
de experiencias pasadas. de

La repetición en estructuras subcorticales no hipocampales, como el sistema dorsal en los ganglios basales (Capítulo 10), aún no ha sido reportada, pero no ha

habido el mismo nivel de estudio extenso realizado en estas estructuras durante el sueño. La única excepción es que el cuerpo estriado ventral (el núcleo accumbens,

que vimos que estaba involucrado en la representación de resultados potenciales durante la deliberación; ver Capítulo 9), repite la actividad relacionada con la

recompensa junto con la repetición hipocampal de lo experimentado. El sueño también es crítico para el aprendizaje procedimental, pero aún se desconoce si esto se

debe a eventos de repetición en los sistemas de ganglios basales dorsales. 105

104
secuencias.

K
Los eventos de repetición en el hipocampo tienden a ocurrir durante un evento de potencial de campo local (LFP)
identificable llamado ondulación u onda aguda (a veces llamado "complejo de onda agudaondulación") que se puede observar
en el hipocampo. Debido a que estos eventos de LFP se pueden detectar rápidamente, se pueden interrumpir tan pronto como se detecten.
110
tan pronto como comienzan a través de una breve estimulación eléctrica del hipocampo.
Machine Translated by Google

La mente física 159

En parte, esto puede deberse a que esas secuencias son las más fáciles de reconocer. Algunos
experimentos han encontrado representaciones intercaladas de experiencias antiguas y nuevas en ratas
114
durante el sueño REM. Durante el comportamiento despierto y en reposo, experimentos recientes
han encontrado “repeticiones” de secuencias que el animal nunca ha experimentado realmente, como la
secuencia experimentada por el animal pero al revés, o cadenas de secuencias experimentadas que
comparten puntos en común pero que en realidad no se han experimentado juntas.
115

En un experimento muy intrigante, Robert Stickgold y sus colegas entrenaron a una población...
116
ción de pacientes con amnesia hipocampal (como HM) para jugar al videojuego Tetris.
Estos pacientes pueden aprender tareas utilizando su memoria no hipocampal, pero no recuerdan que ya
han jugado al juego antes. Cuando Stickgold y sus colegas despertaron a estas personas y les preguntaron
sobre sus sueños, dijeron que vieron formas extrañas cayendo del cielo, pero estaban aterrorizados porque
no tenían idea de dónde provenían esas formas. Parece probable que la corteza estuviera reproduciendo
los estímulos sensoriales que había visto (formas que caían), pero que, sin un hipocampo, estos pacientes
no podían integrar estos eventos en sus recuerdos episódicos ni recordar de dónde provenían esas
imágenes.

Resumen
De modo que, incluso después de sufrir lesiones, los animales (incluidos los humanos) pueden aprender
nuevas tareas, pero estas nuevas tareas se aprenden de maneras diferentes, utilizando sistemas de toma
de decisiones diferentes. De modo similar, las estructuras corticales intactas pueden reemplazar a las
estructuras corticales dañadas, pero sólo en la medida en que estén disponibles las conexiones de entrada.
Y los recuerdos pueden transferirse de las estructuras episódicas dependientes del hipocampo a los
procesos semánticos dependientes de la corteza, pero se modifican en esa transición. El cerebro es una
máquina física. La mente no es un software que se implementa por casualidad en el hardware del cerebro,
sino que depende directamente de los procesos del cerebro físico.
Antes se pensaba que la mente era como un excursionista en un bosque, o un surfista en una ola, o tal
vez como la ola misma fluyendo a través de un océano físico, o como algo afectado por el cerebro mismo
pero separado de él. 117 Históricamente, esta separación se basaba en En la cognición moderna
El dualismo de Descartes entre las entidades físicas y cognitivas. En la 118
ciencia creativa del siglo pasado, esta separación se basó en las nuevas teorías de la información
digital. 119
Sin embargo, como hemos visto en este capítulo, la teoría de que la mente y el cerebro son separables
es insostenible y los datos disponibles sugieren, en cambio, que son la misma cosa.
La evidencia de que la actividad mental es el procesamiento de información es abrumadora, pero los
diferentes componentes del cerebro procesan esa información de manera diferente. No es una ola que
fluye a través de un océano abierto, capaz de viajar en cualquier dirección, sino más bien una ola que viaja
a través de una serie de cañones altamente restrictivos. Esto tiene implicaciones para todos los aspectos
de nuestra vida mental, desde procesos mentales como la imaginación hasta enfermedades y trastornos
mentales como la enfermedad de Parkinson, la enfermedad de Alzheimer, el trastorno de estrés
postraumático y la adicción, pasando por construcciones mentales de comportamiento como el ansia, la
impulsividad, el libre albedrío y la moralidad.
Machine Translated by Google

160 El cerebro con mente propia

Libros y artículos para lectura adicional • VS

Ramachandran y Sandra Blakeslee (1999). Fantasmas en el cerebro: sondeando la

Misterios de la mente humana . Nueva York: Harper Perennial.
• Patricia S. Churchland y Terrence J. Sejnowski (1994). El cerebro computacional.
Cambridge, MA: MIT Press .
• Suzanne Corkin (2002). ¿Qué hay de nuevo con el paciente amnésico HM? Nature Reviews 153–
Neurociencia, 3, 160 .
• Douglas R. Hofstadter (1979). Gödel, Escher, Bach: Una eterna trenza dorada .
Nueva York: Basic Books.
• Douglas R. Hofstadter (1985). Temas metamágicos: en busca de la esencia de la mente y los
patrones . Nueva York: Basic Books.
Machine Translated by Google

Imaginación

Quiero caminar contigo en la playa, sentir el frescor

del océano tirando de nuestros pies, el recuerdo

como agua llenando

nuestras huellas en la arena mojada.

Si el cerebro es la instancia física de la mente, entonces cada evento mental debe

reflejarse en el reino físico, desde la imaginación hasta la alucinación y la imaginería

mental. La teoría actual en neurociencia es que este reino físico es el funcionamiento

de las neuronas.

Es decir, tal como sabemos que el disparo de las neuronas sensoriales responde a

señales sensoriales, y el disparo de las neuronas motoras controla los músculos, esta

teoría predice que los eventos mentales (cognitivos) no sensoriales no sólo se reflejan

en el disparo de las neuronas, sino que en realidad son el disparo de las mismas.

El hecho de que la corteza se pueda entender mejor como una lámina bidimensional de columnas repetidas en lugar de

como una estructura tridimensional sugiere que podemos pensar en la corteza como una serie de mapas interconectados.

Las estructuras visuales mapean el campo visual que tienes frente a ti, las estructuras auditivas mapean los tonos y sonidos,

y tanto las estructuras sensoriales como las motoras mapean tu cuerpo.

En los mamíferos (incluido el ser humano), la corteza visual primaria se encuentra en la parte posterior del cerebro. Los

axones que conectan los ojos con la corteza visual tienen que recorrer todo el cerebro (pasan por debajo), por lo que una

conmoción cerebral (en la que el cerebro se golpea contra el cráneo como un objeto sin restricciones en un coche que se

detiene de repente) suele provocar problemas visuales. Descubrieron que, en su mayor parte, las células de cada columna
2
cortical visual están sintonizadas con el mismo Registros de neuronas de la corteza visual primaria

punto de la retina. Algunas de estas células están sintonizadas con puntos de la retina, mientras que otras están sintonizadas

con líneas orientadas y otras están sintonizadas con líneas orientadas en movimiento. Algunas se excitan con la luz en el

lugar, mientras que otras se inhiben. Pero cada columna de la corteza visual primaria está sintonizada con la luz que llega

a un punto de la retina.
3

La conectividad en la corteza se basa en una arquitectura de centroenvolvente, en la que las células que representan

ubicaciones similares en la retina están acopladas de manera más estrecha que las células que representan ubicaciones

distales, con una conectividad inhibitoria de mayor escala.

161
Machine Translated by Google

162 El cerebro con mente propia

conexiones más espaciadas que tienen efectos sutiles (serán particularmente importantes cuando
discutamos las migrañas y la alucinación de fortificación), pero la conectividad primaria parece
ser entre columnas adyacentes que representan información similar. 4 En el
nivel más simple, la corteza puede considerarse como una capa de excitación local e inhibición
más amplia. Esta conectividad produce lo que se conoce matemáticamente como un núcleo de ,
acoplamiento local , una conectividad que se repite en cada ubicación. 5 Estos núcleos de
acoplamiento también se observan en objetos físicos, como la relación entre las espiras de un
resorte o la conectividad física de una cuerda de guitarra (en una dimensión), la conectividad física
de una sábana (en dos dimensiones) o la relación entre moléculas de agua (en tres dimensiones).

Estos son tres ejemplos particularmente interesantes porque todos muestran efectos de ondas.
Todos hemos visto ondas en el agua y todos hemos aplastado una sábana para enviar una onda a
través de ella; un experimento clásico de física de secundaria consiste en tomar un resorte y enviar
una onda viajera a través de él. Y, por supuesto, el sonido generado por una cuerda de guitarra se
basa en una onda estacionaria, ya que vibra en las condiciones restringidas (denominadas
matemáticamente condiciones límite ) en las que los dos extremos se mantienen fijos y no se pueden
mover. Así como las ondas pueden viajar a través de los objetos físicos, también las ondas de actividad
neuronal pueden viajar a través de la capa cortical. 6

¿Qué se sentiría si una ola de actividad recorriera tu corteza visual?

Si la actividad neuronal en la corteza visual es percepción visual, entonces percibirías una onda a
través de tu corteza visual como una onda de luz que viaja a través de tu visión. En otras palabras,
alucinarías una onda de luz. Pero la gente ha estado reportando sus alucinaciones durante miles
de años, y las alucinaciones aleatorias no aparecen como una onda de luz a través de tu visión.
7

La razón de esto es que la corteza visual primaria en los primates (incluidos los humanos) no
representa la información retiniana con una transformación uno a uno. En cambio, hay más
representación del centro de la retina (un área llamada fóvea) y menos representación de la
periferia. La descripción matemática específica de esta
transformación se llama transformación logpolar . Piense en su corteza visual como dos
rectángulos pegados en la parte posterior de su cerebro, uno al lado del otro. Cada lado de su
corteza visual representa la mitad de su campo visual. Las células de la fóvea se proyectan (a
través de una estructura talámica intermedia que realiza un procesamiento adicional , llamada
núcleo geniculado lateral) a las células de la corteza visual cerca de la línea media, mientras que
las células de la periferia se proyectan (de nuevo a través de estructuras intermedias) a las células
de la corteza visual más lateralmente. Moverse a lo largo del eje horizontal de la corteza visual
equivale a moverse fuera de la fóvea. Así como hay más células en la fóvea que en la periferia,
hay más corteza visual dedicada a la fóvea que a la periferia. De manera similar, moverse a lo
largo del eje vertical equivale a moverse en un círculo alrededor de la fóvea, con la parte superior
de su corteza visual correspondiente a la parte superior de su campo visual.
Esto significa que una onda que estaba perfectamente alineada con el eje vertical de la corteza
visual, que comenzaba en la línea media y se alejaba de ella, aparecería como un anillo en
expansión. Debido a que cada vez más campo visual está representado por la

A
En la retina también se lleva a cabo una gran parte del procesamiento. Sin embargo, este libro no trata de
cómo procesa el cerebro la información sensorial, por lo que no entraré en detalles, pero un buen recurso para
quien esté interesado es el reciente libro de texto de Chaudhuri.
Machine Translated by Google

Imaginación 163

área del mismo tamaño de la corteza a medida que uno se mueve hacia la periferia, una onda viajera que
se mueve a una velocidad constante en la superficie cortical parecería acelerarse a medida que viaja hacia
la periferia.
Las alucinaciones visuales simples se observan a menudo al quedarse dormido y al despertarse, bajo
ciertas luces parpadeantes y en habitaciones oscuras y selladas. También se observan bajo la influencia
de ciertas sustancias químicas recreativas (drogas). Estas alucinaciones visuales simples son muy similares
a las que se pintan y se graban en piedras sagradas y paredes de cuevas. La gente ha estado reportando
sus alucinaciones inducidas por sustancias químicas durante miles de años. También son los mismos
9
patrones que se observan a menudo en las experiencias "cercanas a la muerte".
Estas imágenes tienden a estar formadas por líneas radiales, espirales y formas de telaraña. A menudo
aparecen como tableros de ajedrez en espiral, panales o puntos. Y a veces son tan simples como una luz
blanca en el centro de la visión. A veces las imágenes son estables y otras veces se mueven en un patrón
espiral hacia adentro o hacia afuera. Las imágenes se mueven con la retina (y por lo tanto se ven en el
"espacio retiniano", lo que es particularmente extraño de experimentar porque estamos acostumbrados a
ver cosas en el espacio "alocéntrico" o del mundo real, que se mueve en nuestra retina cuando movemos
nuestros ojos). Estas imágenes son la interpretación visual de
ondas en la corteza.

Una onda vertical que fluye de arriba hacia abajo a lo largo de la corteza visual aparecerá como líneas
radiales rotatorias. Una onda que colapsa y fluye desde los aspectos lateral a medial aparecerá como una
luz que colapsa y puede interpretarse fácilmente como un túnel. Una onda que está orientada diagonalmente
a lo largo de la corteza visual aparecerá como una espiral. A medida que la onda se mueve, la espiral
puede parecer que se mueve hacia adentro o hacia afuera. Véase la Figura 17.1.
La corteza visual primaria del primate está en realidad conectada de una manera más compleja que
un simple núcleo centroentorno. 10 Las columnas corticales están organizadas en hipercolumnas locales,
que representan una única ubicación en el campo visual, pero contienen células selectivas de orientación,
que responden a líneas orientadas de diferentes maneras.
Una hipercolumna contiene columnas de celdas que representan cada orientación potencial. Cada columna
está acoplada a celdas dentro de su propia hipercolumna (porque representan la misma ubicación en el
campo visual) y a columnas cercanas en otras hipercolumnas que comparten su orientación preferida
(porque representan líneas de la misma orientación).
Las conexiones entre hipercolumnas parecen estar dispuestas en una cuadrícula aproximadamente
hexagonal. Es la cuadrícula hexagonal a través de las hipercolumnas la que produce los componentes de
tablero de ajedrez o panal de abeja de algunas alucinaciones visuales.
El sistema visual de los primates (incluido el ser humano) es muy complejo e incluye una serie de áreas
corticales separadas, cada una de las cuales está dedicada a una característica útil diferente, como colores,
ubicaciones espaciales en el mundo visual e incluso caras, habitaciones y otros objetos dedicados. conjunto
11
de detectores de Las teorías actuales sugieren que esta compleja red de campos visuales es una
características separados y dedicados, ajustados al conjunto de imágenes naturales que experimentamos
en nuestras vidas.

Es probable que las alucinaciones de eventos y objetos más complejos dependan de la activación de
otras cortezas, como las que representan objetos, rostros, lugares y otras sensaciones. Sin embargo, como
no sabemos cómo se codifican estas representaciones de orden superior, no sabemos cómo aparecerían
las ondas en ellas. La activación aleatoria de la corteza visual también se observa en condiciones de
alucinación, que aparecen como pequeños puntos de color en el campo visual (de nuevo, que siguen a la
retina a medida que se mueve). 12 Así como la activación de la corteza visual primariase percibe como
visión, la activación aleatoria de las neuronas en la corteza visual primaria se percibe como visión.
Machine Translated by Google

164 El cerebro con mente propia

Patrón en Visual
corteza visual percepción

Figura 17.1 Transformación logpolar en la corteza visual de los primates. Los patrones de la corteza visual
(líneas horizontales, líneas verticales, líneas diagonales) se transforman en percepciones retinianas (líneas
radiales, círculos concéntricos, una espiral) debido a la transformación logpolar de la retina a la corteza visual. Se
observan patrones similares durante la privación sensorial, las alucinaciones inducidas por drogas y las
experiencias cercanas a la muerte. También aparecen patrones similares dibujados en petroglifos antiguos.

área de representación facial (una pequeña parte dedicada de la corteza llamada surco temporal superior o STS)
13 se percibiría como si estuviera viendo a una persona específica.

La migraña y la ilusión de la fortificación

Una de las alucinaciones visuales mejor descritas ocurre durante las migrañas y se describe como la alucinación
de “fortificación” o “aura visual”. 14 Generalmente, estas se experimentan como bordes dentados extremadamente

brillantes, que progresan lentamente a través del campo visual, seguidos por un escotoma visual o negrura, que
oscurece la visión. Curiosamente, la línea de bordes dentados se acelera a medida que avanza desde el centro de
la visión hasta el borde, en el transcurso de 10 a 20 minutos. En este punto, es posible que pueda adivinar por qué
el borde dentado se acelera a medida que avanza desde el centro hacia la periferia de la visión.

Estas auras de “fortificación” se pueden explicar directamente como la activación de las células en la corteza
15 corteza. visual. Como se señaló anteriormente, las células de la corteza visual representan la información visual
al estar sintonizadas con líneas cortas y orientadas. Las diferentes orientaciones dentro de una hipercolumna
están conectadas entre sí. Por lo tanto, si gran parte de una hipercolumna estuviera activa, aparecería como un conjunto
Machine Translated by Google

Imaginación 165

de líneas angulares, en orientaciones agudas entre sí. Debido a que las columnas están conectadas
a través de hipercolumnas, se ve una pared hexagonal continua. A medida que la onda progresa
desde el borde medial (el centro de la visión) hasta el borde lateral (la periferia de la visión), la pared
parece moverse. Es excepcionalmente brillante porque todas las células están disparando a medida
que la onda avanza a través de ellas. El disparo consume recursos celulares y las células se vuelven
incapaces de disparar (se vuelven refractarias ) después. 16 La incapacidad de las células para
disparar detrás de la onda aparece como una oscuridad en blanco o un escotoma. La onda parece
acelerarse porque nuestra corteza representa el centro de nuestro campo visual con más área cortical
que la periferia. Por lo tanto, una onda de velocidad constante en la corteza visual cubre cada vez más
nuestro campo visual a medida que progresa lateralmente y parece acelerarse a medida que se mueve.
El término “fortificación” es una alusión a Santa Hildegarda von Bingen, una monja del siglo XII
que vivía en Alemania y que dejó descripciones de visiones de luces más brillantes que el sol que
avanzaban a través de su visión y que se convertían en carbones negros, de visiones de un fuego de
Dios que se extendía, seguido de una oscuridad lúgubre, que dejaba estrellas etéreas detrás, y de
visiones de una cabeza de fuego que azotaba la oscuridad. 17 Varios autores del siglo XX han
18 Los bordes dentados de la ilusión
sugerido que las visiones de Santa Hildegarda eran auras de migraña.
de la fortificación, de hecho, parecen almenas y murallas que podrían verse en lo alto de un castillo
medieval. A menudo son muy brillantes (al ser el disparo de muchas células simultáneamente) y
seguidas de una oscuridad (cuando las células se apagan y se vuelven refractarias, se cansan y se
vuelven incapaces de disparar), lo que oscurece la visión (porque la visión es el disparo de células
específicas; qué subconjunto de células dispara es la información sobre lo que se ve: si todas las
células están en silencio, uno ve solo oscuridad). La figura 17.2 muestra una representación moderna
de la ilusión de la fortificación. Hildegard describió explícitamente que las visiones ocurrieron durante
la vigilia normal, no durante el sueño o los trances, y que no podía ver la longitud o la anchura de
estas visiones (presumiblemente porque las imágenes estaban en su corteza visual, por lo que se
movían con su visión cuando movía los ojos). Uno puede imaginar fácilmente la

(a)

(b)

Figura 17.2 Ilusiones de fortificación en migrañas. (a) Los pacientes con migraña ven zigzags
centelleantes seguidos de oscuridad. Un paciente con migraña observó una pantalla parpadeante
y dibujó lo que vio. (b) Se le pidió al sujeto que se concentrara en un solo punto y dibujara los
bordes de estas fortificaciones en una hoja de papel a intervalos de 2 minutos. Los resultados
revelan que las fortificaciones se expanden hacia afuera a velocidades cada vez mayores. De
Grüsser (1995), reimpreso con permiso del editor.
Machine Translated by Google

166 El cerebro con mente propia

efecto sobre una mujer joven en el siglo XII de una inexplicable línea irregular y brillante que conducía a un
área de oscuridad que se expandía a través de su visión, especialmente una que continuaba ya sea que sus
ojos estuvieran abiertos o cerrados, de la que no podía apartar la mirada, y que estaba acompañada por un
dolor de cabeza ardiente e ineludible.

Imaginación

Si las ondas en la corteza y el funcionamiento aleatorio de las células producen alucinaciones y la ilusión de
ver cosas que no existen, ¿qué sucede en la otra dirección? Cuando imaginamos algo, ¿es también un
proceso físico? Esto se ha estudiado más a fondo a través de la imaginería visual, en la que se pide a las
19
personas que imaginen una imagen visual.
El primer estudio que abordó directamente esta cuestión fue un examen de la capacidad de rotar
mentalmente imágenes en la mente. En un experimento que ahora es clásico, Roger Shepherd y Jacqueline
Metzler pidieron a los sujetos que determinaran si dos imágenes de objetos tridimensionales eran imágenes
del mismo objeto rotado en el espacio o si eran objetos diferentes.
20 Lo que descubrieron fue que el tiempo que tardaba una
persona en determinar si los dos objetos estaban relacionados era una función lineal del ángulo de rotación
entre los dos objetos. De esto concluyeron que las personas estaban rotando mentalmente los objetos (a una
velocidad de unos 60 grados por segundo). Por supuesto, cuando miramos los dos objetos e intentamos
compararlos, tenemos la sensación subjetiva de que los estamos rotando mentalmente (¡al menos yo la
tengo!). Estas rotaciones parecen activar las estructuras visuales y motoras, como si las personas estuvieran
imaginando rotar los objetos manualmente.
Siguiendo este trabajo, Stephen Kosslyn y sus colegas comenzaron a probar la psicofísica B de las
imágenes mentales. 21 Si le pido que imagine un barco pirata y luego hable sobre la proa
del barco (¿Qué es la figura de proa del barco?), responderá más rápido a las preguntas sobre la proa que
sobre la popa (¿Cuántos cañones apuntan hacia atrás?). De alguna manera, las distancias importan en la
imaginería mental. Estas representaciones visuales han sido validadas por los resultados de fMRI que han
demostrado que la imaginería mental activa las áreas sensoriales apropiadas del cerebro: la imaginería mental
visual implica actividad en las cortezas visuales y la imaginería mental auditiva implica actividad en las cortezas
auditivas, etc.
Por supuesto, el cerebro no se compone únicamente de cortezas sensoriales primarias. La gente normal
sabe distinguir entre imaginar un barco y verlo. Esto significa que en algún lugar del cerebro (probablemente
en la corteza frontal) se activan otras neuronas que los diferencian. Una teoría sobre las alucinaciones es que
éstas implican la creación de imágenes mentales sin que esas otras neuronas digan: “Esto es solo tu
imaginación, no es real”. 22
Un ejemplo particularmente interesante de este tipo de imágenes mentales ha capturado la imaginación
de la neurociencia y la psicología recientemente: las neuronas de control motor en las cortezas premotoras de
los monos (las cortezas de planificación relacionadas con el motor 23 ) muestranuna actividad similar ya sea
que el animal esté realizando el movimiento por sí mismo o esté viendo a otro primate realizar el movimiento.
24 Estas neuronas han sido llamadas neuronas “espejo”; sin
embargo, no está claro en este momento si son un tipo especial de representación en la corteza
de los primates o si simplemente reflejan la imaginación del animal de la
las acciones del otro en sus propias neuronas de control motor.25

B
La psicofísica es el estudio de la sincronización de las respuestas perceptivas.
Machine Translated by Google

Imaginación 167

neuronas ya las analizamos en el Capítulo 14, donde las analizamos en términos de nuestra capacidad de
empatizar y simpatizar con los demás.

Medición de imágenes mentales

La imaginería mental es la activación de neuronas en el cerebro. Esto significa que podríamos ser capaces
de identificar un proceso cognitivo encubierto si registramos suficientes neuronas e identificamos
26
manipulaciones de una variable encubierta.
El primer estudio que hizo esto fue realizado en la década de 1980 por Apostolos Georgopoulos y su
27
Georgopoulos y sus colegas entrenaron a un mono para que alcanzara Inicialmente, los monos eran
un objetivo. Lo entrenaron para tocar una luz central y sostenerla hasta que la luz, En ese momento uno de
se apagara, y ocho luces circundantes se encendían. El mono simplemente tenía que alcanzar una de las
luces circundantes para obtener un jugo como recompensa. Lo que Georgopoulos y sus colegas descubrieron
fue que las neuronas en la corteza motora primaria estaban sintonizadas con la dirección en la que el animal
alcanzaba el objetivo y que, a partir de un gran conjunto de neuronas (miles de C ), podían decodificar la
dirección en la que el animal alcanzaba el objetivo (o estaba a punto de alcanzarlo). 29 Luego entrenaron al
mono para que alcanzara el objetivo no hacia la luz encendida en el círculo exterior, sino en un giro de 90
grados en sentido contrario a las agujas del reloj. Cuando decodificaron las neuronas, descubrieron que el
conjunto originalmente se decodificó para representar la dirección de la luz encendida y rotó (a través de
las direcciones intermedias) hacia la dirección en la que el animal iba a alcanzar el objetivo antes de que el
30 El animal rotaba mentalmente la dirección de alcance desde el
animal realmente comenzara su movimiento.
D
objetivo hasta la señal. De hecho, la velocidad de esa rotación mental en la corteza
motora del mono coincidió con la velocidad de rotación mental encontrada en el estudio clásico de
Shepherd y Metzler en humanos dos décadas antes, en el que los humanos hacían coincidir
imágenes de bloques tridimensionales.
Si es posible decodificar información cognitiva e imaginaria encubierta de conjuntos neuronales, entonces
debería ser posible registrar la actividad neuronal del cerebro, pedir a los sujetos que imaginen mover sus
brazos, decodificar la actividad neuronal de cómo quieren que se muevan sus brazos y mover brazos
robóticos para que coincidan. Esta es la promesa del cerebro...
Las interfaces de las máquinas parecen ciencia ficción, pero ya son una realidad en condiciones
limitadas. 32
Usando las mismas áreas motoras sintonizadas que Apostolos Georgopoulos registró dos décadas
antes, Andy Schwartz (entonces en la Universidad Estatal de Arizona, ahora en la Universidad de Pittsburgh)
entrenó a un mono para rastrear una pelota en una realidad virtual tridimensional. Usando gafas
33
espacio. especialmente diseñadas, el mono vio dos pelotas: una pelota amarilla

do
En aquella época, sólo se podía registrar una neurona a la vez. Georgopoulos y sus colegas entrenaron
al mono tan bien que cada movimiento desde el centro hacia afuera era casi exactamente el mismo.
Registraron una o dos neuronas por día y luego combinaron todos los recorridos que el mono hizo a lo largo
de varios años para crear un “pseudoconjunto” de miles de neuronas. Sus experimentos se han replicado
más recientemente utilizando conjuntos más pequeños (docenas) de neuronas registradas simultáneamente,
28
pero las conclusiones no han cambiado.
D Esta rotación mental del mono entre la reacción inmediata de alcanzar la señal y la corrección posterior
para alcanzar el objeto 90 grados fuera de ella es un caso especial del problema que analizamos en el
31
Capítulo 10: que el cerebro primero planifica la reacción rápida y obvia pero puede corregirla si se le da tiempo.
Machine Translated by Google

168 El cerebro con mente propia

que aparecía en un punto aleatorio en el espacio tridimensional, y una bola azul que controlaba. Si podía
hacer que la bola azul atrapara a la amarilla, obtendría una recompensa de jugo. El secreto (para el que
el mono nunca fue entrenado explícitamente) era que el movimiento de la bola azul no se basaba en el
movimiento de la mano del mono, sino en la información decodificada del cerebro del mono. Cuando
presentaba sus datos, Andy Schwartz solía mostrar un video en el que el mono inicialmente seguía la
bola virtual con sus manos, pero luego, cuando se dio cuenta de que el seguimiento se movía más rápido
que sus manos, bajó las manos a los lados y continuó siguiendo la bola usando solo su mente. Por
razones obvias, este video fue referido cariñosamente en la comunidad de neurociencia como el "video
del mono Jedi".

Más recientemente, se ha hecho posible decodificar esta información imaginaria para mover brazos
robóticos, no sólo en monos sino también en humanos. 34 El trabajo en este sentido ha sido lento porque
requirió dos avances separados para funcionar: desde la neurociencia, requirió algoritmos de
decodificación que pudieran identificar lo que se suponía que debía hacer el brazo, y desde la robótica,
requirió brazos robóticos confiables que pudieran ser controlados con suficiente precisión y simplicidad.
Pero ambos avances se han logrado y varios laboratorios ahora han impulsado brazos robóticos a partir
de imágenes mentales. En 2008, un mono en el laboratorio de Andy Schwartz pudo alimentarse usando
35
un brazo robótico. El laboratorio de John
Donoghue ha demostrado que los pacientes tetrapléjicos (que están paralizados del cuello hacia abajo)
pueden guiar manos robóticas para que se muevan y se abran y cierren. 36 En uno de los vídeos que
John Donoghue muestra en sus presentaciones, uno de los pacientes, al observar cómo el brazo robótico
agarra una lata de refresco y la levanta bajo el control de su propia imaginación mental, mira fijamente la
mano robótica, que se mueve con sus pensamientos, y dice, claramente asombrado, “Guau”.

Manipulación cerebral

El concepto de una separación entre cerebro y mente (dualismo) todavía puede sobrevivir a la observación de
que las imágenes mentales se reflejan en la activación neuronal, porque podría ser que el cerebro sólo refleje
lo que está sucediendo en la mente. La verdadera prueba de si la mente corresponde verdaderamente a la
activación neuronal en el cerebro es si las manipulaciones de esa activación cambian las experiencias. De
hecho, a nivel sensorial, esta tecnología es tan exitosa que a menudo no nos damos cuenta de que existe. El
implante coclear, una tecnología implantada en cientos de miles de pacientes, estimula las neuronas sensoriales
en el oído para traducir las señales auditivas de un micrófono directamente al cerebro. 37 Los estimuladores de
retina que traducen imágenes de vídeo en señales sensoriales en la retina están actualmente en ensayos
clínicos de fase II. 38 Sin embargo, la estimulación clínica del cerebro profundo más allá de las cortezas

sensoriales se ha limitado a formas de onda y frecuencias simples sin información. La principal estimulación
clínica de las estructuras no sensoriales ha sido un procedimiento llamado estimulación cerebral profunda, que
actualmente es un tratamiento común para la enfermedad de Parkinson. 39 Aunque todavía se desconoce el
mecanismo por el que funciona, la estimulación de los ganglios basales a frecuencias bajas (menos de unos
pocos cientos de ciclos por segundo) a menudo rehabilita el movimiento en pacientes acinéticos (pacientes que
no pueden moverse). Algunos investigadores creen que esta estimulación apaga efectivamente las estructuras
de los ganglios basales, produciendo un efecto similar a una lesión, permitiendo que otros sistemas de toma de
decisiones tomen el control. Otros investigadores creen que la estimulación de los ganglios basales a
frecuencias bajas (menos de unos pocos cientos de ciclos por segundo) permite que los pacientes acinéticos (pacientes que
Machine Translated by Google

Imaginación 169

Los ganglios necesitan trabajar a un ritmo determinado, y la estimulación les permite volver a ese ritmo.
La estimulación cerebral profunda dirigida a otras áreas se está probando ahora para otros trastornos
41 (como la epilepsia y la depresión), pero la mayoría de estos experimentos son bastante a ciegas:
nadie sabe por qué funcionan cuando lo hacen o por qué no lo hacen cuando no lo hacen.

Sin embargo, en la investigación se ha demostrado que la estimulación puede controlarlo todo,

incluso el placer, el dolor y los recuerdos. En el capítulo 4, nos encontramos con la estimulación del haz
medial del prosencéfalo, donde algunos objetivos de estimulación produjeron placer eufórico y otros
sitios de estimulación no. La estimulación se ha utilizado para todo, desde el manejo del dolor hasta el
control muscular. 42 Las cortezas motoras en sí se definieron en el siglo XIX, cuando los científicos
pasaron pequeñas cantidades de corriente y estimularon la corteza, produciendo movimiento en
animales anestesiados. 43 La estimulación de una ubicación en la corteza motora provocó el movimiento
del brazo, mientras que la estimulación de otra provocó el movimiento de la pierna.
En la década de 1940, Wilder Penfield y Herbert Jasper intentaron ayudar a los pacientes epilépticos
a evitar el tipo de desastre que provocó la pérdida de memoria de HM y examinaron el efecto de la
estimulación cortical en estos pacientes epilépticos. Utilizando anestesia local para abrir un pequeño
trozo del cráneo, F. Penfield y Jasper estimularon áreas de la corteza de los pacientes despiertos, 44 y
canciones, descubrieron que las estimulaciones podían desencadenar recuerdos, indicios de
pacientes en reposo, incluso olores y visiones.
La manipulación más impresionante de las señales cerebrales sigue siendo el trabajo de Bill
Newsome y sus colegas de la década de 1990, en el que pudieron cambiar la percepción de un mono
lo suficiente como para cambiar su decisión final. 45 Newsome y sus colegas entrenaron a monos para
observar el flujo de puntos aleatorios en una pantalla. Algunos de los puntos se movían de manera
verdaderamente aleatoria y otros se movían en una dirección dada (digamos izquierda o derecha). El
objetivo del mono era determinar en qué dirección se movía la (muy pequeña) proporción de puntos.
Nos encontramos con esta tarea anteriormente en nuestra discusión sobre la integración de señales
perceptivas (Capítulo 11). Si recuerda esa discusión, una de las áreas visuales (MST) determina si todo
el campo se está moviendo al mismo tiempo. Debido a que las representaciones corticales en MST
están dispuestas en columnas, y cada columna representa una dirección diferente, Newsome y sus
estudiantes pudieron estimular columnas individuales en MST y cambiar la dirección percibida del
movimiento y las respuestas del mono. Experimentos similares han podido cambiar la dirección de los
movimientos sacádicos visuales (estimulando otras áreas, así como en estructuras subcorticales como
el colículo superior, que impulsa la orientación de la atención). 46

E Hay algunas pruebas, por ejemplo, de que dar a algunos de estos pacientes un ritmo con el que trabajar (por
ejemplo, a través de la música) puede renormalizar el movimiento. A veces, la presencia de señales visuales es
suficiente para reactivar el movimiento. Por ejemplo, colocar un palo en el camino de un paciente puede obligarlo a
pasar por encima del palo y comenzar a caminar de nuevo. Esto se muestra muy bien en la película Awakenings ,
en la que el médico hace pintar el suelo con cuadrados blancos y negros, lo que permite a la paciente, "Rose",
caminar hasta la ventana. 40
F El cerebro no tiene sensores internos locales de dolor, por lo que es posible utilizar anestesia local para
silenciar los sensores en la piel y luego manipular el cerebro del paciente, mientras el paciente está despierto y en la
mesa. He visto que esto se hace durante una cirugía de estimulación cerebral profunda en la que se implantaron
electrodos de estimulación cerebral profunda. El paciente estaba tranquilo y cómodo y conversó con los médicos
mientras implantaban los electrodos en su cerebro. La mayoría de las cirugías de lesiones (por ejemplo, para la
epilepsia) se realizan en pacientes despiertos, de modo que los cirujanos puedan determinar el papel de las
estructuras que están eliminando para asegurarse de que no eliminan nada crítico (para evitar la tragedia de la HM).
Machine Translated by Google

170 El cerebro con mente propia

El cerebro es la instanciación física de la mente. Interferir con la función cerebral

cambia la función mental. Una de las razones por las que a la gente le preocupa aprender
cómo funciona el cerebro y cómo el cerebro físico instancia la mente es que les preocupa
que desarrollemos una forma de control mental, donde las máquinas que manipulan su
cerebro controlen sus pensamientos, deseos y acciones. Pero, así como cambiar el
cerebro cambia la mente, cambiar la mente cambia el cerebro. Siempre que aprendes
algo nuevo, tu cerebro cambia físicamente. Cuando te das cuenta de que realmente tienes
dos opciones (beber o no beber), eso es un cambio físico en tu cerebro, así como un
cambio en tu estado mental. Los humanos ya somos muy hábiles para controlarnos unos
a otros: una enorme cantidad de nuestro poder cerebral está dedicado a predecir lo que
harán nuestros vecinos, colegas, amigos y enemigos. Se dice que el encanto es la
capacidad de hacer que las personas hagan algo que quieres que hagan sin que se den
cuenta de que las has obligado a hacerlo. El hecho de que la manipulación no sea física
no significa que no sea manipulación. El cerebro es la manifestación física de la mente.
Todo acontecimiento mental se refleja en el ámbito físico, desde la imaginación hasta la alucinación y

Libros y artículos para lectura adicional

• Paul C. Bressloff, Jack D. Cowan, Martin Golubitsky, Peter J. Thomas y Matt hew C. Wiener
(2002). Lo que las alucinaciones visuales geométricas nos dicen sobre la corteza visual.
Computación neuronal . 14 , 473–491 .
• Stephen M. Kosslyn.(1994). Imagen y cerebro . Cambridge, MA: MIT Press. •
Adam Johnson, André A. Fenton, Cliff Kentros y A. David Redish (2009).
En busca de la cognición en la estructura del ruido. Tendencias en Ciencias Cognitivas 55–, 13,
64 .
• Andrew B. Schwartz (2007). Señales útiles de la corteza motora. Journal of Physiology ,
579 , 581–601 .
Machine Translated by Google

Adicción

Una hoja que

caía interrumpió
el pétalo de una flor amarilla en mi mano.

La adicción es un trastorno de la toma de decisiones. Definida de esta manera, la

cuestión de la adicción se convierte en la identificación de las diferentes
vulnerabilidades o modos de fallo que han surgido dentro de los sistemas de
toma de decisiones de un individuo. Esta hipótesis sugiere que los tratamientos
de la adicción deben adaptarse a cada individuo, basándose en la identificación

de esos modos de fallo. Los procesos de tratamiento están empezando a

adaptarse precisamente de esa manera.

La adicción es el trastorno clásico de la toma de decisiones: un adicto continúa tomando drogas incluso ante
consecuencias negativas masivas y, a veces, incluso en el caso de un deseo declarado de dejarlas.
1
¿Cómo puede un adicto manifestar que quiere dejar de tomar drogas y, sin embargo,
seguir tomándolas? Como hemos visto, la toma de decisiones humana surge de una compleja interacción de
componentes. Lo que veremos en este capítulo es que este complejo conjunto de sistemas de toma de decisiones
que interactúan entre sí, esta maquinaria de toma de decisiones, puede fallar de muchas maneras diferentes. Si
bien cada una de estas diferentes vulnerabilidades puede producir diferencias sutiles en la forma en que actúa el
adicto ( ¿el adicto anhela la droga antes de tomarla? ¿El adicto toma sólo una droga o cualquier droga es suficiente?
¿El adicto busca el placer o evita la disforia? ), todas se reducen al mismo problema: el adicto continúa con la
conducta, aunque debería dejarla.

¿Qué es la adicción?

La mayoría de las definiciones modernas de adicción se basan en el concepto de decisiones desadaptativas:

seguir tomando drogas incluso ante consecuencias negativas graves, ya sean enfermedades, disforia o efectos
negativos a largo plazo, como la pérdida de amigos, familia, trabajo, etc. ¿Decimos que todos somos adictos a
2
respirar? Si Pero este concepto puede llevarse a extremos ridículos: ¿realmente queremos...
nos quitan el oxígeno, morimos; es difícil

171
Machine Translated by Google

172 El cerebro con mente propia

Imaginemos una consecuencia más negativa que esa. Más problemático aún es el caso de muchos casos en los
que celebramos la decisión de un individuo que tuvo consecuencias negativas graves, como un soldado que
defendió a su país o un bombero que arriesgó su vida en un edificio en llamas. Celebramos a Martin Luther King,
que luchó por los derechos civiles sabiendo perfectamente que era probable que acabara con su muerte. Sin
embargo, a veces esta visión conduce a perspectivas interesantes. El poeta ruso Osip Mandelstam siguió
escribiendo poesía incluso después de que lo enviaran al gulag soviético por ello.
3 El futuro mariscal de campo del

Salón de la Fama, Brett Favre, continuó jugando al fútbol mucho después de que muchos sugirieran que parara,
a pesar de las graves lesiones y un cuerpo envejecido que era mucho menos resistente al castigo de lo que
había sido. 4 ¿Deberíamos decir que Mandelstam era adicto a escribir poesía o que Favre era adicto al fútbol?

Otras definiciones de adicción se han basado en la presencia de una desconexión5 ( “Quiero dejar de
Entre los deseos declarados y las acciones hacerlo, pero no puedo”). Por supuesto, esta definición implica que

los animales (que no pueden expresar tal deseo incluso si lo sienten) no pueden ser definidos como adictos.
Dado que los animales se autoadministran de manera confiable las mismas sustancias farmacológicas que los
ante las consecuencias negativas, esta definición parece problemática. Otro problema con humanos, incluso
la definición de adicción como una desconexión verbal es que muchos de nosotros conocemos adictos que no
expresan un deseo de dejar su adicción, que se niegan a admitir su “problema”. Muchas camarillas de la escuela
secundaria han tenido que intervenir por un amigo con un problema de drogas o alcohol, y hay muchas personas
vivas hoy en día porque sus amigos intervinieron con esa misma intervención.

Algunos economistas han sugerido que la adicción se debe definir por la elasticidad de la decisión. Como
se analizó en el Capítulo 3, la elasticidad se define por cuánto cambia la decisión de comprar algo en respuesta
a los cambios en el precio. A medida que la economía empeora, la gente tiende a ir al cine o a cenar con menos
frecuencia. Estos artículos de lujo son muy elásticos. Por otro lado, la gente sigue comprando alimentos, incluso
a precios altos, por lo que las compras de alimentos son muy inelásticas. La adicción puede definirse entonces
como una inelasticidad “irracional”.
7
Como se señala en el Capítulo 3, esto permite a los economistas decir que los estadounidenses
“Adicto al petróleo” 8 seguimos utilizándolo y usándolo imprudentemente (conduciendo automóviles individuales

en lugar de tomar el transporte público más eficiente; dependiendo de él para la electricidad y la calefacción en
lugar de usar sistemas que no utilicen combustibles fósiles o tomándonos el tiempo para asegurar que nuestras
casas sean energéticamente eficientes), incluso frente a graves consecuencias negativas (grandes derrames de
petróleo, precios altos y guerras innecesarias).
A como el
Es importante señalar que las drogas (como el petróleo) son, de hecho, objetos económicos; el
precio de las drogas aumenta, su uso disminuye, incluso entre los adictos más dedicados y fisiológicamente
dependientes. 10 El número de personas que dejan de fumar, por ejemplo, es directamente proporcional al costo
de los cigarrillos. De manera similar, los estudios sobre los cambios en los precios de la heroína o la cocaína
(recordemos que el mercado negro sigue siendo un mercado) concluyen que los aumentos en los precios
conducen a cambios directos en el número de usuarios y la cantidad de uso. Esta elasticidad es la razón por la
que una de las mejores maneras de disminuir el uso de drogas legales (nicotina, alcohol y, en el futuro cercano,
marihuana) es tener “impuestos al pecado”, que aumentan el precio de la droga.
Esta elasticidad es también uno de los mejores argumentos contra la legalización de drogas más duras
(heroína, cocaína, metanfetamina). El argumento a favor o en contra de la legalización es

A El término técnico es “bien económico” 9 porque uno compra “bienes y servicios”, pero eso llevaría
a la desafortunada frase “Las drogas son, de hecho, un bien económico…”
Machine Translated by Google

Adicción 173

Es muy complicado. Por un lado, las consecuencias negativas de ser descubierto con drogas son un costo
que disminuye el consumo. Por ejemplo, los estudios sobre la cantidad de opio consumido en Taiwán durante
las medidas represivas chinas en la década de 1920 encuentran una relación elástica directa. Por otro lado,
11
entre la severidad del castigo y el uso inicial. encarcelar a los usuarios puede interferir
con el tratamiento porque puede reducir las opciones positivas y las interacciones positivas que a menudo
12
están estrechamente relacionadas con la recuperación. El encarcelamiento sin tratamiento
puede hacer que los usuarios que aún no han cometido actos delictivos violentos se vean envueltos en
delincuentes peligrosos que, de hecho, son un peligro para la sociedad. El otro problema de la criminalización
del consumo de drogas es que traslada las drogas del mercado abierto al mercado delictivo y tiende a
conducir a interacciones comerciales violentas, que tienen fuertes consecuencias negativas para los
transeúntes que no están realmente involucrados en el mercado delictivo. 13 (Véase Prohibición, Estados
Unidos, 19201933; Colombia y el Cártel de Medellín, 19761993; y Violencia de pandillas y drogas en algunas
ciudades estadounidenses en la actualidad).
En parte debido a esta complejidad de definir la adicción (y en un intento de eliminar el estigma que se
había asociado a la palabra “adicto”), los psiquiatras en el DSMIV y el ICD10 (libros publicados regularmente
que detallan las definiciones actualmente acordadas en psiquiatría) abandonaron la palabra “adicción” y se
refirieron a los consumidores de drogas como “dependientes” y al uso excesivo de drogas como “dependencia”.
14
Creo que esta definición enfatiza demasiado los efectos
farmacológicos de los medicamentos más que las interacciones con la toma de decisiones.
También dificulta la formulación de preguntas sobre la “adicción” a sustancias no farmacológicas. Seguiré
utilizando los términos “adicto” y “adicción” para referirme a las personas que toman estas decisiones
desadaptativas de seguir consumiendo drogas, aunque reconozco que la cuestión de cuándo uno es adicto
es más una cuestión de política que científica.
La pregunta científica es ¿por qué la persona sigue tomando ese medicamento? ¿Cómo podemos cambiarlo?
Si queremos intervenir y hasta qué punto debemos estar dispuestos a intervenir es una cuestión personal
para las personas afectadas y sus familiares y una cuestión política para la sociedad.

La adicción como fallo en la toma de decisiones

Si observamos el sistema de toma de decisiones que hemos explorado hasta ahora en este libro, lo que
tenemos es una maquinaria de toma de decisiones. Como cualquier máquina, hay múltiples lugares donde
puede fallar. Si observamos el sistema en detalle, hay varias docenas de formas diferentes en las que esta
maquinaria puede tomar la decisión equivocada 15 —el sistema pavloviano puede asignar una mayor
motivación emocional a una droga, 16 el sistema deliberativo puede juzgar mal los resultados esperados de
sobrevalorar 18 , el sistema de una elección, 17 el sistema procedimental (hábito) puede o auto

demasiado rápido, reconocimiento de situaciones puede separar en exceso o generalizar en exceso

20etc.Cada uno de estos diferentes modos de falla o vulnerabilidades podría tener
situaciones, un
efecto de impulsar al adicto a continuar haciendo la elección adictiva. 21 Las diferencias

entre estos modos de falla o vulnerabilidades implican diferencias en cómo el adicto toma esas decisiones, y
cada una probablemente requerirá tratamientos diferentes.
No pretendo sugerir que la conducta de cada adicto se deba a un solo modo de fallo en su sistema de
toma de decisiones. La biología tiende a tener muchos mecanismos de respaldo. Bien puede ser que la
adicción en toda regla surja solo cuando fallan varios sistemas. Las drogas en sí mismas también tienden a
crear modos de fallo adicionales. Por ejemplo, un
Machine Translated by Google

174 El cerebro con mente propia

El efecto masivamente placentero (el subidón de la cocaína 22 ) conduce a una mayor motivación
para la cocaína (un "deseo"de ella 23 ), así como a la tolerancia (requerir más cocaína para producirla
24 ), y a una mayor probabilidad de realizar acciones que conduzcan a la cocaína (el subidón
procedimental 25 ). El26
decisiones irreflexiva alcohol conduce a
), la tolerancia (louna
quereducción de la ansiedad (lo que impulsa la toma de
requiere cada vez más alcohol para producir el mismo efecto 27 ), y reducciones en la eficacia del
autocontrol y los sistemas deliberativos. la adicción. Por otro lado, a veces se puede encontrar una
28
clave que permita al Abordar sólo una vulnerabilidad puede no ser suficiente para detener
paciente encontrar otro camino para prevenir la recaída.
29

Para entender el concepto de un modo de fallo o una vulnerabilidad en el sistema , el ejemplo

más simple es observar los agonistas opiáceos. Como vimos, hay buena evidencia de que la
euforia (placer) y la disforia (displacer) se instancian en el cerebro por el flujo de opioides endógenos
(endorfinas y dinorfinas, véase el Capítulo 4). Esto significa que la sensación de placer es el flujo
de endorfinas hacia los receptores μopioides. (Esto es una consecuencia directa del rechazo de la
dualidad mente/cerebro que hemos estado discutiendo en los últimos capítulos.) Así como estimular
30
los nervios auditivos produce sonidos auditivos, y las ondas de actividad aleatoria a través de la
31
corteza visual producen imágenes, cambiar el flujo de endorfinas hacia los receptores μopioides
cambia las señales de euforia. Esto significa que una sustancia química farmacológica que engañó
a los receptores μopioides para que pensaran que habían visto endorfinas se experimentaría como
placer eufórico. ¿Cuáles son algunas sustancias químicas que activan los receptores μopioides?
Son las que nos dieron las palabras opioides
y opiáceos , derivados de la adormidera (incluidos pilares de la adicción como la morfina y la heroína).
32
Los investigadores de la adicción suelen hablar de que la droga “secuestra” el sistema neuronal,
pero creo que lo que ocurre es algo más sutil. Estamos adoptando la perspectiva de un ingeniero
sobre el cerebro: existe un sistema físico y ese sistema físico tiene formas de descomponerse.
Desarrollamos una maquinaria que incluye un componente de “placer” como parte de cómo procesa
las decisiones (Capítulo 4). Este componente de placer se comunica mediante una vía química.
Una sustancia farmacológica extraña está modificando esa vía química. Esto nos lleva de nuevo a la
perspectiva de “Charla en el coche” con la que comenzamos en el Capítulo 2. Para volver a nuestro
ejemplo original al principio del libro, al igual que el termostato de su casa reaccionaría incorrectamente
si usted colocara una cerilla debajo de él (pensaría que la casa está más caliente de lo que está), su
termostato también reaccionaría incorrectamente si usted pasara una corriente por el cable que le
indica “Estoy caliente” al termostato. La heroína está modificando ese cable interno.
Cuando Steve Jensen, Adam Johnson y yo analizamos la maquinaria de toma de decisiones,
33
De esta manera, en encontramos muchos ejemplos de este tipo de puntos vulnerables.
2008, la maquinaria; de hecho, la mayoría de esos puntos de falla ya habían sido encontrados por
otros investigadores. Muchos investigadores habían propuesto teorías sobre por qué los adictos
continúan tomando sus drogas (por ejemplo, que su sistema se desequilibra y necesitan las drogas
para volver al equilibrio; 34 que buscan propiedades eufóricas; 35 que aprenden a sobrevalorar las
drogas; 36 que las drogas se convierten en reforzadores secundarios y desvían la atención de otras
cosas; 37 que las drogas cambian el equilibrio entre los sistemas deliberativos y de hábito; 38 etc.).
Lo que encontramos es que todas estas teorías se enunciaban en la forma de "si tienes este
problema, podrías ser un adicto". Lo interesante fue que estas teorías fueron generalmente atacadas
por un investigador que encontró un adicto sin ese problema. Lógicamente, lo que las teorías
estaban diciendo era que un problema dado
Machine Translated by Google

Adicción 175

conduciría a la adicción, no que todos los adictos tuvieran un problema determinado. Vista de esta
manera, la adicción es un síntoma que puede surgir de múltiples “enfermedades” subyacentes.
Nuestra hipótesis de vulnerabilidades múltiples decía que todos tenían razón: todos estos problemas
podían conducir a la adicción, porque todos estos problemas eran modos de falla potenciales del
sistema de toma de decisiones. La figura 18.1 muestra una lista de algunos de los modos de falla
conocidos actualmente de la maquinaria de toma de decisiones.
Es importante señalar que la adicción, por definición, es una interacción entre la naturaleza y la
crianza. Si uno nunca toma cocaína, nunca se vuelve adicto a ella y la cocaína nunca se apodera de
su vida. De manera similar, hay muchas reacciones diferentes al tomar cocaína y hay muchas
39
reacciones diferentes al fumar cigarrillos. Algunas personas
siguen siendo capaces de controlar su consumo, mientras que otras lo pierden después de una
experiencia con ella, y otras lo pierden sólo después de una experiencia prolongada. Todavía no
sabemos si esto es una función de las situaciones en las que se encuentran estos usuarios, o una
función de la formulación específica de la droga en sí, o de la genética del usuario, o de los
antecedentes y experiencias de vida del usuario. (Lo más probable es que sea una combinación
compleja de todo esto.) Lo que sí sabemos es que la adicción a las drogas se presenta de muchas
formas diferentes, incluso entre la población de personas que no pueden controlar su consumo de drogas.

Anhelo: La diferencia entre deseo, abstinencia y hábito

Un ejemplo de esta diferencia es la disociación clínica, ahora clara, entre el deseo y la recaída.
40
Durante años, los médicos y los científicos investigadores han estudiado el ansia en
los adictos como un sustituto de la medición de lo que es realmente importante: la recaída. En gran
parte, lo hacen porque el ansia es algo que se puede estudiar en el laboratorio, en términos de un
paradigma experimental controlado. Por ejemplo, en el ansia inducida por señales, se muestran
imágenes de parafernalia de drogas a drogadictos confesos y a no adictos, y los adictos muestran
más signos de ansia (estrés, sudores, comportamientos nerviosos) y califican su sensación de ansia
más alta en escalas de encuesta. 41 Sin embargo, se sabe desde hace décadas que el ansia no
implica recaída. Si bien el ansia y la recaída están relacionados (las personas que muestran mucho
ansia tienen más probabilidades de recaer, y las personas que recaen tienen más probabilidades de
mostrar ansia), no siempre ocurren simultáneamente. El problema es que, mientras que el ansia es
un fenómeno momentáneo, la recaída es un acontecimiento de largo plazo que sólo ocurre (como
diría un etólogo) “sobre el terreno”. Antes de poder medir esto, tenemos que abordar qué es el ansia,
desde el punto de vista neurobiológico.
El anhelo es el deseo inexorable de algo; todos lo hemos sentido en algún momento u otro.
Como decían los Rolling Stones: “No siempre puedes conseguir lo que quieres, pero a veces
consigues lo que necesitas”. 42 El mecanismo del ansia ha sido estudiado extensamente, en
particular en términos de cómo se les recuerda a los drogadictos su adicción, por ejemplo,
mostrándoles imágenes de parafernalia relacionada con las drogas. Pero el ansia no es algo tan
simple. Por ejemplo, resulta ser disociable de la recaída en la adicción a las drogas. Aunque alguien
pueda anhelar un cigarrillo o una dosis de droga, es posible resistir ese ansia y no recaer en la
adicción. Otras personas pueden tomar la acción de consumir drogas sin ansiarla nunca.
Como le dijo un paciente con problemas de adicción al juego a un colega mío: “No sé qué pasó.
Simplemente me encontré en el casino”. (¿Estaban mintiendo? ¿Se estaban mintiendo a sí
mismos?) Como hemos visto, existen múltiples sistemas de toma de decisiones que impulsan nuestras acciones
Machine Translated by Google

176 El cerebro con mente propia

Punto de falla sistemas clave consecuencia clínica

Alejándose de la homeostasis motivación retiro

(Koob y Le Moal, 2006; Koob y Volkow, 2010)

Cambio de los puntos de ajuste alostáticos motivación necesidades fisiológicas, ansia

(Koob y Le Moal, 2006; Koob y Volkow, 2010)
Sensibilización de la motivación motivación Selección de acción incorrecta, ansia
(Robinson y Berridge, 2001, 2003)
Las asociaciones señalresultado provocan emociones y Selección de acción incorrecta, ansia
acciones viscerales precableadas motivación
(Damasio, 1994; Bechara y Damasio, 2002; Bechara, 2005)

Escapar de las emociones negativas emoción selección de acción incorrecta

(Koob, 2009)

Imitando recompensa múltiple Selección de acción incorrecta, ansia

sistemas
(Volkow et al., 2002; Wise, 2005)

Errores en los resultados esperados deliberación selección de acción incorrecta

(Goldman et al., 1999; Jones et al., 2001; Redish y Johnson, 2007)

Mayor probabilidad de deliberación obsesión

recuperando un esperado específico

camino acciónresultado
(Redish y Johnson, 2007)

Sobrevaloración de lo esperado deliberativo selección de acción incorrecta

resultados
(Redish y otros, 2008)
Sobrevaloración de lo aprendido hábito Uso automatizado y robótico de drogas
comportamiento

(Di Chiara, 1999; Redish, 2004)

Errores de tiempo hábito preferencias por eventos impredecibles

(Ross, 2008)

Procesos de descuento demasiado rápidos deliberativo, impulsividad

hábito
(Bickel y Marsch, 2001; Bickel y Mueller, 2009)

Los cambios en las tasas de aprendizaje son deliberativos, Exceso de asociaciones de señales relacionadas con las drogas

hábito

(Franken et al., 2005; Gutkin et al., 2006; Piray et al., 2010; Redish et al., 2008)
Inhibición selectiva de la selección Desarrollo rápido del aprendizaje de hábitos.
sistema deliberativo del sistema

(Bernheim y Rangel, 2004; Bechara, 2005; Bickel y Yi, 2008; Baumeister y Tierney, 2011; Bickel et al., 2012)
Excitación selectiva de la sistema Desarrollo rápido del aprendizaje de hábitos.
sistema de hábitos selección
(Everitt y Robbins, 2005; Bickel y Yi, 2008)
Clasificación errónea de situaciones: situación ilusión de control, sesgo de retrospección
sobrecategorización reconocimiento
(Redish y otros, 2007)
Clasificación errónea de situaciones: situación Perseverancia ante las pérdidas
generalización excesiva reconocimiento
(Redish y otros, 2007)

Figura 18.1 Algunos modos de fallo del sistema de toma de decisiones que pueden llevar a
la adicción. Evidentemente incompleta.
Machine Translated by Google

Adicción 177

Sólo algunos de ellos son conscientes. Es probable que si una persona recayera a través del
sistema procedimental (capítulo 10), esta recaída no implicaría ningún deseo previo (o tal vez ni
siquiera ningún reconocimiento previo). Es posible que simplemente se encontrara "en el casino".

43
Un aspecto importante del anhelo es que anhelamos cosas . No anhelamos simplemente el placer; no

anhelamos simplemente. La palabra ansia es transitiva; debe incluir un objeto.

Anhelamos sexo, anhelamos un cigarrillo, anhelamos una bebida. Tal vez incluso podamos anhelar el amor.

Pero incluso entonces, lo que anhelamos es una sensación, un momento, una cena romántica, un paseo por la playa. Si bien

ese anhelo puede satisfacerse con algo diferente de su objetivo original, no hay duda de que el anhelo incluye un objetivo o

meta identificable.

Cuando alguien anhela algo, se producen efectos extensos en el propio cuerpo. 44 Parte del anhelo es que
aumenta la excitación: el corazón late más rápido y más fuerte, la atención aumenta, uno se pone nervioso.
Estas son acciones pavlovianas que vimos en el capítulo 8: acciones no entrenadas que ocurren en respuesta
a la entrega del objeto deseado y que ahora ocurren en respuesta a la entrega de la expectativa de ese
objeto.
Algunas personas han identificado explícitamente el ansia con el sistema pavloviano: algo nos recuerda la existencia de

un resultado (a través de una asociación estímuloresultado) y recordamos que el resultado era muy deseable. 45 Tal como lo

discutimos cuando presentamos los sistemas de toma de decisiones múltiples (Capítulo 6), el entrenamiento pavloviano tiene

efectos de selección de acción (Capítulo 8) y efectos motivacionales (Capítulo 13). No está claro en este momento si los

efectos motivacionales del ansia son idénticos a los cambios fisiológicos del ansia o si simplemente tienden a ocurrir

simultáneamente.
46

Otras personas han identificado el anhelo con el sistema Deliberativo, en el sentido de que un
47
El sistema deliberativo implica la búsqueda de un resultado y la búsqueda de caminos que permitan alcanzarlo.

Esto significa que parte del sistema deliberativo debe mantener una representación del objetivo para que pueda ser reconocido

cuando uno lo encuentra. Los primeros estudios sobre el ansia descubrieron que el ansia no tiende a ocurrir por objetivos

fáciles de alcanzar; en cambio, tiende a ocurrir por objetivos bloqueados. Consideremos a un alcohólico que va al bar todos

los días a una hora determinada y no muestra ansia hasta que un día llega y encuentra el bar cerrado. Entonces el ansia 48

Este camino bloqueado obliga al alcohólico a pasar de un sistema de toma de decisiones bien entrenado, regular y basado en
se pone en marcha.
hábitos (procedimental) a un sistema de planificación más flexible y consciente (deliberativo).

Cuando analizamos el sistema de motivación (Capítulo 13), hablamos de un fenómeno particular llamado transferencia

pavloviana a instrumental (PIT), en el que las asociaciones pavlovianas nos recordaban un resultado, lo que conducía a un
aumento de las acciones adoptadas para alcanzar una meta específica. Esto sugiere que el ansia puede ser una interacción

entre los sistemas motivacional y deliberativo. Los experimentos dirigidos directamente a la PIT sugieren un papel importante

para la capa del núcleo accumbens, que está fuertemente implicada en el ansia. La relación entre la PIT y el ansia implicaría
50 Una rela
que el ansia es una interacción entre la motivación pavloviana (Capítulo 13) y los componentes de toma de

decisiones deliberativo (Capítulo 9).

Es importante disociar el ansia de los sentimientos negativos asociados con dejar de tomar drogas. Como le dijo un

paciente a Anna Rose Childress y sus colegas: “No, doctor, el ansia es cuando lo deseas, lo deseas tanto que casi puedes

saborearlo... pero no estás enfermo... enfermo es, bueno, enfermo”. 51 Dejar de tomar drogas produce síntomas de abstinencia

dramáticos, tanto físicos como mentales. Los síntomas de abstinencia físicos aparecen porque el
Machine Translated by Google

178 El cerebro con mente propia

Las drogas afectan a más que solo el sistema nervioso central. Los sistemas biológicos son
fundamentalmente sistemas químicos, y la química de la droga va a tener efectos profundos en el cuerpo.
Por supuesto, uno de los puntos de este libro es que los cambios mentales también son físicos, y esos
cambios químicos van a tener efectos profundos tanto en el cerebro como en la mente.

En general, los síntomas de abstinencia se deben a cambios homeostáticos. El término “homeostasis”

significa mantenimiento de algo en un nivel determinado, de las palabras griegas ομοιο ( homeo , que
significa “igual”) y στάσις ( stasis , que significa “quedarse quieto”). Gran parte de la biología trata sobre
el mantenimiento del sistema en algún punto que permitirá la supervivencia continua. 52
Estos niveles homeostáticos están relacionados con los objetivos intrínsecos analizados en el Capítulo
13: cuando necesitas comida, tienes hambre; cuando tienes demasiado frío, quieres calentarte.
El caso clásico de homeostasis es la temperatura corporal. Al igual que el termostato que vimos al
principio del libro, el cuerpo contiene sensores de temperatura (en el caso biológico, neuronas que se
proyectan a un pequeño núcleo de células en el hipotálamo). Si estos sensores determinan que el cuerpo
está demasiado caliente, se inician procesos para enfriarlo: los capilares cerca de la superficie de la piel
se abren más para proporcionar un mayor flujo de sangre a la piel, lo que permite una transferencia más
rápida de calor desde el núcleo interno a la superficie; los poros se abren, produciendo sudor,
proporcionando enfriamiento por evaporación. En casos extremos, los humanos incluso abren la boca y
jadean. De manera similar, si estos sensores determinan que el cuerpo está demasiado frío, se inician
procesos opuestos para calentar el cuerpo, contrayendo los capilares, tirando más de la piel (produciendo
53
piel de gallina), ejercitando los músculos, etc.
En la actualidad, sin embargo, varios científicos han recomendado reemplazar el término por
“alostasis”, de la palabra griega αλλ ο (“alo”, que significa “otro”). 54 En parte, esta redefinición se debe
a la implicación de que en la homeostasis uno mantiene el parámetro en un solo objetivo, mientras que,
en realidad, el objetivo cambia con las necesidades de uno. (Solíamos escuchar que la temperatura
corporal humana normal es de 98,6 grados Fahrenheit, pero la temperatura corporal en realidad cambia
a lo largo del día y, por supuesto, cambia en la fiebre. 55 ) Además, los sistemas biológicos aprenden a
planificar: si estás en un mundo donde la comida es escasa, es mejor comer en exceso cuando hay
comida disponible que comer solo hasta estar lleno, porque no sabes si te morirás de hambre más tarde.
56 Parte del papel del sistema de motivación pavloviano (Capítulo 13) es guiar ese plan.

¿Y qué tiene que ver esto con los síntomas de abstinencia? La clave es que los sistemas
homeostáticos reaccionan lentamente. Imaginemos que nuestro cuerpo está intentando mantener un
determinado flujo de oxígeno a través del torrente sanguíneo. Si nos mudamos a una gran altitud (por
ejemplo, a Katmandú, en el Himalaya nepalí), para que los tejidos reciban suficiente oxígeno, el cuerpo
debe dedicar más recursos a la hemoglobina y a la transferencia de oxígeno. Esto sucede en el transcurso
de días o más. De manera similar, si luego volvemos a una altitud menor, el flujo de oxígeno adicional se
mantiene durante un par de semanas mientras nuestro sistema se reajusta. Los atletas que requieren un
alto flujo de oxígeno (como los corredores olímpicos de larga distancia) a menudo viven o entrenan a
grandes altitudes para que su cuerpo se adapte y sea mejor en la entrega de oxígeno a sus tejidos
cuando corren la carrera real (aunque la eficacia de esto todavía es controvertida). 57
Un fumador de cigarrillos ha estado inundando sus tejidos con nicotina, que es un análogo de una
sustancia química cerebral muy común llamada acetilcolina. 58 La música que estoy

escuchando ahora mismo en mi computadora tiene tres perillas de volumen en secuencia. El reproductor
multimedia tiene un control de volumen, que cambia el volumen de la música que se envía a la
computadora, que tiene un control de volumen del sistema, que cambia el volumen de la música que se envía a los pa
Machine Translated by Google

Adicción 179

que tienen su propio volumen. Si el volumen del reproductor multimedia aumenta, puedo obtener el mismo
nivel de música bajando el volumen de los altavoces (que es más fácil de alcanzar que el volumen del
sistema interno). Pero si el volumen del reproductor multimedia disminuye de repente, la música sonará
demasiado baja. , y no podré escucharlo.
En respuesta a la inundación química de nicotina, el cerebro ha aprendido a bajar el volumen de los
receptores de acetilcolina. Por eso, cuando una persona deja de fumar, el cuerpo y el cerebro reaccionan
como si no estuvieran recibiendo suficiente acetilcolina, porque el ex fumador no está recibiendo suficiente
acetilcolina, porque el volumen de los receptores de acetilcolina se ha reducido demasiado. Estos cambios
ocurren en todo el cerebro y los sistemas periféricos. Los síntomas de abstinencia suelen aparecer durante
un tiempo después de dejar de consumir la droga (días, semanas, meses). Estos síntomas de abstinencia
se deben a que el ajuste del cuerpo no está alineado con las expectativas de la droga.
59 Por supuesto, como hemos comentado
anteriormente, es posible cambiar el objetivo homeostático (alostático) del cuerpo en función de señales y situaciones.
Esto significa que las señales pueden recordarle al adicto una expectativa de la droga, lo que lleva a un cambio
60
en el objetivo alostático, lo que lleva a lo que efectivamente son síntomas de abstinencia inducidos por señales.
61
Pero el ansia también puede ocurrir en ausencia de síntomas de abstinencia explícitos. El antojo
es un proceso mental que se debe a cambios más permanentes en los sistemas de aprendizaje y memoria
y puede surgir mucho después de que hayan desaparecido los síntomas de abstinencia. Aunque el antojo
se produce a través de un proceso físico (todo en el cerebro es un proceso físico), comprender qué es el
antojo físicamente ha sido mucho más difícil de alcanzar y probablemente dependerá de comprender cómo
interactúa el antojo con los múltiples sistemas de toma de decisiones.
El experimento clave sería medir el ansia de forma continua a lo largo de la vida de las personas y luego
comparar a quienes informan niveles altos de ansia con quienes no, y comparar a quienes recayeron con
quienes no. Por supuesto, se trata de un experimento muy difícil de realizar. Se han hecho algunos intentos
utilizando teléfonos móviles y PDA para pedir a las personas que informen sobre el ansia a intervalos
regulares. 62 Estos experimentos generalmente encuentran que el ansia a menudo ocurre antes de la
recaída, pero que a veces el ansia ocurre sin recaída y a veces la recaída ocurre sin ansia. Muchos lectores
pueden estar preguntándose por qué no utilizamos experimentos retrospectivos que encuentren a personas
que recayeron y les pregunten si mostraron ansia de antemano. El problema vuelve a la reconstrucción de
la memoria que vimos en los últimos capítulos. En realidad, no recordamos los episodios de nuestro
pasado; En lugar de eso, los reconstruimos a partir de nuestros recuerdos de lo que fue, lo que debería
haber sido y lo que probablemente sucedió. De hecho, experimentos cuidadosos han descubierto que las
personas que recaen sin ansias a menudo recuerdan (incorrectamente) que mostraron ansias antes de la
recaída.
63

64
El ansia puede ocurrir en un intento por aliviar los síntomas de abstinencia. El ansia puede
ocurrir porque el sistema emocional (pavloviano, capítulo 8) espera una recompensa fuerte (o necesita
evitar un castigo fuerte), 65 o porque el sistema de planificación (deliberativo, capítulo 9) reconoce un
camino hacia una recompensa fuerte. 66 Todavía no se sabe si estos diferentes impulsos serán disociables
experimentalmente o no, pero todos implican mecanismos por los cuales una persona expresaría un fuerte
deseo por la droga.
Curiosamente, estos tres mecanismos pueden provocar ansia, pero no necesariamente conducen a
una recaída. La separación entre ansia y recaída nos lleva de nuevo a los múltiples sistemas de toma de
decisiones que hemos visto a lo largo de este libro. La ansia es una función de la expectativa del resultado;
no puedes ansiar algo que no sabes que vas a conseguir. Esto significa que la ansia no se producirá cuando
las acciones sean seleccionadas por
Machine Translated by Google

180 El cerebro con mente propia

El sistema procedimental (capítulo 10), que no incluye una representación del resultado. Dado que el
sistema deliberativo implica el reconocimiento de un camino hacia una meta, pero conocer ese camino
no significa que uno lo tome (recuerde, el sistema deliberativo es flexible), uno puede tener ansia sin
recaer. Dado que tanto los reflejos como el sistema pavloviano pueden ser anulados por los sistemas
de autocontrol (capítulo 15), tampoco conducen necesariamente a una recaída. Si bien el ansia y la
recaída están relacionados, no son idénticos.

Caminos para salir del consumo de drogas

Aunque a los consumidores de drogas, a los científicos y a la sociedad les encantaría tener una única
bala mágica que “curara” a un consumidor de drogas de su predilección por las drogas, la teoría de
las múltiples vulnerabilidades de la adicción a las drogas sugiere que no va a haber un único camino
para salir de la adicción. 67 Dicho esto, la práctica actual es probar múltiples opciones, y algún
subconjunto de estas opciones a menudo funciona para individuos específicos. 68 Mi sospecha es
que debemos ver la adicción a las drogas no como el problema en sí mismo, sino más bien como un
B
síntoma de un problema subyacente o un conjunto de problemas.
Aunque este libro no es explícitamente un libro de autoayuda, y no voy a intentar decirle a un
consumidor de drogas cómo escapar de su situación, la historia de toma de decisiones múltiples que
hemos estado contando a lo largo de este libro tiene algunas implicaciones interesantes para identificar
posibles caminos para salir del ciclo de consumo de drogas.
La implicación de la visión de este ingeniero sobre la adicción y el concepto de que existen
múltiples sistemas de toma de decisiones con múltiples vulnerabilidades proporcionan dos perspectivas
importantes sobre el tratamiento que pueden abordarse. En primer lugar, el efecto de los tratamientos
debería ser el de normalizar las vulnerabilidades. Debería ser posible predecir el éxito del tratamiento
a partir de la identificación de los resultados de los intentos de tratamiento exitosos y fallidos. En
segundo lugar, es probable que diferentes vulnerabilidades requieran diferentes tratamientos. Si
pudiéramos identificar de qué vulnerabilidades ha sido víctima un adicto, podríamos proporcionar el
tratamiento adecuado para esas vulnerabilidades. 73

B Esta visión, de que las categorizaciones psiquiátricas (dependencia de drogas, esquizofrenia, depresión, etc.) son
en realidad categorías de síntomas más que reflejos de una enfermedad subyacente, está relacionada con el concepto
de endofenotipos . El término “endofenotipo” proviene de la idea de que diferentes genes pueden tener los mismos
efectos (fenotipos), pero el concepto aquí va más allá de simples declaraciones de variación genética.
69
El concepto es más cercano al de constructos hipotéticos o procesos transenfermedad . Construcciones hipotéticas
son variables intervinientes que permiten buscar conceptos subyacentes en la actividad neuronal (como el sub 70 que
que producen discutimos en el Capítulo 3), mientras que los procesos transenfermedad son vulnerabilidades tratables
71
diferentes disfunciones en diferentes contextos (como la impulsividad, Capítulo 5).
Es cierto que las categorías psiquiátricas se han vuelto confiables en las últimas décadas, de modo que se pueden
aplicar de manera uniforme (por lo general, varios psiquiatras asignan las mismas categorías a las mismas personas).
Sin embargo, el éxito de los tratamientos ha quedado rezagado. Lamentablemente, la confiabilidad de las categorías no
implica necesariamente una validez mecanicista unificada.
72 Existe un movimiento actual denominado psiquiatría
computacional que intenta redefinir las enfermedades psiquiátricas en términos de sus mecanismos subyacentes,
conectando los síntomas psiquiátricos con la disfunción subyacente basándose en modelos computacionales de toma
de decisiones. Volveremos a este concepto en el Capítulo 21.
do
Como se indica en el prefacio, el tratamiento debe adaptarse a cada individuo. Por lo tanto, se debe comprobar
con sus propios profesionales médicos antes de embarcarse en cualquier régimen de tratamiento.
Machine Translated by Google

Adicción 181

Existen algunas evidencias que sugieren que estas perspectivas son correctas: los distintos adictos se
benefician más con distintos tratamientos. Por ejemplo, las medidas de impulsividad conductual predicen
el éxito en el abandono del hábito de fumar. Se pueden identificar estructuras neuronales y pruebas
cognitivas que predicen el éxito del resultado del tratamiento en la adicción a la cocaína. 74
Algunas vulnerabilidades serán fáciles de tratar. Un desequilibrio homeostático puede aliviarse
mediante la sustitución por alternativas menos nocivas, como la terapia de reemplazo de nicotina para el
tabaquismo o la terapia de reemplazo de metadona para la heroína. 75 Sin embargo, las tasas de recaída
a largo plazo después de dejar estos tratamientos son notoriamente 76 Esto es probablemente una
altas.
consecuencia del hecho de que estas terapias no abordan las otras vulnerabilidades de las que puede
haber sido víctima el adicto.
77

Por ejemplo, es importante no subestimar el componente negativo de la adicción a las drogas en la

emoción y el afecto. Debido a la forma en que los sistemas biológicos tienen recursos internos limitados
y a que las propiedades biológicas siempre están tratando de equilibrarse, a un estado de euforia biológica
le seguirá un bajón (disforia). 78
Si la euforia, por ejemplo, es la liberación de endorfinas en los receptores μopioides, entonces la heroína
que inunda el sistema producirá una reacción de sobrecompensación como un “zumbido” en un oscilador.
79
Estos efectos negativos pueden ocurrir incluso después de una sola dosis de morfina. Y,
como vimos anteriormente en nuestra discusión sobre los sistemas homeostáticos (alostáticos), estos
sistemas aprenderán a compensar esa sobreabundancia de señales, lo que lleva a una evaluación negativa
en contraste, cuando todo lo demás parece terrible. Esto se muestra claramente en las películas Sid y
Nancy y Trainspotting : los sentidos de los adictos se han vuelto tan embotados para todo que las drogas
son lo único que les queda que puede mantener su interés, incluso por un momento.
Encontrar actividades más sanas que puedan sustituir a las drogas o factores emocionales alternativos
que puedan captar los deseos de uno puede ser difícil, pero potencialmente útil. A veces, la clave es
80
reconocer lo mal que uno se encuentra y que existen alternativas.
Algunos usuarios han podido superar su adicción prestando atención a alternativas concretas,
ya sean sociales (como asistir a interacciones sociales regulares en las que se lo elogia por
rechazar la adicción) o físicas (como ganar dinero o puntos para un nuevo televisor). 81 Ahora hay
buena evidencia de que es más fácil apuntar a objetivos concretos que a los abstractos y que los
objetivos concretos atraen más la atención.
82 Cuando esos objetivos concretos son cosas que están disponibles de inmediato
y que uno quiere rechazar, son más difíciles de rechazar. Cuando esos objetivos concretos son metas
positivas para el futuro, son más fáciles de alcanzar y de asignar valor (lo que hace que sean más fáciles
de usar como alternativas). Conozco a una persona que rompió su adicción al tabaco metiendo el dinero
que solía gastar en cigarrillos en un frasco todos los días. Era un fanático del jazz y se puso como meta
comprarse un saxofón nuevo. Cuando acumuló suficiente dinero en el frasco, dejó su hábito de fumar y lo
celebró comprándose el saxofón.
Algunas vulnerabilidades pueden ser excepcionalmente difíciles de tratar. Como vimos en el Capítulo
10, las decisiones de estímulorespuesta pueden tomarse sin atención consciente o pensamiento, y estos
hábitos pueden ser muy difíciles de romper. Examinamos una posible solución en el autocontrol, en el
sentido de que uno puede anular esas acciones con mecanismos de autocontrol cortical frontal (Capítulo
15). Sin embargo, esos mecanismos requieren atención constante y son muy cansadores. La distracción,
el agotamiento y el estrés pueden hacer que mantener el autocontrol sea muy difícil. 83 Otra alternativa es
identificar qué señales conducen a la recaída y evitarlas. Por ejemplo, un alcohólico podría conducir por
un camino diferente al volver a casa para evitar pasar por el bar donde suele parar a tomar una copa.
Machine Translated by Google

182 El cerebro con mente propia

84
Esto nos lleva al concepto de precompromiso y agrupamiento . Imaginemos a un alcohólico
que sabe que beberá si va a una fiesta esa noche, pero que preferiría permanecer sobrio si se lo pidieran a la luz del
día. Este alcohólico es, en cierto sentido, dos personas: a la luz del día, sobrio y cuerdo, y en el contexto pavloviano
de la fiesta, un alcohólico salvaje. (Esta dicotomía de elección es, por supuesto, el tema central de El doctor Jekyll y
Mr. Hyde de Robert Louis Stevenson .) Estas dos personas separadas temporalmente están en conflicto entre sí. 85
Si la persona sobria y cuerdo a la luz del día (llamémosle el doctor Jekyll) desea permanecer sobrio durante la
noche, sólo tiene que evitar la fiesta. El problema es que por la noche, el doctor Jekyll habrá cambiado de opinión y
querrá ir a la fiesta. Una opción es encontrar una manera de comprometerse con la opción sin drogas durante la luz
del día (por ejemplo, haciendo otros planes para esa noche). Esto se llama precompromiso porque el Dr. Jekyll se
ha comprometido previamente con una opción, de modo que la opción posterior no está disponible.

El agrupamiento es un proceso similar a través del cual uno cambia el conjunto de opciones disponibles. Por
La solución consiste en repensar cuáles son los resultados potenciales.86 ejemplo, el concepto “no existe tal cosa
como una bebida para un alcohólico” implica que uno no tiene la opción de ir al bar y tomar “solo una bebida”. 87 En
cambio, las opciones son no beber y ser el aburrido Dr. Jekyll o beber y convertirse en el diablo Mr. Hyde. Ser el
genial Mr. Suave bebiendo una bebida y encantando a las mujeres no es una opción para nuestro protagonista, el
Dr. Jekyll. Reconocer que solo hay dos opciones (el aburrido Dr. Jekyll y el peligroso Mr. Hyde) lleva a nuestro
protagonista a un proceso de decisión muy diferente (entre las dos opciones de Jekyll y Hyde en lugar de entre las
tres opciones de Jekyll, Hyde y tratar de ser Mr. Suave). El agrupamiento y el compromiso previo son dos ejemplos
de formas en que cambiar la perspectiva de uno puede cambiar la toma de decisiones.

Una cuestión interesante es que muchos adictos a la D (aunque desafortunadamente no todos) envejecen .
88 Si esto se debe a cambios en la función cerebral con la edad (la adicción suele comenzar en
adolescencia, cuando las funciones de autocontrol prefrontal están deterioradas, o si se debe la
a cambios en la vida (como formar una familia), todavía no se sabe (y probablemente difiere de
persona a persona). Sin embargo, es interesante que los estudios de casos de adictos que
superan la edad suelen hablar de cambios en la perspectiva que conducen a un rechazo de las
opciones adictivas. 90
Existen demasiadas opciones de tratamiento disponibles y sus éxitos y fracasos son demasiado complejos para
enumerarlos aquí o para identificar cómo interactúa cada uno con los múltiples sistemas de toma de decisiones.
Como se señaló anteriormente, diferentes opciones de tratamiento parecen funcionar para diferentes pacientes.
Los tratamientos actuales sugieren que los pacientes sigan un diagrama de flujo de opciones:
si el paciente tiene problemas de impulsividad, esto se puede tratar con terapia de función ejecutiva (que disminuye
la impulsividad); si el paciente tiene un problema homeostático, esto se puede tratar con reemplazo farmacológico.
92 Otros problemas
requieren otros tratamientos.
Aunque existen algunos ejemplos en los que los tratamientos dirigidos a disfunciones específicas han tenido un
éxito evidente, todavía no se dispone93de un régimen de tratamiento que se adapte a cada vulnerabilidad. Cómo
identificar qué modo de falla está activo (o cuáles modos de falla están activos) en un adicto determinado y cómo
tratar esos modos de falla son un foco de investigación activa en todas las comunidades neurocientíficas y médicas
94
en la actualidad.

D
Algunos adictos mueren antes de tener la oportunidad de salir de la adicción y otros nunca la abandonan.
Machine Translated by Google

Adicción 183

Libros y artículos para lectura adicional • Gene

Heyman (2009). Addiction: A Disorder of Choice . Cambridge, MA: Harvard . • George F. Koob y
Michel Le Moal (2006). Neurobiology of Addiction . Amsterdam: Elsevier Academic Press . • A.
David Redish, Steve Jensen
y Adam Johnson (2008). A unifi ed framework for addictive: Vulnerabilities in the decision process .
Behavioral and Brain Sciences, 31 , incluyendo discusión (pp. 437–461) y respuesta del autor ,
415–487(pp. 461–470).
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Juego y adicciones conductuales

Conduciendo hacia la ciudad de las

ilusiones, los coches que van
delante desaparecen en el espejismo
del punto de perspectiva.
En el desierto resplandeciente, las
pirámides y las torres rasgan el cielo.

Desde la perspectiva de la adicción como toma de decisiones disfuncional, el

juego y otras conductas también pueden considerarse “adicciones”.
Estas adicciones no farmacológicas tienden a depender de las vulnerabilidades
de los sistemas de apoyo (por ejemplo, los sistemas motivacionales, los sistemas
de reconocimiento de situaciones) más que de los propios sistemas de selección
de acciones, pero también dependen, por supuesto, de cómo los sistemas de
selección de acciones utilizan esos sistemas de apoyo.

Una pregunta interesante que ha surgido en los últimos años es si la adicción está fundamentalmente relacionada
con el consumo de drogas o si uno puede ser adicto a algo que no está relacionado con las drogas.
1
Según la vieja teoría de la “dependencia” de la adicción (que sostiene que las drogas
2
tu equilibrio interno de algún químico cambian), es muy difícil describir las no drogas como una
adicción. Pero según la teoría de la “maladaptación” (que sostiene que hay que soportar altos costos para obtener
la dosis) o la teoría económica similar “inelástica” (que sostiene que el consumo no disminuye tanto como se espera
cuando los costos aumentan), 3 hay muchas cosas a las que uno puede volverse adicto.
Pero también hay muchas cosas que son inelásticas y que no queremos decir que son malas (¡como la respiración!).
Sin embargo, si trabajamos a partir de la teoría de la “maquinaria de toma de decisiones que funciona mal” descrita
en este libro, podemos ver que las conductas también pueden ser sobreseleccionadas dada la valoración correcta
subyacente que deberían tener.
En el mundo clínico, la adicción no relacionada con las drogas más común es el juego problemático, que afecta
entre el 1% y el 4% de la población estadounidense, dependiendo de los criterios específicos utilizados para definirlo.
El problema del juego suele identificarse porque las consecuencias
desadaptativas (pérdida de dinero, pérdida de familia, estabilidad vital) suelen ser muy claras.
Desde la perspectiva de la toma de decisiones, el juego problemático es definitivamente una adicción. Nuestro
sistema de toma de decisiones no es óptimo; puede ser engañado para que tome malas decisiones en

185
Machine Translated by Google

186 El cerebro con mente propia

las condiciones equivocadas. 5 Al igual que en nuestra descripción de las múltiples formas posibles en que las

sustancias farmacológicas (drogas) pueden acceder al sistema de toma de decisiones y pueden conducir a decisiones

incorrectas, existen múltiples formas en que las secuencias de ganancias y pérdidas (juegos de azar) pueden conducir a

una toma de decisiones incorrecta. Analizamos algunas de estas vulnerabilidades potenciales en el último capítulo, que

se centró en las adicciones farmacológicas.

Además de estos efectos motivacionales, los humanos somos muy malos en reconocer secuencias aleatorias como

siempre estamos buscando causas subyacentes. 6 Esto significa que podemos ser engañados por la aleatorias y

experiencia limitada con un evento probabilístico. Como no vemos la distribución correcta de posibilidades, o la distribución

correcta de la probabilidad de que esas posibilidades ocurran, creemos que tenemos más control sobre el sistema del

que realmente tenemos. (Esto es muy probablemente una falla en el sistema de reconocimiento de situaciones que no
7 somos
está dispuesto a aceptar coincidencias y siempre está construyendo narrativas para explicar por qué las

cosas resultaron como lo hicieron. 8 )

En particular, los humanos son muy susceptibles al “casi accidente”,9 donde se nos dice que
“Casi lo logramos”, lo que nos lleva a pensar que estamos avanzando en la comprensión del complejo sistema que es el

mundo en el que vivimos. Esto es algo que los fabricantes de máquinas tragamonedas han aprendido a explotar. Las
10
máquinas tragamonedas se vuelven cada En las últimas décadas, las máquinas tragamonedas han...

vez más complejas hasta que son casi como los videojuegos de hoy en día. Por supuesto, los casinos también han

aprendido a reducir la capacidad de uno para reconocer estas complejidades proporcionando una gran cantidad de luces

y señales por todo el casino para desviar la atención y proporcionando alcohol para disminuir su capacidad de planificar

y pensar.

La ilusión del control

Imagínese tomar los 10 dígitos (del 0 al 9) y ordenarlos. ¿Qué secuencia de números le parece más aleatoria:
4037981562 o 0123456789? Apuesto a que es la primera (a menos que sea su número de la Seguridad Social). En

realidad, ambas son igualmente probables. Si está seleccionando una secuencia aleatoria de 10 dígitos (sin reemplazo),

la probabilidad de ver una secuencia específica es de 1 en 3,5 millones .

Varios investigadores han argumentado que la razón por la que los animales desarrollaron cerebros es la predicción:

cuanto mejor puedas predecir lo que va a suceder, mejor podrás prepararte para ello, mejor podrás reaccionar ante ello,

mejor serás para sobrevivir y procrear tus genes en la siguiente generación. de la aleatoriedad verdadera. Esto tiene
11
varios efectos en nuestra capacidad de Hemos evolucionado para reconocer patrones, incluso si surgen.

toma de decisiones. Primero, significa que somos terribles para generar secuencias aleatorias.
12
En segundo lugar, significa que

encontramos patrones incluso en la aleatoriedad. 13

Generar aleatoriedad: simplemente no se puede hacer

Pídele a cien personas que generen una cadena de cinco dígitos aleatorios y apuesto a que ninguno de ellos dirá “00000”

o “99999”. (A menos que sean neurocientíficos o psicólogos.

A Con 10 dígitos para elegir, hay 10 posibilidades para el primer dígito, 9 para el segundo
(todos menos el que ya eligió), 8 para el tercero, etc. Esto resulta en 10 × 9 × 8 × 7 × 6 × 5 × 4 × 3 ×
2 × 1 = 10! = 3.628.800. Todas las posibilidades, incluida 9876543210, son igualmente probables.
Machine Translated by Google

Juego y adicciones conductuales 187

(Quienes estudian estas cosas y se les ocurrirán esos números sólo para fastidiar su experimento, pero por supuesto,
esos números tampoco son aleatorios). En general, la gente comenzará con un número (digamos 7) y luego intentará
encontrar un número que sea diferente de ese, y luego volverá a otro número. Este es un proceso llamado "inhibición
del retorno" y se sugiere que es un medio para mejorar la búsqueda de alimentos. Uno está "buscando" números,
14
pero en otro lugar. En sentido,
15
y, habiendo encontrado 7, se quiere encontrar el siguiente número.

Mi demostración favorita de que la aleatoriedad es difícil de lograr es que los programas de computadora pueden
aprender a vencernos al juego de piedra, papel o tijera. 16 Este es el juego en el que tú y tu oponente contáis hasta
tres y, en tres, ponéis la mano en puño (piedra), en palma de la mano (papel) o con dos dedos haciendo un
movimiento de cortar (tijeras). En este juego, cada opción supera a una de las otras opciones y cada una pierde
contra una opción en un círculo: la piedra le gana a la tijera, que le gana al papel, que le gana a la piedra. Si puedes
predecir lo que va a hacer tu oponente, entonces siempre puedes ganar. Pero si no puedes predecirlo, entonces la
estrategia óptima es jugar al azar. Desafortunadamente, los humanos somos terribles jugando al azar. Como parte
de su trabajo de tesis de posgrado, Steve Jensen, de la Universidad de Minnesota, desarrolló un algoritmo que
básicamente recuerda secuencias que ha observado. Utiliza estas secuencias para predecir resultados futuros.
Como tiene una memoria muy grande, este programa eventualmente vencerá a un oponente humano. Si juega solo
una partida contra ti, entonces quién ganará será aleatorio.

Pero si juegas cien partidas contra él, ganará más de la mitad de las veces (¡mucho más de la mitad!). Es una
experiencia increíblemente frustrante, porque incluso si sabes que tienes que jugar al azar e intentas jugar al azar,
¡el ordenador sigue adivinando correctamente lo que vas a hacer!

Predecir lo que va a hacer el oponente es un factor clave en la mayoría de los deportes competitivos, ya sea un
bateador de béisbol que predice qué lanzamiento va a lanzar el lanzador (y hacia dónde lo va a lanzar), un entrenador
de fútbol que predice si se realizará una jugada de pase o una jugada de carrera a continuación, o un jugador de
tenis que predice hacia dónde sacará la pelota su oponente a continuación. Incluso una pequeña mejora en el
conocimiento de la siguiente opción tendrá grandes consecuencias en el transcurso de un partido o una temporada.
Y, por supuesto, la capacidad de generar aleatoriedad (o su inversa, la capacidad de predecir lo que va a hacer un
oponente) también tiene implicaciones importantes para otras actividades, incluidas las de los negocios, la política y
la guerra.
B

Reconociendo patrones

La otra implicación de nuestra predilección por la predicción es que reconocemos patrones que no existen. 17 Desde
el hombre en la luna hasta los íconos religiosos en el pan mohoso.

B Esto no significa que la aleatoriedad sea la mejor estrategia para ganar en cualquiera de estas actividades, ya
sea fútbol, negocios, política o guerra. Debido a que algunas opciones son en realidad mejores que otras y debido a
que las interacciones entre las personas rara vez son de suma cero, la aleatoriedad verdadera rara vez es una
estrategia óptima. (Piedra, papel o tijera es uno de los pocos casos en los que la aleatoriedad es la estrategia óptima).
Debido a que somos criaturas sociales, dos jugadores que cooperan van a ser mucho más fuertes que dos jugadores aleatorios.
La aleatoriedad rara vez te permite ganar la partida, pero a menudo también acaba con tus oponentes cercanos.
Volveremos a la cuestión de la cooperación en nuestro análisis de la moralidad (capítulo 23). Baste decir por
ahora que la cooperación también depende de la capacidad de predecir lo que van a hacer tus colegas.
Machine Translated by Google

188 El cerebro con mente propia

Los patrones en las baldosas de mármol son una constante en el mundo de nuestros cerebros. Algunos
de estos patrones son reales. Los hongos y las flores suelen aparecer después de una gran tormenta.
Si te dan un puñetazo en la cara, es probable que te golpee si no lo bloqueas y que te haga daño si te
golpea. Otros patrones no son reales. El hombre en la luna es una ilusión causada por una interacción
entre el patrón específico de tierras bajas oscuras y tierras altas brillantes en la superficie de la luna con
los sistemas de reconocimiento facial genéticamente cableados en nuestros cerebros.
El reconocimiento de patrones que no existen se convierte en un verdadero problema cuando
18
conduce a la ilusión de control
En .un casino, cuando se juega a un juego, a veces se gana y a veces se
pierde. Supongamos, por ahora, que estos juegos son verdaderamente aleatorios. Pero imaginemos que
nos damos cuenta de que hemos roto una larga racha de pérdidas justo después de tocarnos el sombrero
y secarnos la frente. Tal vez valga la pena volver a intentarlo. Por supuesto, es probable que no
funcione la segunda vez, pero ahora estamos en un mundo probabilístico: estamos tratando de averiguar
si ganar es un poco más probable en una u otra condición.
Por supuesto, lógicamente, no tiene sentido por qué limpiarse la frente cambiaría el resultado de una
máquina tragamonedas, pero ¿qué pasa si, en cambio, pensamos en cómo empujas la culata, o cuándo
empujas la culata en el transcurso de un giro de algún efecto de video en la máquina?
Ahora, tenemos una causa lógica potencial que podría afectar el resultado de la máquina. Imaginemos
una máquina tragamonedas con un interruptor simple. El interruptor podría incluso tener un letrero que
diga “este interruptor no hace nada”. Sin embargo, alguien que juegue con la máquina probablemente
probará el interruptor, y tendrá más probabilidades de ganar con el interruptor en una posición u otra.
(Aunque al lanzar una moneda saldrá cruz la mitad de las veces en promedio, la probabilidad de que
cualquier secuencia específica de lanzamientos de moneda sea mitad cara y mitad cruz es muy baja. De
manera similar, es muy poco probable que el número de ganancias que observe con el interruptor en cada
posición sea exactamente el mismo). Por lo tanto, el jugador creerá (incorrectamente) que el interruptor
tiene un efecto. Esta es la ilusión de control.

conductista prominente en nuestro análisis del 19 BF Skinner (a quien conocimos como un

refuerzo en el Capítulo 4) demostró que las palomas eventualmente realizarían conductas aleatorias
individuales interesantes si las habían realizado un par de veces antes de obtener una recompensa,
incluso si la recompensa en realidad se entregaba al azar.

Una gran parte de nuestra inteligencia se dedica a intentar predecir el mundo. Varios investigadores
han sostenido que el aprendizaje consiste en reconocer contingencias , es decir, si es más (o menos)
20 Como vimos en
probable que ocurra un acontecimiento en el contexto de otro acontecimiento. En
nuestro análisis del reconocimiento de situaciones y la construcción de narrativas (capítulo 12), gran
parte de nuestro esfuerzo cognitivo se dedica a reconocer la estructura causal dentro del mundo.
21 desde Giambatista Vico. do
Esta ha sido una hipótesis sobre el origen de la mitologización.
Entonces, ¿qué sucede cuando tus hipótesis causales cometen errores, cuando reconoces
diferencias entre dos situaciones que en realidad no son diferentes? Esto conduce a la ilusión de control:
si crees que hay dos situaciones (una en la que ganas y otra en la que pierdes) y puedes encontrar una
manera de llegar a la situación ganadora, entonces el juego tiene sentido. Por supuesto, aquí es donde
los errores cognitivos pueden conducir al juego problemático.
23 Piense en el jugador estereotipado de las películas: "Sé lo que es".

C. Giambatista Vico fue un científico y filósofo italiano que vivió entre 1668 y 1744 (justo después de
Newton y Descartes). Vico es más conocido por su Scienza Nuovo ( Nueva ciencia ), que es una de las
principales fuentes para la estructura de Finnegans Wake de James22Joyce .
Machine Translated by Google

Juego y adicciones conductuales 189

diferente. Préstame el dinero, esta vez es una apuesta segura. Te lo devolveré cuando gane”.
Ese jugador no es adicto a la aleatoriedad. Ese jugador no busca jugar el juego.
Ese jugador cree que entiende la estructura causal del mundo lo suficientemente bien
como para controlarlo. Ese jugador ha sucumbido a la ilusión del control.
También podemos ver que reconocer incorrectamente cuándo una situación ha cambiado puede
llevarnos a tener problemas con el juego. Si una situación ha cambiado, pero no reconocemos el cambio,
entonces estaremos realizando las acciones equivocadas en las situaciones equivocadas. Una vez más,
los errores cognitivos conducen a una toma de decisiones incorrecta. Aquí, nuevamente, podemos ver
mejor este efecto en la literatura clásica de trágicas incapacidades para reconocer cuándo el mundo ha
cambiado: un atleta que ya no tiene las habilidades de su juventud pero no puede dejarlo, el hombre de
negocios incapaz de reconocer que los nuevos competidores están usando tácticas diferentes, los generales
que luchan24en la última guerra.

Esto es algo que los operadores de casinos y los fabricantes de máquinas tragamonedas entienden.
En las últimas décadas, las máquinas tragamonedas se han vuelto más complicadas, no menos. 25 En
su libro Addiction by Design , Natasha Dow Schüll describe a los jugadores de tragamonedas y máquinas
de video como personas que sucumben a un déficit particularmente procedimental, que se dejan llevar
por el "flujo" de un sistema procedimental, y describe cómo los diseñadores de tragamonedas y
videojuegos han enfocado las máquinas para acceder a ese sistema de aprendizaje procedimental (no
deliberativo). Las máquinas de juego de video incluyen decisiones y controles cada vez más complejos,
lo que proporciona una experiencia más "similar a un juego", y se basan cada vez menos en simplemente
poner dinero y tirar de la palanca. Las opciones más complejas brindan más opciones potenciales para
que la ilusión de control se apodere de ellas. 26
En un estudio clásico de 1975, Ellen Langer y Jane Roth entrenaron a 90 estudiantes universitarios de
27 Los estudiantes que adivinaron correctamente al
Stanford para jugar a un juego de lanzamiento de moneda.
principio tenían muchas más probabilidades de decidir que estaban prediciendo correctamente los
resultados que los estudiantes que adivinaron incorrectamente al principio. Es decir, una secuencia de
victorias seguidas de derrotas llevó a los estudiantes a imaginar que entendían la tarea y que necesitaban
tratar de averiguar qué estaba saliendo mal, mientras que una serie de derrotas intercaladas con victorias
llevó a los estudiantes a pensar que era aleatorio. Una secuencia de cuatro suposiciones tempranas
correctas fue suficiente para llevar a las personas a creer que podían adivinar correctamente la secuencia
"incluso para sujetos sofisticados". Así es como los casinos enganchan a la gente: una serie rápida de
victorias te lleva a pensar que puedes ganar el juego, aunque (como hemos visto) WWWWWLLLLL es tan aleatorio co
¡¡ ... 28

Victorias y derrotas

Otra falla potencial es que las victorias y las derrotas se representan de manera diferente en el sistema
de toma de decisiones. Ya hemos visto cómo las personas valoran las victorias y las derrotas de
D Ya hemos visto cómo las diferencias entre el castigo y la decepción implican
manera diferente.
que debe haber señales diferentes para las victorias (ganancias, recompensas) y las derrotas.

D
Tal vez recuerde los ejemplos de formulación que vimos en el Capítulo 3, donde formular exactamente
el mismo problema en términos de ganancias o pérdidas cambiaba la opción que alguien prefería. En el
ejemplo de la gripe asiática, se prefería estar seguro de salvar 200 vidas (de 600, perdiendo así 400) frente
a la apuesta de salvar o perder a todos, pero se prefería la apuesta a estar seguro de perder 400 vidas. 29
Machine Translated by Google

190 El cerebro con mente propia

(castigos), porque la decepción (falta de entrega de una ganancia esperada) no es un castigo simple, y
el alivio (falta de entrega de un castigo esperado o potencial) no es una victoria simple (ver Capítulo 4).

Un ejemplo interesante de esto se puede encontrar en la enfermedad de Parkinson, que ocurre

cuando un sujeto ha perdido sus células de dopamina, particularmente aquellas en los aspectos dorsales
de las áreas de dopamina del mesencéfalo, llamadas sustancia negra. 30 Éstas son, de
hecho, las células de dopamina que hemos visto entrenar el sistema procedimental (Capítulos 4 y 10).
Uno de los principales tratamientos para la enfermedad de Parkinson es aumentar la cantidad de
dopamina en el sistema, para permitir que las células dopaminérgicas supervivientes trabajen más duro
(normalmente proporcionando un precursor de la dopamina como la levodopa). 31 Esto puede causar un
problema porque los pacientes de Parkinson todavía tienen algunas de sus células dopaminérgicas
intactas, en particular las de los aspectos más ventrales, que parecen estar implicadas en los sistemas
de toma de decisiones más cognitivos, deliberativos e impulsivos (en particular los emocionales y
32 Esto es lomaníacos.
evaluativos), lo que conduce a la impulsividad y a problemas emocionales que le pasa a Leonard en la
película Despertares . El parkinsonismo de Leonard se cura con levodopa , pero con el tiempo la
dopamina se acumula y Leonard se vuelve psicótico y su tratamiento debe suspenderse.

Si estas células dopaminérgicas están implicadas en el aprendizaje, entonces los pacientes de Parkinson deberían tener

problemas para aprender cosas nuevas a partir de recompensas. Tanto Michael Frank como Mark Gluck han realizado
34
experimentos separados en los que entrenaron a pacientes para que aprendieran a partir de señales de recompensa o castigo.

Ambos concluyen que los sujetos normales pueden aprender de ejemplos positivos (obtienen recompensas
si eligen lo correcto, no obtienen nada si eligen lo incorrecto) y de ejemplos negativos (no pierden nada
si eligen lo correcto, pierden algo [normalmente dinero] si eligen lo incorrecto), pero los pacientes de
Parkinson tienen dificultades para aprender de los ejemplos positivos (recompensas). Sin embargo,
pueden aprender de los ejemplos negativos (castigos). Si la clave del aprendizaje es en realidad la
dopamina, entonces se podría esperar que esto se invirtiera con el tratamiento con levodopa: si la
levodopa aumenta los niveles generales de dopamina, se podría predecir que sería posible que los
pacientes de Parkinson aprendieran de las recompensas positivas, pero ya no de los castigos negativos.
De hecho, eso es exactamente lo que sucede.
Como se señaló anteriormente, las máquinas tragamonedas y otros juegos de casino han aumentado la cantidad de

35 Si parte del efecto de

pérdidas casi accidentales ( ¡casi gano! ) que convierten una pérdida real en una aparente victoria.

estos fármacos consiste en aumentar la sensibilidad del paciente a las recompensas y al mismo tiempo
reducir la sensibilidad a las pérdidas, cabría esperar que los pacientes de Parkinson que toman levodopa
y otros fármacos similares que aumentan la eficacia de la dopamina se volvieran muy susceptibles a los
trastornos impulsivos, como el juego problemático, en el que aprenden de los ejemplos positivos ( ¡gané! )
36
y no de los negativos ( perdí ). Eso es exactamente lo que sucede.

Otras adicciones conductuales

También ha habido descripciones de personas “adictas” a una serie de comportamientos, como la comida,
el sexo, la pornografía, las compras, los videojuegos e incluso navegar por Internet .

Las cosas a las que la gente tiende a volverse adicta cuando navega por Internet son los juegos de azar, la
pornografía, los videojuegos y las compras, por lo que no está claro si el problema es Internet en sí o si Internet es
simplemente un nuevo medio que permite otras adicciones conductuales.
Machine Translated by Google

Juego y adicciones conductuales 191

Se ha demostrado que algunas de estas conductas liberan dopamina, a la que a menudo se hace
referencia (por desgracia, tanto en la literatura científica como en los medios de comunicación
populares) como la clave de la adicción. (Recuerde que la dopamina es un punto de acceso, pero
no el único, a la adicción. 38 Véase el Capítulo 18.) Incluso los videojuegos provocan la liberación
de dopamina en el cerebro de los jugadores. 39 Pero, como hemos visto, esto es exactamente lo
que debería ocurrir en el sistema de aprendizaje normal (Capítulo 4), que utiliza la dopamina para
aprender la conducta adecuada. La pregunta (cuya respuesta no se conoce) es si esa señal de
dopamina se compensa correctamente a medida que aprende el juego.
Por ejemplo, ¿es la obesidad una adicción? Hay algunos datos que muestran que las personas obesas
tienen algunos de los mecanismos de compensación homeostática y otros mecanismos disfuncionales de
dopamina que se observan en los drogadictos a largo plazo. 40 Algunos de los datos sugieren que el
problema de la obesidad está relacionado con el alto contenido de grasa y azúcar de la comida basura.
41
Recuerde que el azúcar puede tener algunos de los problemas de mala distribución que hemos visto Entonces

en las drogas adictivas. No está completamente fuera del ámbito de las posibilidades que la obesidad sea un
signo de una forma de adicción a la comida, pero sigue siendo una cuestión abierta que se está discutiendo
en la literatura neurocientífica y médica.

Muchos de estos comportamientos son necesidades y deseos impulsados internamente que se

salen de control. Como vimos en nuestro análisis de las funciones intrínsecas de la recompensa
(capítulo 13), la evolución sólo exige que los comportamientos tengan el resultado correcto, no que
sean “por la razón correcta”. Hay una serie de comportamientos que han evolucionado para ser
placenteros por sí mismos, pero que evolucionaron porque eran realmente útiles por sus consecuencias
en el entorno en el que evolucionaron. El ejemplo clásico es, por supuesto, el sexo. La razón por la que
el sexo es necesario evolutivamente es, por supuesto, para producir la siguiente generación. Pero la
razón por la que nuestros cerebros quieren tener sexo es porque se siente bien y satisface una
necesidad impulsada internamente, no porque produzca hijos. A los perros les encanta perseguir cosas
(automóviles, palos, ardillas). En la naturaleza, los perros eran cazadores en manada que perseguían
animales grandes. Así que los perros evolucionaron para que les gustara perseguir cosas. La
persecución en sí misma se volvió placentera. Se supone que la propensión del hombre a la pornografía
tiene un efecto similar. Es fácil ver cómo esto puede llevar a una selección excesiva de estos
comportamientos de maneras que pueden interferir en la vida de una persona.

¿Entonces, queremos decir que uno es “adicto” a estas conductas? ¿Qué pasa con otras? ¿Son estas
42 conductas en las que uno puede volverse adicto?
¿Es adicto a conductas como ir de compras o
prender fuego? ¿Es adicto a algo? Desde la perspectiva de la toma de decisiones, el término “adicto”
no es la pregunta científica importante. Desde la perspectiva de la toma de decisiones, la pregunta
científica es por qué la persona continúa con esa conducta, ya sea que esa conducta consista en
tomar drogas, jugar o ver pornografía. Fundamentalmente, si debemos o no llamar a esa persona
“adicta” es una cuestión de política, que determina si debemos alentar o desalentar esa conducta y
hasta qué punto estamos dispuestos a comprometernos con esa política. Pero si entendemos cómo
funciona el proceso de toma de decisiones para impulsar a la persona a continuar con esa conducta,
podemos entender mejor lo que uno necesita hacer para fortalecerla o debilitarla, habilitarla o
deshabilitarla, alentarla o desalentarla.

Libros y artículos para lectura adicional •

Constance Holden (2001). Adicciones “conductuales”: ¿Existen? Science, 294 ,

980–982 .
Machine Translated by Google

192 El cerebro con mente propia

• Natasha Dow Schüll (2012). Adicción por diseño: máquinas de juego en Las Vegas .
Princeton, Nueva Jersey: Princeton University Press.
• Mark G. Dickerson y John O'Connor (2006). El juego como conducta adictiva .
Cambridge, MA: Cambridge University Press .
• Willem Albert Wagenaar (1998). Paradojas del comportamiento de juego . Hillsdale, Nueva Jersey:
Lawrence Erlbaum Asociados .
Machine Translated by Google

Trastorno de estrés postraumático (TEPT)*

El agua se acumula en el suelo, los

fragmentos de vidrio recuerdan

una rosa roja brillante.

En el trastorno de estrés postraumático, los recuerdos devastadores interactúan con

estructuras neuronales vulnerables para producir un recuerdo episódico emocional

abrumador de una experiencia. La teoría del sistema de toma de decisiones múltiples

y sus estructuras de apoyo interactivas sugieren una perspectiva del trastorno de

estrés postraumático como recuerdos episódicos y emocionales interactuantes.

Después de la Primera Guerra Mundial, se decía que los soldados que regresaban de las trincheras de Europa

sucumbían al “shock de guerra”: nerviosos, encogidos al menor ruido, a menudo incapaces de funcionar en una sociedad

normal. En la Segunda Guerra Mundial, el término era “fatiga de batalla”. La imagen clásica es la de un padre en 1950,

sentado a la mesa de la cocina, fumando su cigarrillo, mirando fijamente a su memoria. Esta dificultad que tienen algunos
soldados no es un fenómeno nuevo.
1 En

su descripción de los soldados que regresaban de la Guerra Civil estadounidense, Jacob Mendes Da Costa
describió un fenómeno de palpitaciones cardíacas de aparición repentina, al que llamó “irriUn estudio histórico
2
corazón de mesa” y llegó a ser conocido coloquialmente como “corazón de soldado”. de 2006
encontró que el mejor predictor del corazón de soldado en los veteranos de la Guerra Civil era el porcentaje de la

compañía muerta, presumiblemente un indicador confiable para experimentar emociones devastadoras. 3 El término
trauma. usado ahora, trastorno de estrés postraumático , reconoce que este problema también puede surgir de
experiencias traumáticas no militares: las víctimas de delitos violentos, agresión sexual, ataque terrorista, accidentes
4
automovilísticos y otros desastres también son vulnerables al TEPT.

En este punto, no está claro cuál es la causa del TEPT. Los síntomas, sin embargo, son consistentes y reconocibles

(como se puede ver en las similitudes de las descripciones de la conmoción por la guerra, la fatiga de la batalla y el

corazón del soldado). 5 Estos síntomas incluyen reexperiencias incontrolables del evento. Basándonos en nuestra
separación de recuerdos episódicos y semánticos (Capítulo 16), estas reexperiencias serían incuestionablemente de

naturaleza episódica. A menudo están vívidamente presentes e intrusivas. Los pacientes con TEPT también muestran un

retraimiento de la realidad.

*
Estoy en deuda con Larry Amsel de la Universidad de Columbia por nuestras discusiones relacionadas con este tema.

193
Machine Translated by Google

194 El cerebro con mente propia

La sociedad y los amigos, así como la hiperactivación, el aumento de la vigilancia y el aumento de las respuestas
de sobresalto, pueden tomarse como evidencia de la selección de acciones pavlovianas (Capítulo 8) y del
aprendizaje motivacional (Capítulo 13). Estas respuestas de sobresalto pueden ser extremadamente peligrosas
en soldados bien entrenados, que han aprendido a asociar respuestas de acción violenta con esas situaciones
(Capítulo 10).
Al igual que la adicción y el juego problemático, el TEPT parece ser una interacción entre la vulnerabilidad
inherente y una causa externa. Por ejemplo, no es cierto que todos los que se exponen a una situación difícil o
evidencia de que existe una diferencia significativa en los niveles traumática sufran TEPT. 6 Ahora hay

hormonales y en varias estructuras cerebrales entre los soldados y otros pacientes que terminan con TEPT
después de un incidente y los que no. 7 Mellizos

Los gemelos de soldados que no padecían TEPT (que comparten el mismo código genético) que padecían TEPT
reaccionaron con más fuerza a las señales sorprendentes que los gemelos de soldados que no padecían TEPT
8
hemos visto que por experiencias similares. De manera similar, el hipocampo (una estructura cerebral que
está profundamente involucrada en la memoria, véase el Capítulo 16) es físicamente más pequeño en los
gemelos de soldados con TEPT que en los gemelos de soldados que no lo padecían. 9 Al igual que con todas
estas vulnerabilidades (como las vulnerabilidades genéticas que hemos discutido en otra parte), estas son
correlaciones. Las personas con hipocampos más pequeños pueden tener más probabilidades de terminar con
TEPT que las personas con hipocampos más grandes; sin embargo, hay muchos otros factores involucrados.
Simplemente tener un hipocampo más pequeño no significa que sufrirás TEPT si alguna vez te expones a un trauma.
Se han propuesto tres teorías para explicar el TEPT: (1) que los pacientes con TEPT tienen 10 (2) que los
una memoria de “flash”, que no se puede olvidar, tienen dificultad para pacientes con TEPT almacenan
11
extinguir los recuerdos relacionados con el miedo, particularmente a través del miedo alterado 12 y (3) que los
lo que permite pacientes con TEPT tienen dificultad para identificar el contexto del procesamiento de la memoria,
13
que esos recuerdos se entrometan en otros contextos. Una cuarta posibilidad es que los
pacientes con TEPT tengan dificultades para consolidar los recuerdos de las representaciones episódicas
dependientes del hipocampo en representaciones semánticas independientes del hipocampo (Capítulo 16).
Abordaremos cada una de estas teorías y luego intentaremos reunirlas en una imagen coherente de la toma de
decisiones y el TEPT.

Recuerdos de flash

Las primeras teorías psicológicas del TEPT sugerían que el acontecimiento traumático producía una memoria
instantánea, una memoria fotográfica perfecta de un momento. El concepto era que el estrés y la intensidad del
almacenamiento de la memoria abrumaban los sistemas de almacenamiento cortical, “quemándolos en el
cerebro”. 14 Sin embargo, esta teoría predice que el recuerdo se recordará de forma idéntica cada vez, lo que no
es como ocurren estos recuerdos.
Aunque la definición original de los recuerdos de flash propuesta por Roger Brown y James Kulik reconocía
que el flash iluminaba solo una parte de la imagen, se mantuvo el concepto de que las imágenes iluminadas
permanecían estables. De hecho, Jennifer Talarico y David Rubin descubrieron que, aunque permanecían
vívidas, los recuerdos de “flash” (definidos como recuerdos que perduran durante largos períodos de tiempo)
perdían consistencia con el tiempo, lo que sugiere que se reconstruían cada vez.
15 Talarico y Rubin

sugieren que la principal diferencia entre los recuerdos instantáneos y los recuerdos más comunes y cotidianos
era la confianza interna en ellos, más que en las propiedades del recuerdo recordado en sí.
Machine Translated by Google

Trastorno de estrés postraumático (TEPT) 195

Curiosamente, esto sugiere que, aunque los recuerdos traumáticos son vívidos e intrusivos, son construidos,
al igual que los recuerdos ordinarios, y también sugiere una relación entre la memoria episódica y el TEPT.

Asociaciones entre el TEPT y el miedo

Ya hemos visto (en el Capítulo 4) cómo los animales que extinguen las respuestas a las asociaciones aprendidas
cambian su comportamiento debido a que entran componentes adicionales en el nuevo proceso, en lugar del
original, conduce a la renovación espontánea de las respuestas y a la recuperación olvido de la asociación

señalizada de esas respuestas.

Un aspecto central de este concepto es el reconocimiento de que existen múltiples sistemas de

memoria (y de selección de acciones). En particular, existe un sistema pavloviano (emocional) de
selección de acciones que funciona a través de conexiones directas desde los sistemas sensoriales
17
talámicos Como vimos en el Capítulo 8, nuestras respuestas pavlovianas producen emociones viscerales.
hasta la amígdala. reacciones motivacionales a los estímulos, a veces incluso sin nuestro conocimiento.
Pero los mecanismos pavlovianos también afectan al sistema motivacional (capítulo 13), que influye
en los sistemas deliberativo y procedimental (véase el capítulo 6). Esto significa que una respuesta
pavloviana, emocional, podría etiquetar un recuerdo particularmente destacado y particularmente
probable de ser recuperado.

Sin embargo, debemos tener cuidado de decir simplemente que los pacientes con TEPT tienen dificultades
para extinguir sus conductas. Existen varias diferencias clave entre el tipo de aprendizaje asociativo que ocurre
en los paradigmas de extinción típicos y el TEPT. Los paradigmas de extinción generalmente implican múltiples
exposiciones al estímulo desencadenante para crear el
18
asociación, y la reacción a la asociación es común entre todos los animales expuestos.
La reaparición espontánea de la asociación ocurre después de largos períodos de tiempo, no inmediatamente
después del evento. La reaparición de la asociación ocurre con una nueva exposición a las señales
20
específicas que crearon la asociación original. Por el contrario, el TEPT
generalmente ocurre en respuesta a un evento traumático único, los recuerdos intrusos ocurren rápidamente
después del evento y se desvanecen con el tiempo, y los recuerdos intrusos aparecen, incluso sin previo aviso,
21
en situaciones con poca o ninguna relación con la asociación original.

Recuerdos fuera de contexto

Lynn Nadel y W. Jake Jacobs han sugerido que los pacientes con TEPT tienen dificultades específicas para
separar contextos, lo que permite que los recuerdos reaparezcan (se entrometan) en situaciones en las que
22
normalmente no lo harían. En concreto, proponen que los glucocorticoides
en el hipocampo que surgen durante el estrés inhabilitan el hipocampo durante el almacenamiento de la
memoria, lo que permite que la memoria se desmarque espaciotemporalmente, lo que permite que la memoria
se despegue, en cierto sentido, en el tiempo. El estrés afecta el almacenamiento y la recuperación de los
recuerdos, principalmente a través de la acción de los glucocorticoides (como el cortisol). 23 En particular, Nadel,
Jacobs y sus colegas han descubierto que los acontecimientos estresantes previos a una experiencia facilitan
el almacenamiento de recuerdos emocionales a través de una interacción hipocampoamígdala, incluso mientras
perjudican el procesamiento hipocampal.
Machine Translated by Google

196 El cerebro con mente propia

en tareas de memoria dependientes del hipocampo. 24 Aunque el estrés durante la recuperación

perjudica esa recuperación (es más difícil recordar cosas bajo estrés), el estrés inmediatamente después
del entrenamiento aumenta el almacenamiento y la recuperación posterior (es más fácil recordar cosas
que te suceden cuando estás estresado). 25
Varios investigadores han sugerido que esta interacción (entre los recuerdos salientes, marcados
por valores, y la memoria hipocampal no acoplada) es un factor clave en el TEPT. 26
En estas teorías, el trastorno de estrés postraumático (TEPT) ocurre cuando los niveles de estrés mejoran el aprendizaje de la

27 Nadel
amígdala y suprimen el aprendizaje del hipocampo. y Jacobs sugieren que el efecto del evento estresante masivo
es mejorar el aprendizaje en la amígdala, disminuir el aprendizaje en el hipocampo y producir una
memoria altamente cargada de valores pero desacoplada del contexto. 28 Sin
embargo, estas teorías sugieren que el paciente con TEPT no será capaz de proporcionar una
imagen espaciotemporal del evento, particularmente la ubicación del paciente dentro de la
secuencia del evento, lo que no parece encajar con las descripciones de la naturaleza vívida de
29
la memoria traumática en el TEPT.

De la memoria episódica a la memoria semántica

En el capítulo 16 vimos cómo el progreso normal de la memoria es una transición de recuerdos episódicos
( estás ahí ) a semánticos ( recuerdo eso ). Una posibilidad intrigante es que el TEPT ocurre no cuando
el hipocampo es incapaz de crear un recuerdo episódico del evento, sino cuando el sistema hipocampo
cortical es incapaz de consolidar el recuerdo en un almacenamiento semántico. Como discutimos en el
capítulo 16, aunque los primeros estudios de consolidación sugirieron que la memoria se transfirió
intacta de las estructuras dependientes del hipocampo a las estructuras independientes del hipocampo
con el tiempo, estudios más recientes han sugerido que ciertas funciones de la memoria siguen
dependiendo del hipocampo para siempre. 30 Estudios recientes han sugerido que los recuerdos
transferidos tienen un carácter fundamentalmente diferente a los recuerdos almacenados recientemente:
los recuerdos almacenados recientemente (dependientes del hipocampo) se almacenan de manera
episódica , mientras que los consolidados se almacenan de manera semántica extrahipocampalmente.

Estas teorías son coherentes con las nuevas opiniones sobre el hipocampo, que desempeña un
papel en el viaje mental en el tiempo, papel clave tanto en la reconstrucción del pasado como en la imaginación
del futuro. 31 Si la recuperación normal de un trauma implica la consolidación de un recuerdo que pasa
de ser un recuerdo episódico ( de que uno está allí , de que se vuelve al pasado ,) a un recuerdo
semántico ( desprendido de la narrativa ), los pacientes con TEPT pueden quedar atrapados en el modo
episódico. Pueden ser incapaces de lograr esta transformación y seguir reconstruyendo su pasado cada
vez que acceden al recuerdo, lo que deja en el recuerdo una inmediatez que interfiere en el funcionamiento normal.
De hecho, esto es coherente con los estudios originales sobre los recuerdos de flash, 32 que
sugerían que el recuerdo normal de “flash” se almacenaba, se reproducía y se ensayaba, y su
impacto emocional disminuía con el tiempo. Es importante destacar que Brown y Kulik estaban
estudiando a personas normales que recordaban tragedias lejanas (por ejemplo, ¿dónde estaba
usted cuando se enteró de que el World Trade Center había sido atacado por terroristas? ), no a
personas con TEPT involucradas en el evento en sí (por ejemplo, bomberos que escapaban de los
edificios que se derrumbaban). Brown y Kulik plantearon la hipótesis de que los relatos finales de los
recuerdos de flash se derivaban de un ensayo continuo, encubierto y abierto, de estas historias,
traduciéndolas a una forma narrativa y tal vez incluso verbal.
Machine Translated by Google

Trastorno de estrés postraumático (TEPT) 197

Esta hipótesis se basa en el concepto de que el hipocampo en pacientes con TEPT es débil o
disfuncional, no no funcional. Los pacientes con lesiones completas en el hipocampo no muestran
ningún recuerdo episódico y, cuando recuerdan acontecimientos pasados o imaginan acontecimientos
futuros, sus descripciones son principalmente semánticas, no episódicas. 33 Las
experiencias de TEPT son vívidas y están ubicadas espacial y temporalmente, con fuertes
sugerencias de viajes mentales en el tiempo, todas ellas indicaciones de recuerdos episódicos y un
hipocampo disfuncional (pero no noA funcional).

Resumen
Los intentos de tratamiento para el TEPT han incluido tratamientos farmacológicos, intentos de
extinguir el recuerdo mediante la adquisición de señales de seguridad e intentos de recontextualizar
el recuerdo, transfiriéndolo efectivamente desde los sistemas episódicos etiquetados emocionalmente
34
a los sistemas semánticos más distantes.
Aunque todavía queda mucho trabajo por hacer para determinar
las vulnerabilidades que generan el TEPT, los mecanismos por los cuales crea disfunción y cuáles
podrían servir como posibles tratamientos, está claro que el trastorno mental conocido como TEPT
tiene una manifestación física en la función cerebral.
Lo que está claro es que el TEPT implica una interacción compleja y disfuncional entre los sistemas
de memoria. De alguna manera, los sistemas de memoria emocional y episódica se han enredado de
una manera que es difícil desenredar. Como se reconstruyen cada vez, los recuerdos del TEPT no
son “recuerdos de flash”, sino que, en un sentido muy real, están grabados a fuego en el cerebro. El
TEPT incluye problemas con los recuerdos emocionales, que afectan a los sistemas pavlovianos de
motivación y selección de acciones, pero también incluye interacciones hipocampales, en particular
con la recuperación de la memoria episódica. Los pacientes con TEPT parecen tener un hipocampo
disfuncional, incapaz de hacer la transición de los recuerdos de representaciones episódicas a
semánticas con el tiempo.

Libros y artículos para lectura adicional

• Jonathan Shay (1994) Aquiles en Vietnam: Trauma de combate y la ruina de

Personaje . Nueva York: Scribner.
• Frontline (2009). Soldier's Heart. PBS. •
Joseph E. LeDoux (1996). The Emotional Brain . Nueva York: Simon and Schuster. • Chris
Cantor (2005). Evolution and Postraumatic Stress: Disorders of Vigilance and
Defensa . Londres: Routledge.

A
De manera similar, los pacientes de Alzheimer son bien conocidos por su capacidad de revivir recuerdos
episódicos. Esto sugiere que tanto los pacientes con TEPT como los de Alzheimer tienen un hipocampo que funciona
incorrectamente, en lugar de uno que simplemente está inactivo.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Psiquiatría computacional*

libélula zumbando en
todas direcciones ¡No
puedo salir!

Las clasificaciones psiquiátricas actuales de los pacientes se basan en una

taxonomía de síntomas. Si bien esta clasificación parece ser confiable (en el
sentido de que diferentes profesionales tienden a clasificar a pacientes similares
de manera similar), parece haber una desconexión entre la categorización y los
mecanismos subyacentes. La comprensión detallada de los sistemas de toma
de decisiones que se presenta en los capítulos 6 a 15 y la visión del ingeniero
sobre el cerebro en busca de modos de falla, vulnerabilidades y disfunciones
(capítulos 18 a 20) brindan una nueva visión de la psiquiatría, que ahora está
surgiendo como un campo llamado "psiquiatría computacional".

Nuestras discusiones sobre la adicción, el juego problemático y el trastorno de estrés postraumático sugieren
que la visión neurocientífica del sistema de toma de decisiones tiene implicaciones para los trastornos psiquiátricos.
Desde la introducción del DSMIII en 1980, A
La psiquiatría ha estado desarrollando una
taxonomía de categorías para identificar a los pacientes, presumiblemente bajo el supuesto de que los pacientes
que caen en la misma categoría deberían requerir un tratamiento similar. Aunque estas categorías parecen ser
confiables en el sentido de que diferentes psiquiatras tienden a categorizar a los pacientes de ejemplo en
categorías similares (es decir, están de acuerdo en cómo son las categorías), estas categorías no han sido tan
2
buenas para identificar tratamientos para los pacientes.
En parte, esto se debe a que muchas de estas categorías son disyuntivas; están formadas por
subcomponentes vinculados por una relación “o”: si usted tiene el síntoma A o el síntoma B, entonces está en la
categoría C. 3 Si los dos síntomas incluidos en la categoría disyuntiva son ambos
confiables, entonces la combinación disyuntiva de ellos también será confiable.

*
Estoy en deuda con Larry Amsel de la Universidad de Columbia por nuestras discusiones sobre este tema.
El Manual diagnóstico y estadístico de los trastornos mentales es la guía de referencia para identificar
enfermedades psiquiátricas. La edición actual es el DSMIVTR (“TR” significa “revisión del texto”), y el DSMV
está en proceso. El otro manual importante utilizado por los médicos para la identificación de trastornos
1
psiquiátricos es la Clasificación Internacional de, conocida como CIE10.
Enfermedades.

199
Machine Translated by Google

200 El cerebro con mente propia

Esta categorización disyuntiva se puede observar en el predominio de categorías del DSM basadas en la suma
de síntomas. En el DSMIVTR, el diagnóstico de ludopatía se puede realizar si el paciente tiene cinco o más
de diez criterios. Esto significa que dos personas pueden ser identificadas como ludópatas aunque no tengan
síntomas en común. El hecho de que las categorías sean fiables no implica que sean válidas , es decir, que
digan algo sobre el mecanismo compartido. 4 ,

El otro problema con las categorías identificadas en el DSM es que se basan en síntomas. Como todo el
mundo sabe, un síntoma determinado puede ser causado por cualquiera de una serie de posibles problemas
subyacentes. Imaginemos a un paciente que llega a un hospital con dolor en el pecho. Imaginemos que el
médico le dice al paciente: “Una cierta proporción de pacientes con dolor en el pecho requieren una cirugía a
corazón abierto y una cierta proporción de pacientes con dolor en el pecho responden bien a un antiácido, así
que probaremos ambos”. Obviamente, el tratamiento tendría más éxito si diferenciáramos de forma fiable a
B
los pacientes que están sufriendo ataques cardíacos de los pacientes que tienen indigestión.
A veces, la única opción disponible es curar el síntoma. Para un médico que mira a un paciente que acaba
de perder una pierna por la explosión de una mina terrestre, no hay nada que hacer en ese momento excepto
tratar la herida y eventualmente proporcionar una pierna mecánica de reemplazo. De manera similar, la
incapacidad para iniciar el movimiento (acinesia) y la lentitud para iniciar el movimiento (bradicinesia) observadas
en la enfermedad de Parkinson se deben a la pérdida de Así como sería genial abordar las causas subyacentes
6
células de dopamina en el cerebro. que colocaron la mina terrestre en el campo 7 ( No voy a estudiar la
guerra nunca más ), sería genial prevenir la pérdida de neuronas de dopamina en primer lugar. Sin embargo,
la única opción de tratamiento para un paciente que presenta la enfermedad de Parkinson es tratar los
síntomas, ya sea aumentando la dopamina disponible para las células supervivientes (como a través de
precursores de dopamina como la levodopa o mediante intentos de reemplazar las células perdidas) o
permitiendo que el cerebro eluda lo que sea que las células de dopamina estuvieran proporcionando (como se
hace en la estimulación cerebral profunda). 8

De manera similar, a veces el tratamiento adecuado consiste en evitar que los síntomas causen demasiado
daño al organismo y permitir que éste se cure por sí solo. Son los síntomas provocados por el cólera los que
matan, no la enfermedad en sí. La rehidratación es un tratamiento fiable que cura eficazmente la enfermedad
9
al tratar los síntomas.
En este punto, se reconoce que hay un problema en psiquiatría, pero los profesionales aún están
debatiendo cómo reestructurar la taxonomía para poder llegar a los mecanismos que conocemos, teniendo en
cuenta al mismo tiempo el hecho de que hay muchos mecanismos que no conocemos, todo ello mientras
seguimos haciendo lo mejor que podemos para tratar a los pacientes, muchos de los cuales necesitan ayuda
10
desesperadamente.
Parece estar surgiendo un nuevo campo de la psiquiatría computacional para hacer realidad
Conexiones. estos 11 El término pretende invocar el uso de constructos teóricos (como los que hemos
estado explorando en este libro) para redefinir las categorías y el tratamiento propuesto para los trastornos
psiquiátricos.
La pregunta que se plantea es, entonces, ¿cuáles son los mecanismos y las causas que subyacen a la
enfermedad psiquiátrica? ¿Qué es la depresión? ¿Qué la impulsa? ¿Qué es la esquizofrenia? ¿Cómo la
definimos? ¿Qué es un trastorno de ansiedad? La psiquiatría ha identificado muchos trastornos psiquiátricos diferentes.

B
En realidad, puede resultar difícil diferenciar el dolor de pecho de un ataque cardíaco del dolor de pecho de
una indigestión sin un ECG, 5 por lo que no se debe intentar diagnosticar uno mismo en casa. Por supuesto, esto
solo pone de relieve la cuestión de comprender las causas y los mecanismos, en lugar de solo los síntomas, y de
contar con pruebas clínicas que puedan diferenciar de manera confiable esas causas.
Machine Translated by Google

Psiquiatría computacional 201

Enfermedades: el DSMIVTR tiene más de mil diagnósticos diferentes. ¿Cuántos de ellos son la misma
disfunción que se manifiesta de diferentes maneras? ¿La “fobia social” (miedo a estar en sociedad) es el
mismo trastorno o un trastorno diferente que la “agorafobia” (miedo a lugares donde escapar o recibir ayuda
puede ser difícil)? ¿Cuántos de estos son disfunciones diferentes que se manifiestan como un único síntoma?
(Véase nuestro análisis de la adicción en el capítulo 18.)
Los trastornos de ansiedad, por ejemplo, implican un miedo patológico a emprender acciones en
situaciones específicas. En los seres humanos, la ansiedad se manifiesta en términos de miedo y preocupación
por los resultados futuros. En los animales, la ansiedad se manifiesta en conductas observables de evitación
y miedo. 12 Los circuitos y las estructuras cerebrales implicadas son similares en los experimentos de

ansiedad realizados en animales y en

13humanos.
Implican las estructuras que hemos examinado como parte del sistema
de selección de acciones pavloviano (Capítulo 8) y las estructuras que hemos examinado como parte del
sistema de selección de acciones deliberativas (Capítulo 9). Los modelos actuales sugieren que hay dos
componentes que impulsan la ansiedad. En primer lugar, las expectativas negativas directas de resultados
pueden impulsar acciones relacionadas con el miedo a través de la sustancia gris periacueductal (PAG) y la
amígdala, que vimos anteriormente como una parte clave del circuito pavloviano del miedo ( el susurro en la
hierba que señala al león; el tono que se escuchó antes de la descarga ). En segundo lugar, las expectativas
negativas indirectas de resultados pueden ser generadas por interacciones hipocampalesprefrontales que
luego se evalúan como probables de conducir a un resultadonegativo 14 ( ¡no vayas por ese callejón oscuro! ).
De hecho, cuando las ratas o los ratones llegan a un espacio abierto, tienden a dudar, a asomarse y
luego regresar a su refugio, como si estuvieran nerviosos acerca de si ir o no. 15 Esta

“postura de estiramiento y acción” es muy similar a la conducta de ensayo y error indirecto que vimos en el Capítulo 6. Al igual que la conducta de

ensayo y error indirecto, la conducta de postura de estiramiento y acción 16 Esto sugiere que depende del hipocampo, la corteza prefrontal y su

vacilación probablemente implica predicciones de peligros futuros. Por supuesto, las ratas y los ratones son animales de interacción. que esta

presa y los peligros realmente acechan en cada esquina . Los humanos generalmente están en la cima de la cadena alimentaria y tienden a no

preocuparse tanto por ser comidos por gatos o búhos.

Generalmente los humanos están más preocupados por los peligros sociales, pero la misma respuesta al
Parece que hay mecanismos implicados.18 estrés Los ataques de ansiedad pueden provenir de una variedad

de fuentes, incluidas las interacciones sociales (como hablar en público), el futuro financiero, el peligro
personal, el peligro para los amigos o la familia, la disponibilidad de escape y rescate (en la claustrofobia y la
agorafobia) e incluso circunstancias raras (como terremotos o derrumbes de edificios).
El DSMIVTR considera el TEPT como una forma de trastorno de ansiedad; ciertamente, la descripción del
corazón del soldado suena como un ataque de pánico. 19 Como otro ejemplo, ahora se considera que la
ansiedad desempeña un papel importante en el trastorno obsesivocompulsivo (TOC). Curiosamente, el TOC
parece ser una combinación de un trastorno de ansiedad sobre peligros futuros combinado con una
20
incertidumbre sobre el recuerdo de acciones completadas.
Se están empezando a construir modelos computacionales para explicar el miedo y la ansiedad. Si bien
aún no han dado lugar a cambios en el tratamiento, hay un consenso en cuanto a los mecanismos
subyacentes. Ya hemos hablado de la adicción, el juego y el trastorno de estrés postraumático en los
capítulos anteriores. De manera similar, se están empezando a abordar otras enfermedades psiquiátricas
21
mediante modelos computacionales, por ejemplo, la depresión, la esquizofrenia y otros trastornos.
Hay una serie de trastornos psiquiátricos importantes que no están relacionados con sistemas de
selección de acciones individuales, sino más bien con sistemas de interacción social; por ejemplo, el
trastorno límite de la personalidad y la sociopatía o psicopatía . 22 Estas disfunciones interactivas

Excepto quizás en Twin Peaks, Donde los búhos no son lo que parecen.
do 17
Machine Translated by Google

202 El cerebro con mente propia

Implican a personas que no muestran interacciones sociales normales. Dejaremos de lado estas
cuestiones interactivas hasta que podamos abordar la neuroeconomía , la teoría de juegos , la

propensión de los humanos a organizarse en grupos y los mecanismos a través de los cuales se
mantiene la cooperación dentro de esos grupos (en los capítulos 22 y 23).
Con todos estos ejemplos (como con todos los trastornos psiquiátricos), hay una cuestión
importante: es extremadamente difícil definir la línea entre la normalidad y la disfunción. 23 En
los últimos años se ha debatido mucho sobre el sobrediagnóstico del trastorno por déficit de
atención e hiperactividad (TDAH). 24 ¿Dónde está la línea entre un niño revoltoso que no tiene
tiempo para correr todos los días y el TDAH? ¿En qué medida se utiliza el TDAH como diagnóstico
para controlar las aulas superpobladas? De manera similar, ¿es realmente cierto que uno de cada
diez estadounidenses está deprimido? (En 2008, el 10% de los estadounidenses tomaba
medicación antidepresiva, presumiblemente en su mayoría inhibidores selectivos de la recaptación
de serotonina [ISRS]). 25 ¿Con qué frecuencia se utilizan estos ISRS para aumentar la confianza
26
y en qué medida se utilizan para tratar el duelo normal?
Por otra parte, es importante reconocer que hay personas con disfunción psiquiátrica grave
que necesitan ayuda desesperadamente. La depresión verdadera y el duelo normal son
28
Cosas muy diferentes. El suicidio es la décima causa principal de muerte en los Estados Unidos.
De manera similar, mientras que a algunos niños revoltosos se les puede diagnosticar
incorrectamente TDAH y tratarlos con Ritalin, hay otros que realmente tienen un problema y para
quienes el Ritalin es la diferencia entre obtener una educación o no. La tricotilomanía (arrancarse
el pelo) no tiene que ver con la niña de 10 años que hace girar su cabello nerviosamente mientras
arrastra los pies y te sonríe tiernamente, ni con arrancarse esa primera cana. La tricotilomanía 29
con personas que se han arrancado la cabeza hasta quedar calvas y con el cuero tiene que ver
cabelludo ensangrentado. Personas con disfunción grave que sí necesitan ayuda.
En este momento no tenemos respuestas claras. Aunque no se trata de un problema nuevo y
se ha reconocido como un problema dentro de la psiquiatría durante muchosaños, 30 parece que
se está produciendo un cambio en el que se están identificando las conexiones entre los
Cuáles son estos mecanismos, dónde
mecanismos neurocientíficos y la disfunción psiquiátrica.
están las disfunciones graves y cómo tratarlas son todas preguntas abiertas que se están
explorando activamente dentro de las comunidades neurocientífica, psicológica y psiquiátrica.

Libros y artículos para lectura adicional • Paul

R. McHugh y Phillip R. Slavney (1998). The Perspectives of Psychiatry .

Baltimore, Maryland: Johns Hopkins .
• P. Read Montague, Raymond J. Dolan, Karl J. Friston y Peter Dayan (2012).
Psiquiatría computacional. Tendencias en ciencias cognitivas, 16, 72–80 .
• Steven E. Hyman (2007). ¿Puede la neurociencia integrarse en el DSMV? Nature
Reseñas Neurociencia, 8 , 725–732 .
• Thomas Insel et al. (2010). Criterios de dominio de investigación (RDoC): hacia un nuevo marco
de clasificación para la investigación sobre trastornos mentales. American Journal of Psychiatry,
167 , 748–751 .
• Matt hijs AA van der Meer, Zeb KurthNelson y A. David Redish (2012).
Procesamiento de información en sistemas de toma de decisiones. The Neuroscientist, 18 ,
342–359 .
Machine Translated by Google

PARTE CUATRO

LA CONDICIÓN HUMANA
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

¿Qué nos hace humanos?

Este estadio alguna vez tuvo capacidad para veinte mil

personas, pero el río se movió y ahora sólo los

turistas pueden pararse sobre sus paredes desmoronadas.

Los seres humanos somos animales con capacidades únicas, sobre todo en los ámbitos

del lenguaje, la imaginación y la cultura. Sin embargo, al igual que nuestros cuerpos

físicos, nuestras capacidades mentales contienen ecos de nuestros primos mamíferos

emparentados. Al igual que nuestros sistemas de toma de decisiones, nuestras

tremendas capacidades tienen precursores en otros comportamientos animales.

Me fascina la historia y me encanta viajar y ver las antiguas ruinas de grandes civilizaciones.

He estado en las murallas de Troya y he contemplado las llanuras de Hisarlik, donde alguna vez estuvieron Aquiles y Odiseo.

He estado en el escenario de la antigua ciudad griega de Mileto y me he sentado en las gradas del estadio romano de Éfeso.

Siempre me fascina lo mucho que permanece constante. Las fortificaciones defensivas de un castillo medieval en Japón

(como el castillo de Himeji) son similares a las de una fortaleza medieval europea (como el castillo de Harlech, en Gales).

Los componentes de un antiguo estadio romano son inmediatamente reconocibles para cualquiera que haya asistido a un

estadio deportivo moderno: las filas de bancos (numeradas y etiquetadas por fila), incluso los puestos de comida. De manera

similar, podemos apreciar narraciones de todo el mundo. El lector moderno reconoce la petulancia de Aquiles ante las

demandas de Agamenón en la Ilíada de Homero y el agotamiento de Odiseo impulsado por la guerra en la Odisea .

El tramposo Anansi sigue cautivando la imaginación de los niños, 1 y las aventuras de D'Artagnan y

los tres mosqueteros 2 siguen despertando el interés de niños y niñas de todo el mundo. Ya se trate de los grafitis en la

pared del dormitorio de los chicos en Priene (una ciudad en ruinas en Turquía) o la forma de los asientos del consejo en

Wupatki (en el norte de Arizona), reconocemos interacciones humanas familiares en nuestros ancestros antiguos. Algo es

constante a través de los tiempos, algo que nos permite mirar un conjunto de dibujos en las paredes de la cueva de Lascaux

y saber que alguna persona los pintó.

Sin duda, existe una diferencia cualitativa entre los seres humanos y los demás animales que se han mencionado en

este libro. Los castores pueden crear diques de madera que modifiquen su entorno local, pero nunca han puesto a un

hombre (¿un castor?) en la Luna.

Fuera de la literatura, ninguna rata ha construido ciudades ni escrito novelas. 3 Pero como hemos dicho,

205
Machine Translated by Google

206 La condición humana

Como se puede ver en todo este libro, nuestro sistema de toma de decisiones, al igual que nuestros cuerpos
físicos, contiene ecos de nuestros primos mamíferos. Si evolucionamos a partir de los animales, ¿en qué nos
diferenciamos de ellos? Incluso la frase “evolucionamos a partir de los animales” implica una trayectoria de los
animales a los humanos, con los humanos por encima y más allá. Una mejor afirmación sería que somos parte
de la historia evolutiva, un momento en el tiempo evolutivo.
No evolucionamos a partir de animales: nosotros también somos animales.

Hay muchos rasgos de los seres humanos que parecen únicos entre los animales. Ningún otro animal tiene
habilidades lingüísticas como las nuestras. (Aunque ha sido posible enseñar a algunos animales los rudimentos
del lenguaje, ninguno de ellos ha alcanzado nunca habilidades lingüísticas más allá de las de un niño pequeño.
4 ) La complejidad de las ciudades que construimos y nuestras especializaciones individuales dentro de ellas
no tienen paralelo. (Aunque las termitas y otros insectos sociales también construyen grandes colmenas, estas
están formadas por un número limitado de individuos específicos. 5 ) Y parece que estamos en castas y no nos
parecemos a la flexible
complejidad de las ciudades humanas. destruyendo nuestro ecosistema a una velocidad
6
sin precedentes. Sin embargo, como bien señala Matt
,
Ridley en El gen ágil, muchas especies son únicas. Las termitas construyen en el barro, los calamares expulsan
tinta y las cobras escupen veneno. No basta con ser únicos. La pregunta es: ¿qué nos hace únicos?

Jane Goodall, que ha estudiado una tribu de chimpancés en Gombe durante los últimos 50 años, se quejaba
de que cada vez que encontraba a sus chimpancés mostrando signos de lo que nos hace... Al principio, los
7 humanos éramos usuarios de herramientas.
Humanos, los filósofos cambiarían los postes de la portería.
Pero ya en la década de 1920, el psicólogo Wolfgang Köhler descubrió que los simios podían aprender a apilar
cajas a propósito para encontrar una recompensa. 8 En el campo, Jane Goodall observó
9
Chimpancés que usan ramitas para sacar hormigas y termitas de los tocones de los árboles.
En aquel entonces, los humanos eran los únicos que fabricaban herramientas, pero luego Goodall
observó que los chimpancés fabricaban sus propias herramientas: encontraban el palo adecuado, lo ,
otras especies limpiaban y preparaban el objeto. 10 (Ahora se sabe que las nutrias, los cuervos y muchas
también utilizan herramientas. Las nutrias utilizan rocas para abrir erizos de mar y se ha descubierto que
los
cuervos fabrican herramientas con ramitas y hojas para pescar insectos. 11 )
Luego se sugirió que los humanos son los únicos que han desarrollado culturas separadas. Pero las tribus
de chimpancés utilizan diferentes herramientas para obtener alimentos. En el bosque de Tai, en Costa de Marfil,
una tribu de chimpancés utiliza piedras para romper nueces de cola (que tienen una cáscara muy dura). Los
chimpancés de la tribu Gombe no saben cómo utilizar piedras para romper la nuez de cola.
12
Las nueces y los chimpancés de la tribu del bosque Tai no saben pescar termitas.
Estas diferentes habilidades se transmiten culturalmente de un chimpancé a otro.
Incluso se han observado las habilidades culturales a medida que se fueron descubriendo. En la década
de 1960, los monos macacos japoneses comenzaron a lavar batatas en el océano para eliminar la suciedad y
agregar sal. 13 La habilidad se propagó primero del descubridor (una hembra joven) a otras que conocía, y
luego a los demás miembros de la tribu. Siguió rastros de parentesco, paternidad y entrenamiento.
Observaciones posteriores de comportamientos culturales han demostrado que generalmente se propagan a
través de la celebridad y el dominio, de modo que los primates de rango superior (que son observados de cerca
14
por los de rango inferior) difunden el meme más rápido que los primates de rango inferior.
Así, otros animales muestran el uso de herramientas y otros primates tienen presencia de cultura (o al
menos un precursor de la cultura). ¿Qué hace que los humanos sean diferentes?
Una sugerencia ha sido que los humanos son los únicos que piensan en otros lugares y otros tiempos, para
(por así decirlo) “viajar mentalmente en el tiempo”. 15 Pero, como hemos visto, las ratas muestran conductas
de búsqueda al tomar decisiones y parecen representar expectativas de la
Machine Translated by Google

¿Qué nos hace humanos? 207

resultados de sus acciones.

16 Nikki Clayton, de Cambridge, ha visto que los arrendajos reconocen cuándo y dónde han escondido

comida, pueden tener en cuenta cuánto tiempo esa comida seguirá siendo comestible y pueden tener en cuenta la probabilidad de que otro arrendajo

sepa dónde está escondido el escondite de comida. 17 Tanto los monos como las ratas pueden representar opciones alternativas que podrían haber

existido cuando cometen errores (como en “podría haber obtenido una recompensa si hubiera elegido la otra opción”). 18

Dicho esto, no está claro que los arrendajos puedan mantener una memoria episódica más allá de
los escondites de comida, 19 que los monos o las ratas puedan imaginar futuros o pasados muy lejanos,
o que la cultura de los chimpancés se extienda al tipo de historias narrativas que nos contamos a nosotros
mismos. Sospecho que la diferencia va a ser que las diferencias cuantitativas se conviertan en
cualitativas. Sin embargo, las cosas que nos hacen humanos tienen sus raíces en nuestra historia
20
evolutiva.
Observaciones cuidadosas han demostrado que otros animales juegan, ríen, pelean e incluso montan
lo que, a falta de otra terminología, solo puede llamarse guerras. 21 Y, sin embargo, hay diferencias.

Tenemos una flexibilidad en nuestros sistemas de toma de decisiones que va mucho más allá de lo que pueden hacer otros animales. Nos

comunicamos con un lenguaje infinitamente flexible y capaz de transmitir una gran profundidad de significado. Podemos trabajar juntos en grupos

más grandes y complejos que otras especies. En particular, nuestros grupos van y vienen. Somos capaces de cambiar de grupo con el contexto más

fácilmente que otras especies. 23

22
Como nos definió Aristóteles, somos “la sociedad política”.

Nuestra identidad social puede ser extraordinariamente dinámica y flexible. Tenemos familias
extensas, tribus y naciones, pero también grupos basados en los lugares donde trabajamos, nuestras
A
iglesias, mezquitas y templos, y nuestros equipos deportivos y partidos políticos. Las
personas que trabajan juntas como parte del mismo grupo en un contexto (en un trabajo o animando a
un equipo deportivo) pueden disolverse en la ira y en discusiones insolubles en otro contexto (como la
política). 25
que tiene
primer lugar, varias puede
el lenguaje propiedades importantes
comunicar que pueden
información explicar nuestras diferencias. En
muy detallada
(como planes o instrucciones) rápidamente.
26
En segundo lugar, puede
almacenar conocimiento fuera del individuo (como en libros o páginas web). 27 En tercer lugar, el
28
lenguaje proporciona una red social interactiva y marca nuestro lugar dentro de ella.
A menudo utilizamos el lenguaje como acciones en sí mismas. 29 Una persona que dice “Sí,
quiero” en su boda se compromete a cumplir un acuerdo contractual específico. Como señala
, , un matrimonio es un contrato entre tres
Orson Scott Card en su novela Speaker for the Dead
partes: las dos personas que se casan y la comunidad que acepta tratarlas como casadas. 30 El
lenguaje
también puede utilizarse para construir sobre sí mismo: una persona puede proporcionar parte
de la respuesta y otra puede construir sobre
31ella.
Ésta es la mal llamada “sabiduría” del grupo, que no es
tanto sabiduría (los grupos pueden ser muy imprudentes) sino más bien un proceso positivo de
retroalimentación del conocimiento.32 Uno de los principales avances que condujeron a la revolución
científica y a nuestro mundo moderno fue el desarrollo de la revista científica.

A
En uno de los desastres más extraños que he presenciado, la política se ha convertido en una cuestión
deportiva sobre quién gana, en lugar de una cuestión política sobre qué es lo correcto. Esto ha llevado al tribalismo
político, en el que el líder de un partido puede decir públicamente que está más interesado en que el líder del
otro partido pierda la presidencia que en solucionar los problemas que enfrenta su24país.
Machine Translated by Google

208 La condición humana

En el siglo XVII. B
Un artículo científico informa sobre un único resultado o hallazgo y, aunque generalmente es
una historia completa, no tiene por qué responder por completo a todas las preguntas que puedan surgir. Antes
de las revistas científicas, la ciencia se informaba en libros y monografías, que requerían décadas para escribirse.
Esto significaba que otros científicos no podían seguir el trabajo de uno hasta que estuviera completo. Al
proporcionar un medio para informar sobre una respuesta parcial, las revistas científicas permitían a los científicos
indicar a otros científicos la dirección correcta, poner un solo ladrillo en el edificio de la ciencia en lugar de tener
que construir un edificio entero por sí solos.

La otra cosa que el lenguaje puede hacer es señalar. El lenguaje nos permite coordinar nuestras acciones.
33
objetivos y coordinar nuestra atención. obtener Puede señalar una dirección, identificar un peligro, un objetivo.
un resultado. El nivel en el que otros animales pueden rastrear referentes aún es objeto de debate, pero no
parecen rastrearlos tan fácilmente como los humanos. Por ejemplo, los humanos somos el único simio con
esclerótica blanca, lo que permite a los demás saber dónde estamos mirando.
34 Gran parte de nuestra interacción social se basa en saber dónde está la otra persona 35 (Por
mirando. Tomemos, por ejemplo, la importancia del contacto visual en una conversación. Saber supuesto,
dónde está mirando alguien no siempre es algo bueno, como lo sabe cualquier mariscal de campo de la NFL
interceptado).
Sin embargo, fundamentalmente, una de las mayores diferencias entre los humanos y otros
36
Los animales se encuentran en lo que tradicionalmente se ha llamado Jane Goodall observó la sociología
moralidad . La ética en sus chimpancés, una madre y su hija (llamadas Passion y Pom) desarrollaron un
procedimiento caníbal para atacar a las nuevas madres y sus bebés, donde una de ellas distraía a la nueva
madre y la otra atacaba y mataba al bebé. 37 Si una de ellas

El macho grande estaba en la zona, él defendería a la nueva madre y al bebé, pero los machos no atacaron a
Passion y Pom fuera del contexto de su crimen. Los humanos no toleran a esos sociópatas.
38

Todavía no se sabe si la diferencia es un salto cualitativo (un cambio de tipo que se puede separar
claramente) o simplemente el efecto repetido de pequeños cambios cuantitativos (cambios de nivel o profundidad).
Sin embargo, algo es diferente. Las termitas pueden construir montículos, y otros animales pueden construir
nidos de increíble complejidad, pero esos montículos no son ciudades a escala de Nueva York, Tokio o
Alejandría. Los chimpancés pueden luchar en guerras, pero esas guerras no incluyen ametralladoras, tanques o
bombas nucleares. Los pájaros jardineros pueden crear arte, pero ese arte no se difunde ni se discute entre
millones de pájaros jardineros en todo el mundo. Los babuinos pueden vivir en grupos, pero esos grupos no se
agregan como amigos en Facebook.

Se han producido debates fascinantes sobre cuán inteligentes son algunas especies.
Los elefantes tienen sociedades altamente complejas, calculan expectativas sobre la disponibilidad de
fruta y agua en función de patrones climáticos recientes y recuerdan a sus muertos durante años . 39 Los
las ballenas
monos vervet mienten acerca de atacar a los depredadores para escapar de los agresores. 40 Y

B La primera revista científica fue Philosophical Transactions of the Royal Society , que ha estado
publicando artículos científicos desde 1665, incluidos los primeros informes científicos de Newton, Darwin y otros.
C Por supuesto, es discutible si esto es bueno o no. Como señala Douglas Adams en su clásico La guía
del autoestopista galáctico , “el hombre siempre había asumido que era más inteligente que los delfines
porque había logrado mucho (la rueda, Nueva York, guerras, etc.), mientras que los delfines lo único que
habían hecho era jugar en el agua y divertirse. Pero, a la inversa, los delfines siempre habían creído que
eran mucho más inteligentes que el hombre, precisamente por las mismas razones”.
Machine Translated by Google

¿Qué nos hace humanos? 209

y los delfines cantan canciones increíblemente complejas que dependen de sus interacciones culturales y sociales.
41
Aunque algo puede ser diferente en los humanos, las cosas que fundamentalmente nos
hacen humanos, nuestro lenguaje, nuestras mentes y nuestros sistemas de toma de decisiones, al igual
que nuestros cuerpos físicos, comparten puntos en común con nuestra naturaleza animal y derivan de ella.
En los próximos dos capítulos exploraremos dos de esas singularidades: la moralidad y la conciencia.

Libros y artículos para lectura adicional •

Jane Goodall y Hugo van Lawick (1971/1988/2000). A la sombra del hombre .

Boston: Houghton Miffl en • .
Jane Goodall (1990). A través de una ventana . Boston: Houghton Miffl en • .
Frans de Waal (1982/2000). La política de los chimpancés: poder y sexo entre los simios .
Baltimore, MD: Johns Hopkins Press. •
Frans de Waal (2001). El simio y el maestro del sushi: reflexiones culturales de un
primatólogo . Nueva York: Basic Books.
• Robert M. Sapolsky (2001). A Primate's Memoir . Nueva York: Touchstone. •
Michael Tomassello (2005). Construir un lenguaje: una teoría basada en el uso de la
Adquisición del lenguaje . Cambridge, MA: Harvard.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

La ciencia de la moral

El miedo se apodera de una nación.

La destrucción de los bárbaros en las puertas

no es comparable con la destrucción
de los bárbaros dentro.

En gran parte del debate actual, se dice que la moral está fuera del
ámbito de la ciencia porque la ciencia es descriptiva, no prescriptiva.
En pocas palabras, esto significa que la ciencia no puede decirnos qué
hacer. Aunque sin duda existe una diferencia clara e importante entre
descripción y prescripción, las implicaciones de la ciencia de la toma de
decisiones para la moral son más complejas de lo que parece a primera vista.

Descripción y prescripción

Todo el mundo está de acuerdo en que existe una diferencia filosófica fundamental entre descripción
y prescripción . En las famosas palabras de David Hume, hay una diferencia entre la
“debería ser”). 1 descripción y lo que sucederá. (Si dejamos de lado ese pesado “es” y
(Si la piedra cae sobre tu pie, te dolerá.) La receta es lo que debes hacer. (¡No dejes caer esa piedra
sobre tu pie!)
Esta distinción es muy clara en la medicina moderna. La descripción es el efecto del tratamiento
(los antibióticos son ineficaces contra los virus, las bacterias evolucionan en respuesta a los
antibióticos). La prescripción es lo que debemos hacer para tratar la enfermedad (si tienes una
infección bacteriana, los antibióticos son una buena idea, pero si tienes una infección viral, no uses
antibióticos porque solo estás ayudando a que las bacterias del mundo desarrollen resistencia a ellos).
La ciencia es fundamentalmente descriptiva. La ciencia es un método para determinar la causalidad.
A Necesitamos un término diferente.
Estructura del mundo a través de la predicción y la replicación.

A Las complejas cuestiones de la sociología de la ciencia y de si la ciencia funciona mediante la refutación explícita no son
2
O bien, mediante la construcción de marcos importantes para el debate aquí.
integrados, existen muchos libros sobre este tema. Mi favorito es Just a Theory , de Moti BenAri. En cualquier
caso, digamos simplemente que, a largo plazo, nuestro control del mundo ha mejorado porque las teorías
científicas se han convertido en descripciones más precisas de la realidad a lo largo de los siglos.

211
Machine Translated by Google

212 La condición humana

sobre cómo tomar decisiones prescriptivas entre individuos y grupos que están en desacuerdo.
B
Éstas son cuestiones de política y el mejor término, creo, es política . Decir que las decisiones
prescriptivas son cuestiones fundamentalmente políticas no implica que dependan de la afiliación
partidaria de uno (política con P mayúscula) o de lo específico de lo que se escribe en las leyes (la
moralidad no es legalidad); estamos hablando de política con p minúscula: ¿cómo interactúan los
humanos con otros humanos y con sus sociedades? Como veremos a continuación, los humanos se
organizan espontáneamente en estructuras políticas con p minúscula para manejar sus interacciones
3
sociales, y gran parte de esa política con p minúscula son construcciones sociales no escritas.
Como veremos, el papel de la política con p minúscula se hace evidente cuando no estamos de
acuerdo sobre los objetivos. Si un niño quiere jugar al baloncesto con su padre al aire libre y el otro
quiere jugar a un juego de ordenador con su padre dentro, tiene que haber alguna negociación para
establecer una distribución justa del tiempo del padre. De manera similar, una empresa puede denunciar
las normas que le impiden abrir nuevas tiendas y nuevos mercados, mientras que otros exigen esas
normas para garantizar un principio deseado a nivel local. O puede ser necesario tomar una decisión
sobre si se debe arriesgar a buscar petróleo en zonas frágiles de cría de camarones. Obsérvese que
en estos ejemplos he sido muy cuidadoso para no hacer ninguna afirmación sobre lo que está bien y lo
que está mal; sólo he mostrado ejemplos en los que los objetivos difieren y se requiere negociación. Lo
que está bien y lo que está mal en cada uno de estos ejemplos probablemente dependerá de los
detalles de la situación. Por ejemplo, hay una gran diferencia si esas normas impiden a la empresa
verter residuos tóxicos en el agua potable de una ciudad vecina o si esas normas establecen que sólo
los blancos pueden ser propietarios de empresas.
La afirmación de que los objetivos difieren no implica que ambas partes sean moralmente
equivalentes (los miembros de un bando pueden decir que su objetivo es exterminar a todas las
personas de una determinada etnia, mientras que el otro bando puede decir que quiere que ambos
vivan en paz). De manera similar, la afirmación de que se requiere negociación no significa que haya
que llegar a un acuerdo: en la Guerra Civil estadounidense y la Segunda Guerra Mundial, la
“negociación” entre dos códigos morales opuestos (esclavitud o no, fascismo y genocidio o no)
implicaba que las dos partes libraran una guerra.
Hay tres literaturas que han intentado reivindicar el control del magisterio prescriptivo:
Teoría de la moral: religión, filosofía y economía.

Religión

En la separación entre “ser” y “debería ser”, la moral se considera a menudo como competencia de la
4
religión y la filosofía. Stephen Jay Gould defendió célebremente lo que llamó “NOMA”,
o magisterios no superpuestos , y trató de definir la diferencia entre ciencia y religión como
“magisterios” diferentes (diferentes reinos del pensamiento).
La religión podría seguir centrándose en lo que deberíamos hacer, mientras que la ciencia podría seguir
centrándose en lo que sucede cuando hacemos algo. La religión podría centrarse en el significado, mientras
que la ciencia podría centrarse en el mundo físico. La religión podría centrarse en el por qué , mientras que la
ciencia podría centrarse en el cómo .

B
Estoy en deuda con Peter Collins, de la Universidad de Salford, cuya presentación en una pequeña conferencia
organizada por Don Ross en 2007 aclaró esta distinción con una frase sencilla y sorprendente: “La ciencia trata de lo
que sucede cuando hacemos algo. La política trata de lo que deberíamos hacer, dado que no estamos de acuerdo
sobre nuestros objetivos”.
Machine Translated by Google

La ciencia de la moral 213

Aunque muchas personas han argumentado que la moralidad es competencia de la religión, yo

De hecho, la religión también es descriptiva, no prescriptiva.
do
Aquí se argumenta que esto es
incorrecto. La prescripción de la religión se basa en la creación de una teoría descriptiva en la que la
prescripción se vuelve obvia: Dios dice que esto es lo que debes hacer. Si lo haces, serás recompensado.
La recompensa suele ser una especie de cielo, mientras que el castigo es el infierno. 6 (Incluso las
religiones sin dioses describen la recompensa y el castigo por el comportamiento correcto, como las
ideas de que el comportamiento apropiado permitirá a uno alcanzar el nirvana, o que las buenas
acciones conducirán a la reencarnación en una vida mejor en el siguiente ciclo). Pero también se puede
sugerir que la recompensa ocurre en esta vida, como el movimiento de la teología de la prosperidad que
surgió recientemente en los Estados Unidos.

Obsérvese que se trata fundamentalmente de una afirmación descriptiva: si haces lo correcto,

serás recompensado. El hecho de que esto sea descriptivo se puede ver en la famosa apuesta de
Pascal en la que tiene que decidir si cree o no en Dios, y decide hacerlo porque el coste de creer
si Dios no existe es pequeño, mientras que el coste de no creer si Dios existe es alto.
7 La apuesta se basa en la exactitud de la descripción. La prescripción
surge del objetivo de alcanzar la recompensa (el Cielo) y evitar el castigo (el Infierno).

La separación entre prescripción y religión se puede ver en George Bernard Shaw, donde
y el Superhombre preobra , varios de los personajes rechazan el objetivo (rechazando el Hombre
la prescripción pero no la descripción) y deciden que prefieren ir al Infierno que sufrir en el Cielo.
, , Lucifer dice la famosa frase: “Es mejor
De manera similar, en El Paraíso Perdido de Milton
gobernar en el Infierno que servir en el Cielo”. Podemos decir que estas personas están
equivocadas, que han tomado las decisiones equivocadas (en Milton eso está claro, en Shaw no
tanto), pero el hecho de que un cambio en los objetivos cambie la moralidad implícita en la creencia
religiosa deja en claro la inadecuación de la religión como magisterio prescriptivo.
Algunos códigos morales no sobrenaturales se mencionan a menudo bajo el epígrafe de
8
como el confucianismo, el taoísmo y el utilitarismo. religión. Sin embargo, estos son en
realidad ejemplos de funciones de optimización: el objetivo declarado del confucianismo es
maximizar la estabilidad dentro de una sociedad, mientras que el taoísmo apunta a la "paz interior"
y la armonía con el entorno, y el utilitarismo intenta maximizar la felicidad total. Se trata de
afirmaciones prescriptivas: definen un objetivo a optimizar y dicen que "debemos" hacer cosas
que maximicen ese objetivo. El análisis de las funciones de optimización nos lleva primero a la
filosofía y luego a la economía.

Filosofía

Históricamente, los filósofos han estado buscando un imperativo categórico, una declaración simple
que pueda usarse para definir la moralidad a partir de los primeros principios.9 El ejemplo clásico es, por
supuesto, la Regla de Oro: “Haz a los demás lo que te gustaría que te hicieran a ti”, con versiones en la Torá, el Nuevo Testamento y las Analectas de

Confucio. 10

C Estas afirmaciones no pretenden dar a entender que la religión no sea una construcción humana útil. La
religión podría servir para muchos propósitos útiles, entre ellos, como consuelo o como medio para organizar
grupos humanos con el fin de reforzar el altruismo dentro del grupo. La religión también puede servir como una
construcción psicológica para imponer la moralidad y fomentar el autocontrol, pero el contenido de esa moralidad y
los objetivos de ese autocontrol derivan de mecanismos no religiosos. 5
Machine Translated by Google

214 La condición humana

La complejidad de esto es interesante porque las versiones difieren en términos de si están redactadas
en términos positivos ( Haz a los demás lo que te gustaría que te hicieran a ti ) o negativos ( No hagas a
los demás lo que no te gustaría que te hicieran a ti ).
Se han propuesto muchos imperativos categóricos de este tipo, pero, como señala Patricia, siempre
Churchland en su libro BrainTrust , ha sido posible encontrar situaciones extremas que los
debilitan. Aplicar la regla a situaciones reales exige excepciones, y terminamos con una mezcolanza de
reglas y regulaciones. Por ejemplo, la afirmación de que deberíamos aumentar la felicidad total en el
mundo sugiere que uno tendría que sacrificar la comida de sus hijos para alimentar a los niños
hambrientos de otros lugares. Si bien podemos celebrar a alguien que trabaja incansablemente por los
niños hambrientos, no hay muchas personas que estén dispuestas a dejar que su propio hijo muera de
hambre por el de otro, incluso por otros dos.
De la misma manera, la afirmación de que debemos hacer a los demás lo que nos gustaría que nos
hicieran a nosotros si fuéramos esa otra persona conduce a situaciones problemáticas frente a prejuicios
fanáticos. Imaginemos a alguien que dice que preferiría morir antes que vivir parapléjico.
Obviamente, no querríamos que esa persona cumpliera sus deseos imaginarios con otra persona
paralizada. De hecho, los pacientes parapléjicos (e incluso tetrapléjicos) que quedan paralizados a
causa de un accidente tienden a volver a los mismos niveles de felicidad que tenían antes del
accidente. 11 (La felicidad se reajusta alostáticamente a la nueva situación.)
De nuevo volvemos a la cuestión política de ¿cómo negociamos diferentes objetivos?
John Rawls propuso una elegante propuesta basada en su teoría de la ignorancia de la posición original .
12 Rawls sugiere que las leyes y la justicia deben definirse de tal manera que sean las
leyes que a uno le gustaría ver, dado que no sabe dónde estará en la sociedad antes de escribir las leyes.
Por lo tanto, no querría hacer una ley que apoye la esclavitud porque no sabría de antemano si va a
nacer esclavo o libre. La propuesta de Rawls es una descripción filosófica de una solución política. Afirma
explícitamente que su objetivo es partir del supuesto de una democracia constitucional, del supuesto de
que todos los hombres (todas las personas) son creados iguales.

El problema de esta teoría es, por supuesto, que la gente no siempre está dispuesta a asumir que
podría haber empezado en cualquier parte de la sociedad. Las aristocracias, el seleccionismo religioso
y las diferencias en el talento individual pueden llevar a una renuencia a aceptar la premisa de Rawls. Las
personas no tienen el mismo talento. Algunas personas son más inteligentes que otras.
Algunas personas son más fuertes, otras son más reflexivas y otras más emocionales. Aunque estas
diferencias están influidas por la genética, son claramente una interacción entre esa genética y las
13
influencias sociales.
Como lo señaló Stephen Jay Gould en A Mismeasure of Man , Estos efectos genéticos son
notoriamente difíciles de medir con precisión, son peligrosamente susceptibles a las influencias culturales
y tienden a verse eclipsados por la variabilidad de esas influencias culturales. Sin embargo, es fácil para
un individuo exitoso (que generalmente es quien escribe las leyes) mirar a un individuo fracasado y decir
que la razón de la diferencia en el éxito es un fracaso moral. La propuesta de Rawls depende
fundamentalmente de la empatía, la capacidad de ponerse en el lugar del otro (un componente crítico de
los códigos morales tanto religiosos como filosóficos 14 ).
Puede resultar difícil decir: “Si no fuera por la gracia de Dios, no habría existido”. Las personas
15
amorales tienen dificultades explícitas con la empatía.
Una de las cosas que veremos más adelante, cuando
examinemos directamente lo que hace la gente, es que las personas tienden a estar menos dispuestas a
compartir si creen que han trabajado para obtener su recompensa. 16 Incluso si creemos en la premisa de
Rawls, todavía necesitaremos entender cómo negociar con individuos que no la creen.
Machine Translated by Google

La ciencia de la moral 215

Economía: Los peligros de las funciones de optimización

Un campo que, de hecho, ha hecho afirmaciones “científicas” sobre la moralidad es la economía. Estas
afirmaciones han sido implícitas más que explícitas, pero debido a nuestra separación entre descriptivos
y prescriptivos, una cantidad notable de resultados económicos son prescriptivos más que descriptivos.
Esto se debe a que están definidos bajo una función de optimización.
La función de optimización más comúnmente utilizada en economía es la de eficiencia , que se
17
define como una economía sin oportunidades perdidas. Imaginemos que el país A
puede cultivar zanahorias por 10 dólares el bushel y apio por 20 dólares el bushel, mientras que al país
B le cuesta 20 dólares cultivar un bushel de zanahorias, pero sólo 10 dólares cultivar apio. Esto significa
que si cada país cultiva todas sus propias verduras, los dos países están desperdiciando dinero.
Son ineficientes . Sería más eficiente que el país A cultivara sólo zanahorias y que el país B cultivara
sólo apio, y que el país A intercambiara algunas de sus zanahorias con el país B por parte del apio
cultivado en el país B. Esto sería más eficiente incluso si el transporte de zanahorias y apio a través de
la frontera tuviera un pequeño coste. Si el transporte costara 1 dólar por fanega, entonces el país A
podría cultivar zanahorias por 10 dólares y apio por 11 dólares. Del mismo modo, el país B podría
cultivar apio por 10 dólares y zanahorias por 11 dólares.
Los economistas suelen analizar esto en términos de costes monetarios, pero obtenemos los mismos
resultados si pensamos en términos de fuerzapersona, cuántas horas se necesitan para lograr algo. El
país A cultiva zanahorias con menos trabajo que el país B, mientras que el país B cultiva apio con
menos trabajo que el país A. Juntos, pueden producir más alimentos con menos trabajo. Ésta es la
ventaja de la especialización.
Todo esto suena muy bien, pero supone que el objetivo de una economía es minimizar las
“oportunidades perdidas”. El efecto de este acuerdo de libre comercio entre los países A y B es que
los productores de apio del país A están ahora sin trabajo, al igual que los productores de zanahorias
del país B. Si su objetivo es maximizar los empleos, entonces este acuerdo es malo. El problema es
que los economistas utilizan palabras cargadas de moralidad como eficiencia o racionalidad .
18;D Un coche ineficiente que consume poco combustible es obviamente algo malo. ¿Una
economía ineficiente también es algo malo?
La suposición de que la eficiencia es el único objetivo es extraña. 20; mi A veces la
ineficiencia es un problema obvio, como cuando los costos y los precios de compra están demasiado
desequilibrados y la economía se paraliza, o cuando la corrupción elimina la producción económica
22
de una economía; pero, como sucede con un automóvil que consume poco combustible, la eficiencia
es en realidad solo un elemento de una función de optimización más compleja . 23

Hemos discutido el uso peligroso de la terminología de “racionalidad” e “irracionalidad” a lo largo de este libro, en particular la idea de

que existe un yo racional tratando de controlar a un otro irracional .

Muchos filósofos y psiquiatras e incluso muchos científicos cognitivos todavía comparten esta visión. 19 (Véase la

discusión en los capítulos 8 y 15.) Como espero haber dejado claro, me siento incómodo con este rechazo de los sistemas de toma de

decisiones no conscientes por ser irracionales.

mi
¿Por qué los economistas se han aferrado a la “eficiencia” como meta? Algunos han argumentado que es porque
esto crea problemas matemáticamente solucionables. Me parece extraña esta conclusión porque me parece que uno
podría definir con la misma facilidad otras funciones de optimización. Algunos han argumentado que esto se debe a un
ciclo de retroalimentación inherente a la enseñanza temprana a los estudiantes de que la eficiencia es la única función
de optimización que importa. Me pregunto en qué medida depende del interés propio de ciertos individuos, ya que este
21
argumento de la eficiencia crea ganadores y perdedores en una economía.
Machine Translated by Google

216 La condición humana

La gente compra coches ineficientes porque les gustan las características de seguridad o la capacidad de
transportar objetos grandes (como muchos niños) o por su estilo y su apariencia.
De hecho, estas descripciones económicas de la maximización de la eficiencia son descripciones
deficientes de lo que los seres humanos realmente hacen, en particular a nivel microeconómico (individual),
y requieren muchos componentes adicionales para describir adecuadamente el comportamiento. 24
A nivel microeconómico, estas cuestiones de interacciones interpersonales pueden enmarcarse en el
contexto de la teoría de juegos , 25 que supone que dos personas están jugando un juego.
Se supone que este juego se especifica como una secuencia de opciones (acciones y sus consecuencias)
que conducen a un conjunto final de pagos. Cada situación es un nodo en un árbol, y cada acción lleva a los
dos jugadores de un nodo a otro. (Observe cómo este concepto de situación y acción refleja las definiciones
de toma de decisiones que hemos estado utilizando a lo largo de este libro). Un ejemplo clásico sería el juego
del tres en raya (Figura 23.1). Al comienzo, la situación tiene un tablero vacío. El jugador X tiene nueve
opciones. Cuando el jugador X pone una X en el tablero, la situación se vuelve un poco más complicada.
En uno de los cuadrados, el jugador O tiene ahora ocho opciones. Al final del juego, hay tres posibles pagos:
el jugador X gana y O pierde, el jugador O gana y X pierde, o hay un empate. (Se puede demostrar que si
ambos jugadores juegan de manera óptima, el tres en raya siempre terminará en un empate). La estrategia
se define como el conjunto de elecciones que un jugador haría en cada punto de la secuencia. (¿Qué debería
hacer el jugador X al comienzo del juego? [El centro es óptimo.]
¿Qué debe hacer el Jugador O cuando el Jugador X tiene dos seguidos? [Bloquearlo.])
Si ninguno de los jugadores puede mejorar su estrategia cambiando algo, entonces los jugadores están
en un equilibrio de Nash . 26;F El problema con esto es que no funciona en los juegos
cooperativos. (La prueba de optimalidad de Nash técnicamente era solo para juegos no cooperativos de
juegos cooperativos de prisioneros
suma cero ).. 28 Como veremos más adelante, en los juegos cooperativos (como los

incógnita

... ... ...

incógnita
incógnita

incógnita

Oh Oh Oh
... ... ...
incógnita incógnita
incógnita incógnita

...
Oh OOO
Oh Oh Oh BUEY
...
incógnita

Oh incógnita incógnita

Oh incógnita incógnita ... incógnita incógnita Oh

XX
Oh incógnita incógnita

incógnita

X gana juego de empate

O gana

Figura 23.1 Teoría de juegos y tres en raya. Cada configuración del tablero de tres en raya es un estado .
La acción de cada jugador cambia el estado. El tres en raya es un juego de suma cero:
si el jugador X gana, el jugador O pierde, y viceversa. Compárese con el juego del dilema del
prisionero (Figuras 23.2 y 23.3).

El equilibrio de Nash debe su nombre a John Nash, el famoso matemático que lo descubrió como parte de
su tesis doctoral en 1950. Tanto las matemáticas de Nash como sus dificultades con la esquizofrenia se
27
describieron elocuentemente en el libro y la película Una mente maravillosa .
Machine Translated by Google

La ciencia de la moral 217

dilema , más abajo), un jugador puede mejorar sus ganancias al no cooperar, pero si ambos jugadores no
cooperan, entonces ambos lo hacen peor. De hecho, como veremos más adelante, las personas son
notablemente cooperativas, incluso cuando se establece explícitamente que los juegos solo se jugarán una
vez y cuando nadie sepa quién eres, de modo que no hay oportunidad de que la reciprocidad afecte la toma
29
de decisiones.

Entonces, ¿qué hacen realmente los humanos?

El resto de este capítulo planteará la pregunta ¿Qué hacen los humanos en sus interacciones?
En lugar de abordar la cuestión prescriptiva, dedicaré el resto de este capítulo a abordar lo que sabemos
sobre el comportamiento humano (descriptivamente). Así como conocer la descripción correcta mejora la
prescripción en medicina (véase el ejemplo anterior de los antibióticos), podemos esperar que una mejor
descripción del comportamiento humano nos ayude a saber qué prescripciones son posibles.
Así como en el Capítulo 18 dejamos de lado la cuestión de si tomar drogas es correcto
GRAMO

o incorrecto y, en su lugar, preguntamos ¿por qué la gente toma drogas? y ¿cómo podemos cambiar eso (si
queremos hacerlo)?, voy a dejar de lado la cuestión de qué es moral y, en su lugar, voy a preguntar ¿qué
hacen las personas cuando se enfrentan a cuestiones morales (sociales, de interacción personal)?
En esencia, lo que llamamos “moralidad” se refiere a nuestras interacciones con otras personas (y con
otras cosas, como nuestro entorno). Nuestras interacciones diarias se basan en una confianza social
subyacente (civilización). 32 Como se señaló en el capítuloanterior (donde analizamos lo que nos hace
humanos), estos grupos se organizan espontáneamente, ya sea para la protección mutua, para la estabilidad
social o porque los grupos bien organizados superan a los grupos mal organizados. En pocas palabras, si
dos ejércitos se enfrentan y uno trabaja en conjunto, pero el otro está formado por miembros egoístas, está
bastante claro qué grupo tendrá más probabilidades de ganar la batalla. 33

¿Qué significa eso para la moralidad? ¿Cómo puede la ciencia abordar la moralidad? ¿Qué significa
estudiar la moralidad? Sabemos que los seres humanos pueden ser gloriosamente morales (Martin Luther
King, los Freedom Riders, los soldados que sacrifican sus vidas por su país, los bomberos que corren hacia
un edificio en llamas, las donaciones a la caridad). Sabemos que los seres humanos pueden ser gloriosamente
inmorales (los nazis, el KKK, el genocidio en Ruanda, Serbia y Darfur). La primera pregunta que tendremos
que hacernos es ¿qué hacen los seres humanos cuando se enfrentan a una situación moral?
¿Qué hacen los seres humanos y cuáles son los parámetros que determinan sus decisiones de acción? Si
comprendemos cómo piensan los seres humanos sobre la moralidad, podremos decidir si queremos cambiarla
y, en caso afirmativo, cómo hacerlo.

Estudios tempranos: La identificación del mal

Fundamentalmente, la moralidad tiene que ver con nuestra interacción con los demás. Al igual que con las
otras cuestiones que hemos abordado en este libro, para estudiar la moralidad necesitamos una

GRAMO

Es muy importante no caer en el error de la sociobiología. 30 El hecho de que algo sea descriptivamente cierto no

debe interpretarse como una indicación de que sea prescriptivamente bueno. Como se señala en la nota D del capítulo 13, si bien es cierto

que el esfuerzo que se requiere para la reproducción cambia la dinámica del riesgo y la inversión y, por lo tanto, explica muchas dinámicas

humanas observadas entre hombres y mujeres y la dinámica (invertida) de los caballitos de mar (donde el macho empolla los huevos en

una bolsa), 31 no se debe tomar este hecho como una prescripción de los roles masculinos y femeninos apropiados en la sociedad nosotros

moderna.
Machine Translated by Google

218 La condición humana

Una forma de tomar esas interacciones y llevarlas al laboratorio, donde podemos usar experimentos controlados
para estudiarlas. Los primeros intentos de estudios de moralidad se basaron en juegos de rol, donde los
cómplices pretendían estructurar el mundo de tal manera que impulsara ciertas conductas. Dos experimentos
tempranos muy famosos sobre moralidad fueron el experimento de obediencia de Milgram y el experimento de la
34
prisión de Zimbardo.
En el experimento de Milgram, se le dijo a un sujeto que debía desempeñar el papel de “maestro” mientras
que otro desempeñaba el papel de “alumno”. (El sujeto pensaba que el alumno era otro sujeto que también
participaba en el experimento y no sabía que el alumno era un actor). Los dos estaban separados por una pared,
de modo que no podían verse. El maestro le hacía preguntas al alumno (pares de palabras arbitrarios que el
alumno tenía que memorizar). Los “alumnos” daban respuestas incorrectas a muchos de los pares.

Cada vez que el alumno se equivocaba, el profesor tenía que presionar un botón que le daba una descarga
eléctrica. A medida que el alumno cometía más errores, el voltaje aumentaba hasta el punto de que el alumno
gritaba, golpeaba la pared, suplicaba que pararan y, finalmente, se quedaba en silencio. En realidad, no había
descargas eléctricas. El "alumno" era un actor que interpretaba un papel. Pero las descripciones de los sujetos
(que interpretaban el papel de "profesor") dejan muy claro que creían que el "alumno" era un actor que interpretaba un papel.
Los shocks fueron reales.

El experimento de Milgram suele interpretarse como una demostración de la falta de voluntad humana para
cuestionar a la autoridad; sin embargo, aunque muchos sujetos continuaron aplicando descargas eléctricas a
niveles máximos, muchos de ellos pidieron parar y continuaron sólo después de que se les aseguró que estaba
bien, incluso era necesario, continuar. Otros sujetos se negaron a aplicar descargas eléctricas más allá de ciertos
niveles. Durante los años siguientes, Milgram realizó docenas de variaciones del experimento tratando de
identificar qué haría que las personas fueran más o menos propensas a continuar. Las cifras variaron
drásticamente en función de la conexión física y emocional entre el maestro y el alumno y de la autoridad
inherente al experimentador que aseguraba al sujeto que los experimentos eran necesarios. Reexaminaciones
recientes de los datos originales sugieren que la garantía de que los experimentos eran "necesarios" era una

35
El componente crítico que impulsa la voluntad de los sujetos de continuar es la Lo más probable es que se trate de una combinación

presencia de ambos: una figura de autoridad que pueda convencer a uno de que los crímenes son necesarios
para una causa importante. Esta es una buena descripción de muchos de los peores males perpetrados por los
humanos entre sí (genocidio para "purificar la raza", tortura para "extraer información", etc.). La clave del
experimento de Milgram puede haber sido una figura de autoridad que afirma que el "experimento requiere que
continúes" e implica que no continuar arruinaría un importante esfuerzo científico.

En el experimento Zimbardo, a dos grupos de estudiantes universitarios se les asignaron arbitrariamente los
papeles de guardias y prisioneros en una cárcel simulada en el sótano de un edificio de psicología de la Universidad
de Stanford. En el transcurso de menos de una semana, los guardias se volvieron arbitrariamente violentos,
abusivos e incluso sádicos. Fue tan malo que el experimento se detuvo después de solo seis días, más de una
semana antes de lo previsto. El experimento Zimbardo suele considerarse una demostración de cómo las
estructuras de poder impulsan la deshumanización y el maltrato.

El problema con ambos experimentos es que abordan extremos y son experimentos únicos. Son muy difíciles
de reproducir y de utilizar para llegar a los mecanismos subyacentes de la conducta humana. Sin embargo,
ambos efectos ocurren claramente en la vida real. Por ejemplo, los casos recientes de tortura en la prisión de
Abu Ghraib son ejemplos tanto del efecto Milgram como del efecto Zimbardo. (Las investigaciones limitadas que
se han realizado sugieren que los soldados fueron empujados a crear un impacto negativo en la sociedad).
Machine Translated by Google

La ciencia de la moral 219

situaciones por figuras de autoridad del interrogador y luego fueron más allá y se deleitaron con la tortura
que estaban haciendo a medida que la autoridad moral se deterioraba. 36 )
Aunque son sumamente importantes, los estudios de Milgram y Zimbardo nos dicen lo que tememos
que ya sabíamos: los humanos a menudo son susceptibles a la autoridad (en particular, a una autoridad
camuflada en una causa), y los humanos a quienes se les da poder a menudo hacen un mal uso de él.
Pero la mayoría de las personas no viven sus vidas en estos extremos. Estos estudios, y los horrores de
Ruanda o Abu Ghraib, son extremos. Ciertamente, estas situaciones ocurren, pero la pregunta con
situaciones como los experimentos de Milgram y Zimbardo (o Ruanda, el Holocausto, Nanking, Abu
Ghraib) nunca es : ¿Están equivocados? Obviamente están equivocados; la pregunta es cómo evitar llegar
a ellos en primer lugar. Las contribuciones de los estudios de Milgram y Zimbardo han sido: ¿Cuándo son
susceptibles los humanos a las figuras de autoridad? ¿Qué los hace capaces de cuestionar esa autoridad?
(Recuerde que algunos sujetos en el experimento de Milgram cuestionaron al experimentador y detuvieron
el experimento y que otros sujetos estaban claramente incómodos y preguntaron si la otra persona estaba
bien y continuaron sólo después de que la figura de autoridad les aseguró que el experimento era
necesario. Un soldado estaba lo suficientemente incómodo con la situación en Abu Ghraib como para
filtrar las fotos a los medios.)
La repulsión que sentimos ante lo que es claramente malo (el abuso de niños por parte de figuras de
autoridad confiables en la Iglesia Católica o el abuso de prisioneros [incluidos niños inocentes] por parte
de soldados en Abu Ghraib o el asesinato de millones de inocentes en genocidios) identifica que el mal
existe en el mundo y que los humanos pueden hacer el mal, pero en realidad no nos ayuda a llegar a los
mecanismos de ese mal. De hecho, nuestras instituciones han demostrado su incapacidad para lidiar con
un mal de esa magnitud (por ejemplo, la incapacidad de la Iglesia Católica para llegar a un acuerdo con
los sacerdotes pedófilos, o la incapacidad del gobierno de los EE. UU. para llevar a los autores de los
incidentes de Abu Ghraib ante la justicia, o la incapacidad de las Naciones Unidas para detener los
genocidios en Ruanda, Bosnia o Darfur). El problema no es si podemos identificar el mal . Identificamos
de manera confiable el verdadero mal. El problema con el verdadero mal es lidiar con él.
yo
En nuestro
En cambio, la cuestión más difícil es la de la moralidad en nuestra vida cotidiana. En nuestra
vida cotidiana se nos dan oportunidades de hacer el bien y el mal: si damos o no un dólar a una persona
sin hogar en la calle, si copiamos o no en un examen o en nuestros impuestos. Para la mayoría de las
personas del mundo, nuestras vidas normales no se parecen ni a los horrores de Milgram ni a los de
Zimbardo. En su capítulo en el libro Moral Markets , Lynn Stout señala que pasamos la mayor parte de
nuestra vida en un “altruismo pasivo”: no golpeamos a la gente al azar en la calle ni les robamos su dinero.
38

Algunos han sugerido que esto se debe a que existen leyes y que la gente se desintegraría sin ellas,
(profundamente como se describe, por ejemplo, en el famoso libro El señor de las moscas
defectuoso y violento) de William Golding. Pero, en realidad, las comunidades pequeñas

yo
También nos gustaría abordar cuestiones humanas de justicia y decencia sin necesidad de que nuestros
laboratorios se conviertan en paisajes infernales malignos. Una de las consecuencias del experimento de Zimbardo
es que estudiar el mal es una pendiente resbaladiza. Parte de la razón por la que el experimento se detuvo
37
después de sólo seis días fue el efecto psicológico en los guardias tanto como en los prisioneros.
I
Pongo la palabra “salvajes” entre comillas porque el término se utilizó originalmente para referirse a culturas
no occidentales, no altamente tecnológicas, esencialmente “bárbaros”. La palabra “bárbaro” viene de la palabra
griega que describe el habla ininteligible de los extranjeros (que a ellos les sonaba como “bar bar”). 39 El punto
importante, sin embargo, es que los “salvajes” no eran particularmente salvajes, al igual que los “bárbaros” no eran
bárbaros (ciertamente no más que la gente “civilizada”), y vivían en comunidades con reglas (a menudo no escritas)
40
que dictaban justicia y moralidad.
Machine Translated by Google

220 La condición humana

En general no se parecen en nada a El señor de las moscas . Contienen vecinos que se ayudan entre
sí, comparten comida, con amplios ejemplos de altruismo tanto pasivo como activo. 41
Cuando vemos el auto de nuestros vecinos atrapado en la nieve (o incluso el auto de un extraño,
como sucedió afuera de mi casa durante la gran tormenta de nieve que tuvimos el invierno pasado), no
nos reímos, no disparamos a la persona y tomamos su auto, todos sacamos nuestras palas y quitanieves
y limpiamos el auto y ayudamos a la persona a regresar sana y salva a su camino.
Los bomberos, los agentes de policía y los ciudadanos comunes corren hacia el peligro para ayudar a los
necesitados. Cuando el puente 35W en Minneapolis se derrumbó durante la hora punta en agosto de
2007, arrojando automóviles al río Mississippi cerca de la universidad, nuestros primeros intervinientes
llegaron al lugar en cuestión de minutos, y los estudiantes universitarios, el personal docente y el personal
médico del hospital local corrieron a ayudar. Incluso desde un puente con tráfico en hora punta, solo
murieron 13 personas ese día, debido en gran parte al notable trabajo de los primeros intervinientes y la
42
reglas comunitarias ayuda que recibieron. Incluso los barcos piratas despiadados operaban bajo
(escritas y a menudo muy detalladas). El gancho invisible de Peter Leeson ofrece una descripción vívida
de cómo los piratas "sin ley" usaban reglas internas cuidadosamente construidas para garantizar una
comunidad viable. No vivimos en una situación de El señor de las moscas . Entonces, ¿qué es lo que
hace que las comunidades funcionen? Si no son las leyes, ¿qué es?

La justicia y la creación de comunidades A lo largo

de este libro hemos visto la importancia de descomponer el mecanismo de toma de decisiones en sus
componentes. Nos gustaría poder entender los mecanismos de la moralidad de una manera que sea
repetible y que pueda estudiarse de forma fiable en el contexto de un laboratorio. Sería realmente útil
poder estudiar las cuestiones morales de tal manera que podamos preguntar cómo el cerebro representa
estas cuestiones, tal vez estudiándolas mientras observamos la actividad cerebral mediante fMRI. Para
llegar a estas preguntas en un entorno más controlado, más científico (y menos perturbador), volveremos
a la teoría de juegos. Sin embargo, en lugar de tratar de determinar cuál es la elección óptima bajo algún
supuesto normativo (prescriptivo), examinaremos qué elecciones toman realmente los humanos. Estas
elecciones se vuelven particularmente interesantes cuando hacemos que los juegos sean de suma no
cero.
Un juego de suma cero es aquel en el que las ganancias y las pérdidas totales se cancelan. Es decir, si un jugador gana, entonces

otro debe perder. En física, la cantidad total de energía dentro de un sistema cerrado no se puede crear ni destruir. Si dos bolas de billar

chocan entre sí, y una aumenta su velocidad, entonces la otra debe disminuir su velocidad. Sin embargo, la vida no es de suma cero.

Muchos trabajos humanos requieren una enorme cantidad de entrenamiento y práctica. Preferiría pagar a un experto para que reconstruya

mi techo para que quede bien hecho en lugar de tratar de aprender a hacerlo yo mismo y probablemente hacer un trabajo mediocre. Esta

es la ventaja de la especialización. Cada persona se vuelve mejor en su tarea, capaz de producir más y mejores productos, que podemos

intercambiar entre nosotros, aumentando así la cantidad total de bienes y servicios .

servicios que tenemos en el sistema. Nuestra economía se ha vuelto más eficiente .

J Aunque antes me quejé de que utilizar la eficiencia como único criterio de optimización es un problema, esto no
significa que la eficiencia sea algo malo en sí misma. La especialización puede permitir que las personas se concentren
en los trabajos que prefieren y, al mismo tiempo, mejorar la eficiencia. Hay muchas cosas en nuestro mundo moderno
(como la computadora portátil en la que estoy escribiendo este libro) que nunca existirían si todos tuvieran que cultivar
sus propios alimentos y construir sus propias herramientas.
Machine Translated by Google

La ciencia de la moral 221

Por lo tanto, necesitamos experimentos de laboratorio en los que tengamos juegos de suma distinta de cero.
Se han desarrollado varios juegos de este tipo para estudiar cuestiones morales. 43 El dilema del
prisionero más simple es el que, que introduce la cuestión de la cooperación y la deserción en
analizamos. En este dilema, un par de ladrones han sido atrapados robando en una tienda, pero la
policía no puede encontrar el botín escondido. Sin el botín, la policía sólo tiene pruebas suficientes
para acusarlos de allanamiento. Pero si la policía puede conseguir que un prisionero confiese,
puede condenar al otro. La policía le dice a cada uno que si confiesa y el otro no, le lanzarán la ley
al otro y dejarán libre al prisionero que confiesa. Si ambos confiesan, entonces los prisioneros
recibirán sentencias leves (presumiblemente porque la policía no necesitará ir a juicio). Básicamente,
podemos escribir esto como una tabla con cuatro condiciones: si el jugador 1 confiesa pero el
jugador 2 no, entonces el jugador 1 recibe 0 años pero el jugador 2 recibe 10 años. De manera
similar, si el jugador 2 confiesa y el jugador 1 no, el jugador 2 recibe 0 años, pero el jugador 1 recibe
10 años. Si ninguno confiesa, reciben 1 año. Si ambos confiesan, reciben 5 años (Figura 23.2).

La clave de la estructura de este juego es que cooperar con K cuando el otro jugador deserta
contra ti te hace quedar como un tonto y pierdes mucho. Sin embargo, si ambos jugadores desertan,
ambos pierden. Podemos escribir esto en forma positiva y negativa.
uno activo.yo En pocas palabras, imaginemos dos jugadores; cada uno puede “cooperar” o “desertar”.

Si ambos cooperan, ambos ganan $50. Si uno coopera y el otro deserta, el jugador que deserta
obtiene $80 y el otro no obtiene nada. Si ambos desertan, ninguno obtiene nada (Figura 23.3). Al
igual que con la versión negativa, la clave es que si el jugador 1 coopera, entonces es mejor que el
jugador 2 deserte que coopere, pero que ambos jugadores deserten es peor que que ambos
cooperen.
Por supuesto, la clave de una comunidad es que no solemos jugar estos juegos sólo una vez;
jugamos lo que generalmente se denomina el dilema del prisionero repetido (o “iterado”). 46
En esta versión, los dos jugadores juegan una y otra vez. Imaginemos dos comunidades que
intercambian bienes entre ellas. Tu comunidad cultiva trigo y la otra, fruta.
En el primer año, llevas trigo a la otra comunidad y te dan fruta a cambio. En el segundo año, te
traen fruta y les das trigo a cambio. Cada dos años, te arriesgas, llevas mucho trigo a su comunidad
donde tienen todo su

El prisionero 1 “coopera” (se El prisionero 1 tiene defectos

queda callado) (confiesa)

El prisionero 2 “coopera” (se El prisionero 1 recibe 1 año El prisionero 1 recibe 0 años
queda callado) El prisionero 2 recibe 1 año El prisionero 2 recibe 10 años
El prisionero 2 El prisionero 1 recibe 10 años El prisionero 1 recibe 5 años
deserta (confiesa) El prisionero 2 recibe 0 años El prisionero 2 recibe 5 años

Figura 23.2 El dilema del prisionero: versión negativa.

K La terminología de este ejemplo tradicional es desafortunada. Los prisioneros están cooperando con

entre ellos, no con la policía.

Comencé con esto en forma negativa porque sería un poco extraño hablar del “dilema del prisionero” con
dinero compartido. En cualquier caso, a lo largo del resto de este capítulo, basaré estos juegos en transferencias de
dinero, porque así es como se han hecho la mayoría de los experimentos. 44 Es cierto que existen diferencias en
cómo los humanos tratan las decisiones enmarcadas positiva y negativamente 45 (ver Capítulo 3), pero aún no se
sabe cómo interactúan estas cuestiones.
Machine Translated by Google

222 La condición humana

La gente podría robarte la fruta y enviarte a casa sin ella. Por supuesto, si lo hicieran, no volverías. Esto
nos lleva al simple concepto de “ojo por ojo”.
A principios de los años 1980, Robert Axelrod, un científico interesado en la teoría de juegos y la
cooperación, organizó una serie de torneos informáticos en los que los jugadores presentaban
estrategias de cooperación y deserción. 47 Cada jugador jugaría una secuencia de 200 partidas de
dilema del prisionero con cada uno de los otros jugadores. (Es decir, cada jugador jugaría un dilema
del prisionero iterado con 200 repeticiones contra cada uno de los otros jugadores). Lo que esto
significaba era que un jugador podía castigar o engañar a otro jugador. Aunque se presentaron muchas
estrategias muy complicadas, la ganadora constante fue una estrategia muy simple llamada "ojo por
ojo", presentada por Anatol Rapoport, un matemático que estudiaba la teoría de juegos. La estrategia
consistía en cooperar en la primera jugada y, a partir de entonces, hacer lo que hiciera el otro jugador.
Si el otro jugador comenzaba a desertar, el titfortat desertaría, pero mientras el otro jugador cooperara,
el titfortat cooperaría.
Una de las cosas que Axelrod descubrió en su serie de torneos es que una comunidad de
jugadores de titfortat era notablemente estable. Si uno simulaba la evolución entre los jugadores (es
decir, los jugadores con las mayores ganancias replicaban una mayor proporción de esa estrategia en
la siguiente generación, mientras que los jugadores con las menores ganancias morían), entonces el tit
fortat generalmente llenaba la población y se convertía en una población evolutivamente estable; otras
estrategias no podían entrar en la comunidad. Recuerde que el titfortat jugando contra el titfortat
ambos cooperarían. Cualquiera que desertara en su contra ganaría a lo grande una vez, pero luego
sería castigado por el titfortat y comenzaría a perder. Aunque el jugador del titfortat perdería contra
ese desertor, todavía le iría bien cooperando con los otros jugadores del titfortat, pero el desertor
perdería contra todos.
El problema con el titportat, particularmente cuando se juega contra otro jugador que también
juega con titportat, es que si hay algún error, las deserciones empiezan a propagarse hacia el futuro.
Imagínese que, una vez, cuando va a llevar su trigo a otra comunidad, es atacado por bandidos y le
roban todo el trigo. La otra comunidad cree que usted ha desertado y, haciendo caso omiso de todas
sus súplicas y explicaciones, se niega a volver a comerciar con usted. Axelrod descubrió que, cuando
se incluyen errores en el juego, la estrategia óptima era “ojo por ojo con perdón”. Incluso entre una serie
de defectos, en ocasiones el jugador intentaría una cooperación. Podría ser suficiente para que ambos
jugadores volvieran a cooperar.
La clave de todas estas cuestiones es que la cooperación entre dos jugadores produce más
ventajas que las deserciones alternas (véase la Figura 23.3). Las estrategias en un mundo de juego en
el que esto es cierto evolucionan para producir comunidades que cooperan.
En esencia, somos criaturas sociales. Vivimos en comunidades de ese tipo. Varios estudios han
demostrado que si tienes dos grupos (piensa en esto como dos tribus o dos aldeas), uno de los cuales
contiene muchos cooperadores altruistas (piensa en esto como la aldea de altos impuestos y alta
colaboración, donde la gente se ofrece voluntariamente para ayudarse mutuamente) y otro que contiene
muchos desertores egoístas (piensa en esto como la aldea del “yo tengo lo mío”,

El jugador 1 coopera Defectos del jugador 1

El jugador 2 coopera El jugador 1 recibe $50 El jugador 1 recibe $80

El jugador 2 recibe $50 El jugador 2 recibe $0

Defectos del jugador 2 El jugador 1 recibe $0 El jugador 1 recibe $0

El jugador 2 recibe $80 El jugador 2 recibe $0

Figura 23.3 El dilema del prisionero: versión positiva.

Machine Translated by Google

La ciencia de la moral 223

donde la gente hace lo mejor que puede para obtener lo suyo de la comunidad), entonces la aldea
altruista tendrá más éxito como grupo que la aldea egoísta. Las personas de la aldea altruista
pasarán más tiempo en la entrada cooperarcooperar de la tabla de interacción, mientras que las
personas de la aldea egoísta pasarán más tiempo en la entrada defectodefecto de la tabla de
interacción.
Se trata de una forma de selección grupal, en la que, aunque la determinación del éxito
selectivo se basa completamente en el individuo, ciertos grupos obtienen mejores resultados que
otros. Los grupos que tienen éxito pueden crecer lo suficiente como para dividirse en dos grupos,
mientras que los grupos que no lo tienen pueden destruirse a sí mismos desde dentro. Las
implicaciones evolutivas de este proceso de selección grupal se exponen con mayor claridad en
el libro Unto Others , de Elliot Sober y David Sloan Wilson.
Sin embargo, esta teoría predice que es más probable que uno sea más cooperativo con los
miembros de su propia aldea o grupo que con otros miembros de aldeas o grupos. Esta diferencia se
denomina altruismo dentro del grupo y xenofobia fuera del grupo . En su libro La catedral de
Darwin , David Sloan Wilson sostiene que una de las claves de la humanidad es la flexibilidad y
complejidad con la que definimos nuestros grupos. Sostiene que muchos de nuestros constructos
sociales (religión, nacionalismo, cultura, incluso franquicias deportivas) son formas de definir Wilson
Quién está en el grupo y quién no. En la Catedral de Darwin , examina explícitamente el
desarrollo del calvinismo en la década de 1530, donde el exilio y el ostracismo eran las principales
herramientas para garantizar un comportamiento cooperativo dentro del grupo.
En su libro Historical Dynamics , Peter Turchin define el término asabiya , que significa
“cohesión” o “unidad de grupo”. Turchin sostiene que el éxito de las dinastías, tribus, estadosnación
y grupos depende de la voluntad de los individuos de sacrificarse por el grupo. Turchin sostiene
que los grupos, los estadosnación, las tribus y las dinastías tienen un ciclo, donde los grupos
surgen con mucha asabiya (cooperación dentro del grupo), toman el control (porque son más fuertes
juntos que otros grupos que no pueden trabajar juntos), pero luego pierden esa asabiya en un par
de generaciones (los desertores se extienden dentro del grupo), lo que los hace vulnerables al
siguiente grupo con asabiya .
Este efecto que Turchin describe se produce porque, aunque a todos los habitantes de la aldea
altruista les irá mejor en promedio, una persona egoísta de la aldea altruista va a 49 (Esa persona
construido por el gobierno para protestar por el pago de pasará más tiempo en el sistema de metro
impuestos). Esto genera un conflicto entre niveles: a nivel de las aldeas, las aldeas altruistas obtienen
aldeas, pero a nivel individual, los desertores egoístas de esa aldea mejores resultados que otras
obtienen mejores resultados que los altruistas de esa aldea (mayoritariamente altruista). Hay dos formas
de abordar este problema (llamado 51 ): el exilio y el castigo altruista. el problema del polizón

El exilio implica identificar a los desertores y expulsarlos explícitamente de la comunidad. Uno de los principales objetivos

de los chismes parece ser la identificación de esos desertores.

52 El exilio obliga a la persona a abandonar la comunidad, lo que la elimina de la lista de cooperadores
cooperadores. Muchos grupos utilizan el ostracismo o el exilio como un castigo devastador, que es claramente lo
suficientemente fuerte como para mantener a raya a las comunidades. 53

Un gran ejemplo del desarrollo del altruismo dentro del grupo como factor crítico para el éxito en una
54
Esta práctica de grupo por grupo se puede observar en el desarrollo de reglas a bordo sobre los buques piratas.
Sería difícil imaginar individuos más egoístas que los piratas, pero estar atrapados juntos en un barco
en medio del océano abierto, enfrentando la batalla juntos, ciertamente define
Machine Translated by Google

224 La condición humana

Un grupo muy específico. El factor clave descrito por Leeson en El anzuelo invisible es el castigo por
robar a la tripulación o por no hacer lo que corresponde. No cooperar con el resto de la tripulación
hacía que el resto castigara al pirata egoísta, que luego cambiaba su forma de actuar o de lo
contrario...
El castigo altruista implica que la comunidad identifique y castigue explícitamente a los desertores.
En cierto sentido, un grupo de cooperadores se reúne y cada uno sacrifica una pequeña cantidad
para garantizar que la ventaja que obtenga el desertor sea mínima.
El juego más simple que aborda esta cuestión del castigo altruista es el ultimátum , un experimento
justicia de laboratorio que prueba directamente la voluntad de una persona de sacrificarse por la
del juego . 55 En el juego del ultimátum, un jugador (el donante) recibe 20 dólares para dividir con

otro jugador (el receptor). El receptor luego decide si “lo toma o lo deja”.
Si el receptor acepta la distribución, ambos jugadores reciben el dinero, dividido entre el donante. Si
el receptor rechaza la distribución, ninguno de los jugadores recibe nada. En un mundo perfectamente
“racional”, el receptor debería tomar lo que reciba. El donante debería darle al receptor la cantidad
mínima (digamos $1 o 1 centavo) y el receptor debería tomarla. Pero si observa su propia reacción a
esto, probablemente tendrá una reacción visceral y emocional al recibir solo $1 o 1 centavo y se lo
arrojará en la cara al donante. En la práctica, los receptores rechazan cualquier cantidad por debajo
de un tercio del dinero, y los donantes (sabiendo esto) dividen el dinero en una proporción de
METRO

aproximadamente 60/40.
Curiosamente, otros animales, incluso animales muy inteligentes como los chimpancés, no
parecen mostrar esta propensión al castigo altruista; aceptan todo lo que se les da. 58 Hay algunas
diferencias en la forma en que se ha hecho pasar a los chimpancés por los experimentos (tienen que
realizar múltiples casos porque no se les puede decir a los chimpancés cómo jugar el juego). Y los
chimpancés son sensibles a la desigualdad y la injusticia, en particular entre compatriotas, entre
59
humanos y nuestro pariente genético más Sin embargo, parece haber claras diferencias
cercano. Aunque los chimpancés son nuestro pariente genético más cercano, tienen interacciones
sociales muy diferentes y no viven en las mismas comunidades unidas y basadas en aldeas que los
humanos. 60 Otros animales que sí viven en tales comunidades (como los lobos) sí parecen mostrar
castigo altruista. 61 Esto
sugiere que la diferencia puede ser menos una cuestión de humanidad que de comunidad.
El punto aquí es que parte de nuestro cerebro demanda justicia. La cooperación, la confianza y
producen cambios en la activación del circuito de recompensa emocional. Han la falta de ella

identificado que el castigo altruista (rechazar una oferta injusta) está asociado con aumentos en el
flujo sanguíneo en la amígdala y la ínsula, dos estructuras involucradas en las reacciones
emocionales (pavlovianas) a los resultados negativos. De hecho, el rechazo de ofertas injustas está
correlacionado con la emoción de la ira y el disgusto, y el castigo de los jugadores injustos está
asociado con la emoción de la satisfacción. El castigo de los jugadores injustos produce aumentos
en el flujo sanguíneo en las estructuras emocionales positivas como la corteza prefrontal medial
ventral y el estriado ventral. La satisfacción de castigar a los jugadores injustos ocurre incluso cuando

METRO 56
Los economistas nos dicen que esto es “irracional” porque uno pierde dinero al no aceptar la oferta más pequeña.
Dos grupos que juegan más “racionalmente” de lo esperado (ambos aceptan y ofrecen cantidades menores a lo normal) son los
sociópatas, que no parecen capaces de reconocer la reacción emocional del otro jugador, y los graduados de escuelas de
negocios, que han sido entrenados para actuar en base a sus ecuaciones de optimización “racional”. 57 Los graduados de
ciones.escuelas de negocios parecen normales antes de ingresar a la escuela de negocios, pero anormales al salir.

Te dejo que saques tus propias conclusiones.

Machine Translated by Google

La ciencia de la moral 225

El castigador es un tercero, es decir, el jugador A se rebela contra el jugador B, que cooperó (y por
lo tanto fue engañado), y el jugador C gasta parte de su propio dinero para castigar al jugador A.
Los jugadores que observaban a un jugador injusto recibiendo descargas dolorosas expresaron
satisfacción, un deseo de venganza logrado y mostraron actividad en áreas relacionadas con la
recompensa, como el estriado ventral. Cuando evaluamos los objetivos, algunos de ellos son
complejos y sociales.
También se han examinado variaciones del juego del ultimátum. Si el receptor piensa que la otra persona
es en realidad un programa informático que ofrece opciones al azar, es más probable que ese receptor
donantes que piensan que "ganaron" el dinero acepte ofertas injustas sobre castigar a otros jugadores. Los
(mediante algún esfuerzo, por ejemplo, realizando una tarea antes de jugar el juego) ofrecen menos que si
el dinero se les da simplemente. Cuanto más haya trabajado el donante para conseguir el dinero (cuanto
más difícil fue la tarea), menos ofrecerá.
64;N

Como se ha señalado anteriormente, el castigo altruista puede ser motivo de chismes, vergüenza y
mala reputación. Una de las interacciones humanas que siempre me ha parecido especialmente interesante
es el éxito de Amnistía Internacional. Una de las principales actividades de Amnistía Internacional es escribir
cartas a dictadores, gobiernos y violadores de los derechos humanos para que liberen a los disidentes y
pongan fin a esos abusos. No amenazan. No tienen un ejército. Ni siquiera amenazan con la “quema en el
infierno” religiosa. Se limitan a escribir cartas, y lo notable es que a menudo esto funciona.

Un problema similar se relaciona con el perdón. Como vimos en los experimentos de ojo por
ojo, la estrategia más resistente a los errores y al ruido es el ojo por ojo con perdón. Aunque
algunos crímenes pueden ser imperdonables, perdonar (posiblemente después de cumplir un
castigo apropiado) es una herramienta para rehabilitar a un desertor. Si la persona coopera a partir
de ese momento, puede volver a formar parte de la comunidad. En una de las historias más
notables de nuestro tiempo, después del fin del apartheid en Sudáfrica, el arzobispo Desmond
Tutu dirigió la Comisión de la Verdad y la Reconciliación en
, la que se pidió a los criminales que
Proporcionar una descripción completa, divulgación y disculpa.
La ciencia de la moralidad está todavía en pañales. En este momento, se está concentrando en la
pregunta descriptiva de ¿qué hacen realmente los humanos? La evidencia parece indicar que hemos
desarrollado una serie de juicios “morales” que nos permiten vivir en comunidades (en su mayoría) pacíficas.
Estas interacciones no siempre son simples y dependen de una interacción compleja que fomenta la
cooperación y reduce las ventajas de la deserción.
Lo que es particularmente interesante es que la humanidad está de acuerdo en gran parte sobre la moralidad,
en particular la de las interacciones sociales. La Regla de Oro es reconocida en todo el mundo, como parte de la
mayoría de las religiones y de la mayoría de los tratados morales no religiosos. Las prohibiciones específicas (el
matrimonio homosexual, el aborto, el consumo de carne de cerdo) varían de una religión a otra y de una religión a otra.

N Por eso el meme antiimpuestos de “es tu dinero” es tan efectivo e insidioso: 65 alienta la deserciónegoísta de la
comunidad. (Como dijo el juez de la Corte Suprema Oliver Wendell Holmes, “los impuestos son lo que pagamos por una
sociedad civilizada”. Esto se repite a menudo como “los impuestos son el precio que pagamos por vivir en una sociedad
civilizada”). De manera similar, por eso los grupos antiimpuestos están tratando de deshacerse de la “retención” que
ocurre en la mayoría de los trabajos remunerados (pero no para los autónomos). Cuanto más logren los grupos
antiimpuestos hacer que los ciudadanos vean el dinero como ganado y luego regalado, menos dispuestos estarán esos
ciudadanos a pagar impuestos. (Por supuesto, como la mayoría de los desertores egoístas de una comunidad, los grupos
antiimpuestos quieren todos los servicios de la comunidad, pero no quieren pagarlos. 66 )
Machine Translated by Google

226 La condición humana

La dinámica varía de una cultura a otra, pero las interacciones sociales y morales primarias (ser justo en el trato
con los demás, tratar a los demás como nos gustaría que nos trataran a nosotros, ayudar cuando podamos) no.
Cuando un no creyente presionó al rabino Hillel (110 a. C.10 a. C.) para que describiera toda su religión
mientras estaba de pie, prometiendo convertirse si Hillel podía hacerlo, el rabino Hillel respondió: “Lo que es
odioso para ti, no se lo hagas a los demás. Todo el resto es solo un comentario. Ve y aprende”. 67 La Regla de
Oro es un primer paso hacia la cooperación, pero por sí sola no es suficiente. El comentario es largo y complicado,
y aún se está descubriendo.

Libros y artículos para lectura adicional • Elliot Sober y

David Sloan Wilson (1998). Unto Others: The Evolution and

Psicología del comportamiento altruista . Cambridge, MA: Harvard.
• David Sloan Wilson (2002). La catedral de Darwin: evolución, religión y la naturaleza de
Sociedad . Chicago: University of Chicago Press .
• Robert Axelrod (1984/2006). La evolución de la cooperación . Nueva York: Basic
Libros .

• Patricia S. Churchland (2011). BrainTrust . Princeton, Nueva Jersey: Universidad de Princeton.

Prensa .

• Sam Harris (2010). El panorama moral . Nueva York: Free Press. • Paul J. Zak [Editor]
(2008). Mercados morales: el papel fundamental de los valores en la economía .
Princeton, Nueva Jersey: Princeton University Press .
Machine Translated by Google

El enigma de la robótica

Muchas veces sólo

intentamos saber que no somos
los únicos que arriesgamos todo
por amor.

El libre albedrío incluye tres cuestiones diferentes envueltas en un

término filosófico: (1) la perspectiva externa (¿Por qué algunos otros
seres se nos presentan como agentes con libre albedrío?), (2) la
perspectiva social (¿A quién debemos culpar por acciones criminales?),
y (3) la perspectiva interna (¿Cuál es la sensación interna que
identificamos como “conciencia”?). Al separar el libre albedrío en estas
tres perspectivas, demostraré que las dos primeras no son
verdaderamente cuestiones de “libre albedrío” y que no hay razón para
pensar que las máquinas físicas no puedan experimentar una sensación interna de conciencia.

El libre albedrío es un término curioso. Es una combinación de palabras tan sencillas que lleva consigo
todo lo que nos hace sentir humanos. ¿Qué significa ser libre ? ¿Qué significa querer algo? Uno de los
A
grandes terrores de la vida moderna es que el concepto de libre albedrío es una ilusión. Si el libre
albedrío es una ilusión, entonces nos subiremos a una montaña rusa que nos llevará a grandes alturas
y luego a grandes profundidades, sin ningún control sobre nuestro viaje. Pero este terror presupone
que sólo hay dos opciones: o tenemos completa libertad para elegir lo que queramos o nuestra
sensación de identidad es una ilusión, que no tenemos el control, que somos meras máquinas,
completamente predecibles en lo que hacemos. Esta dicotomía es la ilusión.
La verdad es que nunca somos completamente libres . Estamos limitados por las leyes de la
física, por nuestras interacciones inmediatas con la sociedad y por nuestros recursos físicos y monetarios.
Puedo querer volar como un pájaro todo lo que quiera, pero no importa cuán alto salte, nunca lo haré.

La irreverente tira cómica Jesús y Mo captó este enredo con elegancia: “¿Sabías que el libre
albedrío es una ilusión?” “¿Y qué pasa con la responsabilidad personal?” “¡Eso es exactamente! ¡Una
1
vez que aceptas que no existe el libre albedrío, puedes hacer lo que te dé la gana!”

227
Machine Translated by Google

228 La condición humana

B
despega y vuela hacia el cielo. Puedo querer lanzar en las grandes ligas, pero no tengo una bola
rápida de 100 millas por hora. Todos aceptamos estas limitaciones, y aun así nos aferramos al término
libre albedrío .
Voluntad es una palabra antigua que significa deseo o anhelo. La voluntad es el medio que nos define.
Fundamentalmente, el hecho de que el concepto de voluntad implica un dualismo es lo que está en el
corazón del problema del término libre albedrío . Si podemos explicar el motivo de una acción de Nosotros
una fuente que no es nuestra “voluntad”, entonces negamos nuestra propia agencia al tomar esa acción.3
Verá que este no es un concepto nuevo y que el hecho de que seamos o no máquinas en realidad no tiene
relación con el hecho de que tengamos o no libre albedrío.

Debemos abordar el libre albedrío desde tres perspectivas. Desde una perspectiva externa , el libre
albedrío se refiere a si tratamos a otro ser como un agente o como una máquina. Desde una perspectiva
desde una social , el libre albedrío se refiere a si podemos culpar a los individuos por sus acciones. Y
perspectiva interna , el libre albedrío se refiere a si somos verdaderamente esclavos de nuestra propia maquinaria.

La perspectiva externa: la agencia de los demás

Desde una perspectiva externa, ya hemos visto que asignamos agencia a muchas cosas que no son
agentes. (¿Recuerdas la discusión sobre el GPS en el Capítulo 2?) La suposición de agencia es una
forma que tiene el cerebro humano de manejar la imprevisibilidad. En particular, la suposición de agencia
nos permite abordar la compleja interacción de la previsibilidad basada en las probabilidades de selección
de acciones.
Los individuos tienen personalidad, carácter; son predecibles. No es cierto que los humanos actúen al
azar. Piense por un momento en qué clase de mundo sería ese: cada persona que conozca podría de
repente empezar a cantar o podría de repente empezar a matar. Un mundo así es inimaginable para
nosotros. En cambio, hablamos con fiabilidad de propensiones, de la naturaleza de una persona . "Está en
,4 explicando
mi naturaleza", le dice Fergus a Dil al final de The Crying Game , reconociendo sus acciones,
por qué se hizo cargo de ella. Fergus explica su capacidad de acción diciendo que esto está dentro de los
límites de lo que cabría esperar si realmente lo conocieras. La capacidad de acción requiere previsibilidad,
pero sólo una previsibilidad limitada: identificamos un carácter, una naturaleza, un rango de posibilidades,
y esperamos que el agente actúe en algún lugar dentro de ese rango.
El problema de la mecánica y el libre albedrío se remonta a la época de Galileo, Newton y Descartes,
quienes reconocieron que los sistemas físicos no tenían agencia en la forma de la que estamos hablando
aquí: eran completamente predecibles. (Por supuesto, ahora sabemos que esto solo ocurre con los objetos
a escala macro que Galileo y Newton estaban estudiando. A escalas suficientemente pequeñas (cuánticas),
la previsibilidad se rompe. 5 Aún se desconoce si los objetos cuánticos son deterministas o no, pero
nuestro mejor conocimiento actual sugiere que no lo son; en cambio, parecen ser probabilísticos. Como
veremos más adelante en este capítulo, es posible que los efectos cuánticos se expandan al mundo
macro, lo que los hace fundamentalmente probabilísticos también. 6 ) Antes de Galileo, los objetos mismos
tenían agencia: Aristóteles explicó la gravedad porque las cosas querían caer a la tierra, y propuso que los
objetos tenían una causa impulsora, que los empujaba a sus acciones, y una causa teleológica, que los
atraía en función de su agencia y sus objetivos.
7

Descartes, a través de sus propios estudios médicos y siguiendo directamente las observaciones de
Galileo sobre la mecánica, se dio cuenta de que el cuerpo en sí mismo era una máquina.

B
Nunca estuve dispuesto a poner a prueba la sugerencia de La Guía del autoestopista galáctico de
2
apuntar al suelo y fallar.
Machine Translated by Google

El enigma de la robótica 229

Fue un anatomista consumado y reconoció que los animales eran máquinas; sin embargo, negó que él
8
mismo fuera una máquina y separó explícitamente la mente del cuerpo.
La preocupación de Descartes era la predictibilidad: la mecánica newtoniana implica que si se conocen
suficientes detalles sobre el estado del universo en un momento dado, es completamente predecible a
partir de ese momento. El notable éxito de la mecánica newtoniana en la predicción del movimiento en el
mundo físico, a veces llamada la teoría del “universo de relojería”, condujo a la hipótesis del determinismo.
9 Los filósofos de la época creían que sólo había dos opciones: un
agente de toma de decisiones extrauniversal con libre albedrío, o que todo está predeterminado y que todo
libre albedrío es una ilusión.
Algunos filósofos han tratado de rescatar de la mecánica cuántica la aleatoriedad necesaria
para el libre albedrío. 10 Las mejores teorías actuales de la física sugieren que el determinismo
universal implícito por Newton es erróneo: no podemos predecir las acciones de una partícula
cuántica, es verdaderamente aleatoria (dentro de los límites de las probabilidades C ). 11 Los
neurocientíficos han tendido a desdeñar las teorías que basan el libre albedrío en la mecánica
cuántica porque la aleatoriedad cuántica no suele alcanzar el nivel macro que experimentamos en
nuestro mundo cotidiano. En gran parte, esto ocurre porque la aleatoriedad cuántica está limitada
por las probabilidades. Con suficientes elementos, las distribuciones de probabilidad se completan
y las cosas se vuelven extremadamente predecibles. Incluso los productos que dependen de
12
propiedades cuánticas (el láser, el transistor) proporcionan resultados predecibles de los que dependemos ad
Sin embargo, las matemáticas no lineales proporcionan un mecanismo a través del cual pequeñas (micro)
13 En estas ecuaciones, pequeños cambios se
fluctuaciones pueden generar eventos grandes (macro).
filtran a través del sistema, produciendo una gran divergencia en los resultados finales. Las neuronas

individuales son altamente no lineales y contienen muchas funciones de retroalimentación positiva que podrían llevar estos efectos de nivel micro al

mundo de nivel macro de la función neuronal .

do
Una de mis frases favoritas es una que escuché por primera vez de mi padre (que es físico teórico): “Los electrones
tienen libre albedrío”. Podemos predecir con mucha precisión lo que harán los electrones en conjunto. Podemos proporcionar
una predicción probabilística sobre lo que hará un solo electrón, pero es imposible decir con certeza lo que hará un solo
electrón.
Este crecimiento desde manipulaciones de nivel micro hasta efectos de nivel macro a veces se llama el "efecto mariposa",
del concepto de que la forma en que una mariposa bate sus alas en China (un cambio pequeño) puede cambiar la trayectoria
de un huracán en el Caribe (un efecto grande). Fue descrito por primera vez por Henri Poincaré (18541912) a fines del siglo
XIX, pero era difícil verlo realmente hasta que el desarrollo de la computadora permitió el cálculo confiable de ecuaciones
complejas. La primera demostración por computadora de que pequeños cambios llevaron a grandes divergencias bajo ciertas
condiciones fue de un meteorólogo llamado Edward Lorenz (19172008), quien estaba tratando de simular patrones climáticos
en la década de 1950. Sus simulaciones pasaban por una serie de ecuaciones diferenciales simples. En cada ciclo, la
simulación imprimía lo que debería haber sido una descripción completa del sistema en un momento dado. Cuando su cálculo
se detenía (debido a problemas eléctricos con las computadoras antiguas de la época), volvía a escribir los números
impresos. Este era un sistema completamente determinista, pero lo que descubrió fue que las diferencias en los dígitos menos
significativos se filtraban hacia los dígitos más significativos y producían efectos altamente divergentes. Para aquellos
interesados en este efecto, el libro de divulgación científica de James Gleick de 1987, Chaos, sigue siendo una de las mejores
introducciones a este campo.
mi
Las células tienen muchos componentes individuales que funcionan a niveles cuánticos. Uno de los ejemplos más
claros es el de los canales iónicos. Estos canales iónicos son un componente clave de la función celular, incluida la función
neuronal. Los canales iónicos están formados por proteínas de formas intrincadas que forman dispositivos mecánicos que
permiten que ciertos iones pasen a través de la membrana celular mientras restringen el flujo de otros iones. La distribución
de iones, que están dentro de la célula y que están fuera de la célula, es un proceso que se puede llevar a cabo de forma independiente.

(continuado)
Machine Translated by Google

230 La condición humana

La identificación de la capacidad de acción de los demás se reduce a la previsibilidad en el conjunto, pero

a la imprevisibilidad en lo específico. Así, uno tiene una capacidad de identificación de personalidad y carácter
(“Está en mi naturaleza”) y, sin embargo, una incapacidad de saber exactamente lo que un agente hará en un
caso específico. La aleatoriedad cuántica (en particular cuando se combina con sistemas caóticos no lineales)
puede proporcionar la aleatoriedad limitada necesaria para darnos lo que observamos como capacidad de
acción en los demás. Pero todo lo que realmente se requiere para que encontremos capacidad de acción en
otro es una aleatoriedad predecible. Ya sea que provenga de la aleatoriedad cuántica o simplemente de una
incapacidad de conocer suficientes detalles para predecir con precisión, utilizamos de manera confiable el
concepto de capacidad de acción para describir la aleatoriedad que ocurre dentro de una forma de posibilidades.
Es importante diferenciar estos puntos que he planteado aquí de los libros populares sobre teorías
cuánticas de la mente, como La nueva mente del emperador, de Roger Penrose. Penrose sostiene que las
máquinas sin mecánica cuántica no pueden ser inteligentes porque la mecánica cuántica proporciona un
componente especial a nuestro funcionamiento cerebral. La propuesta de Penrose es simplemente una nueva
versión del error de Descartes: identificar un conducto desde un yo no físico hasta el físico. Descartes identificó
esa conectividad con la glándula pineal, plenamente consciente de que todos los mamíferos tienen una
glándula pineal; Penrose identifica los componentes cuánticos como la clave especial. El problema es que
toda la materia es cuántica y que todos los animales tienen componentes cuánticos en sus neuronas.
F Lo que estoy diciendo aquí es que hay aleatoriedad
probabilística en las otras criaturas con las que interactuamos (ya sea de origen cuántico).

Célula: controla la función de la célula, incluyendo la activación de una espiga (que transporta información) y la liberación de
neurotransmisores (que se comunican con otra célula). Cada canal iónico tiene varias configuraciones diferentes; cada
configuración tiene diferentes propensiones a estar abierta o cerrada, para permitir que los iones fluyan a través de ella o no.
14
El que un canal iónico esté abierto o cerrado en un momento dado es un hecho aleatorio.
Las medidas de cada canal iónico individual muestran que, si bien la probabilidad de que se cierre un canal abierto o se
abra un canal cerrado tiene una probabilidad caracterizable, el momento real de cada uno es aleatorio.
Debido a que una célula normalmente tiene miles de canales iónicos de un tipo determinado, que realizan una
función específica, la aleatoriedad individual se promedia y el nivel macro de la función celular es extremadamente
consistente de un evento a otro.

Pero hay algunos casos en los que el número de canales es realmente muy pequeño, en los que los procesos de
retroalimentación pueden traducir los microcambios cuánticos en macrocambios. Una de esas situaciones es la activación de
potenciales de acción. Las neuronas integran información y luego la envían mediante la activación de potenciales de acción o
picos. (Véase el Apéndice A.) El pico en sí es una retroalimentación positiva de los canales de sodio sensibles al voltaje. 15
Esto significa que el umbral entre la activación y la desactivación puede depender de que se abran un número muy pequeño
de canales de sodio adicionales.
Los estudios computacionales y experimentos que han reemplazado los canales cuánticos aleatorios por canales
persistentes han descubierto que hay propiedades de red a nivel macro que desaparecen sin esa aleatoriedad cuántica. (Por
ejemplo, las células en la corteza entorinal muestran una oscilación inherente al ritmo theta de 57 Hz. Esta oscilación depende
del ruido del canal y desaparece sin la aleatoriedad inherente a 16 ) Otros ejemplos en los que la aleatoriedad estocástica a
Estos canales. nivel micro (cuántico) se puede reflejar en efectos a nivel macro incluyen si una sinapsis libera o no un
neurotransmisor, y cómo el axón de una neurona se extiende para encontrar otras neuronas durante el desarrollo (lo que se
relaciona con cómo está conectada la red). 17 Pero, al igual que con los transistores, los láseres y otros fenómenos que
dependen de las propiedades cuánticas, los efectos a nivel macro en las células (como los picos) son fenómenos altamente
18
confiables. Todavía se desconoce cómo el dominio afecta a las propiedades sutiles en ¿Cuánta carrera cuántica?
neurociencia (a través del efecto mariposa).
F
De hecho, los componentes cuánticos (microtúbulos) que Penrose y su colega Stuart Hameroff alcanzan para
19 están en cada célula de cada criatura multicelular, desde el gusano más pequeño hasta la ballena más grande.
Machine Translated by Google

El enigma de la robótica 231

aleatoriedad o indeterminación caótica) y esa aleatoriedad nos lleva a asignarle agencia a otros. Como ya
hemos visto, los humanos asignan agencia a cualquier cosa con la que interactúan que sea impredecible
dentro de un rango limitado (como el fuego o el clima); no estoy haciendo ninguna afirmación sobre la
conciencia de esos otros agentes.
De modo que podemos identificar por qué otras personas parecen ser nuestros agentes: son
previsiblemente aleatorias. Pero sospecho que es poco probable que los lectores se sientan satisfechos con
esta historia, porque he eludido los dos problemas reales del libre albedrío. En primer lugar, ¿cómo podemos
responsabilizar a las personas de sus acciones si no tienen libre albedrío? Y en segundo lugar, ¿tiene usted,
querido lector, libre albedrío?

La perspectiva social: la cuestión de la culpa

Los especialistas en ética y los estudiosos del derecho han llegado a la conclusión de que alguien obligado a
hacer algo no tiene culpa. 20 Originalmente, esto surgió del concepto de que si alguien nos apunta con un
arma a la cabeza y dice: “comete este crimen”, entonces no tenemos culpa del crimen, porque no somos el
agente que inició la acción.
GRAMO

El problema, sin embargo, surge cuando empezamos a tener explicaciones de por qué alguien cometió
un crimen. Si descubrimos que alguien tiene un tumor cerebral que altera el procesamiento de su corteza
prefrontal, ¿culpamos a la persona por la acción? ¿Y si la persona tiene una adicción? ¿Y si llegamos al
punto en que podemos explicar la neurociencia de la decisión lo suficientemente bien como para poder decir
que cualquiera con un cerebro como éste habría tomado esa decisión? ¿Perdonamos entonces al criminal el
crimen?
Es importante destacar que este concepto es milenario y anterior a la neurociencia. En todas las épocas
ha habido explicaciones de por qué alguien hace algo que no implica su responsabilidad. Antes de la ciencia,
existían las brujas y los demonios. 21 Antes de la
22
neurociencia, existían explicaciones sociales y de desarrollo.
Esta cuestión de nuestra capacidad para predecir la conducta criminal también abre un conjunto
completamente diferente de problemas: si podemos predecir con absoluta certeza que alguien cometerá un
delito, ¿no estamos obligados a detenerlo? 23 ¿Qué pasa si sólo podemos predecir que cometerá el delito
con una alta probabilidad? ¿Cuál es el equilibrio entre esa probabilidad y los derechos de la persona a la
libertad? La mayoría de los sistemas jurídicos modernos han decidido inclinarse por la balanza de la libertad,
es decir, que hay que dar a la persona la oportunidad de no cometer el delito, que es injusto juzgar a una
persona por sus pensamientos y sólo es justo juzgar a una persona por sus acciones, y que, por lo tanto, hay
yo
que esperar a que se cometa el delito antes de actuar.
En gran medida, el problema de la ética de la elección radica en la distinción que se ha establecido entre
el objetivo de castigar al agente responsable y el objetivo de garantizar que los peligros para la sociedad se
eliminen con éxito de ella. Como vimos en los dos últimos capítulos, uno de los factores clave que nos hace
humanos y nos ha permitido vivir en condiciones estables es la libertad.

G Esto no es del todo cierto. En muchas de estas situaciones, hay una opción, pero la otra es tan atroz que el crimen se convierte en la

mejor opción. Tal vez en lugar de decir que la persona que comete el crimen “no tiene culpa”, deberíamos decir que somos misericordiosos y

perdonamos la acción, porque entendemos las limitaciones de las opciones disponibles.

yo
Por supuesto, no hay motivos para no preparar defensas de antemano. Cerrar la puerta con llave es una
respuesta muy diferente para prevenir un robo que encerrar al ladrón potencial.
Machine Translated by Google

232 La condición humana

Y en las sociedades complejas, la voluntad de participar en el castigo altruista , en el que

sacrificamos algunos de nuestros propios recursos para castigar a un malhechor, hace que a los
malhechores les resulte menos rentable hacer el mal, lo que ayuda a reforzar la cooperación.
En los grupos pequeños, donde todos se conocen y donde un individuo depende en gran medida de la voluntad
del resto de la tribu para trabajar con él, la cooperación se ve reforzada de forma fiable por el castigo altruista (véase
el capítulo 23). Sin embargo, a medida que las sociedades se hacen más grandes, resulta cada vez más difícil que
el castigo altruista a nivel individual produzca incentivos suficientes para imponer la cooperación. Resulta demasiado
fácil que un individuo haga trampas y luego se marche y desaparezca en la ciudad. En situaciones en las que hay
dos grupos rivales, resulta demasiado fácil que el castigo altruista se convierta en una pelea entre grupos y se
convierta en lo que es, en efecto, una guerra de pandillas de ojo por ojo. (La desafortunada contraparte del altruismo
dentro del grupo es la xenofobia hacia el grupo externo.) El sistema legal traslada la responsabilidad de aplicar el
castigo del individuo a la propia sociedad.

El verdadero objetivo de un sistema jurídico moderno es garantizar la capacidad de una sociedad para funcionar.
Sin embargo, aunque la comunidad médica ha pasado las últimas décadas luchando para garantizar que sólo se
utilicen terapias científicamente probadas, un proceso llamado “medicina basada en la evidencia”, todavía no existe
tal restricción en el sistema legal. 24 Esto significa que las leyes

a veces se basan en conclusiones simples derivadas de principios morales prescriptivos, en lugar de en

mediciones descriptivas de la realidad. Dos ejemplos claros de esto son las sorprendentes decisiones
de implementar medidas de austeridad en respuesta a la contracción de las economías y las decisiones
25
legales de criminalizar el consumo de drogas en lugar de tratarlo.
Gran parte del argumento ético se basa en si es o no “justo” castigar a alguien, en lugar de en cuál es la mejor
manera de mantener el funcionamiento de la sociedad. Uno de los mejores ejemplos de esto es la “guerra contra las
I
drogas”. Como se muestra Nadie niega que el consumo de drogas es un problema. Como vimos en el caso de las adicciones,

en el capítulo sobre “guerra contra las drogas” (capítulo 18), el consumo de drogas conduce a claras disminuciones
del bienestar, tanto en el individuo como en la sociedad. Sin embargo, el consumo de drogas, incluso el consumo de
drogas altamente adictivo, en particular al principio de la vida de un individuo, es a menudo un problema individual
no violento, en lugar de un problema social.27 Hay datos muy completos que demuestran que enviar a los adictos no
violentos a un tratamiento reduce la adicción, reduce la probabilidad de que se vuelvan violentos y tiene buenas
tasas de éxito en su reinserción en la sociedad. Por el contrario, enviar a los adictos a la cárcel aumenta la
probabilidad de que se vuelvan violentos, tiene bajas tasas de éxito en su reinserción en la sociedad y es más
probable que conduzca a una recaída, a menudo con drogas peores, al regresar a la sociedad. Y, sin embargo, el
debate en la sociedad estadounidense actual se ha centrado claramente en el castigo penal y la prisión por el
consumo individual de drogas.
Nunca olvidaré un ejemplo de desconexión de este tipo, que escuché en mi graduación de la universidad. El
orador era el novelista Tom Clancy, que estaba tratando de complacer a los ingenieros en un discurso en la
ceremonia de graduación de la escuela de ingeniería. Al principio del discurso, habló de lo importante que era mirar
los datos científicos y de cómo a veces los datos científicos eran diferentes del sentido común, por lo que los
ingenieros tenían que aprender a mirar los datos en sí. Apenas diez minutos después, en el mismo discurso, Clancy
denunció los centros de tratamiento de la adicción a las drogas, diciendo que no le importaba si los datos decían
que el tratamiento funcionaba mejor que la prisión, los adictos sabían que irían a la cárcel y decidían tomar las drogas.

I
Como han señalado muchos comentaristas y filósofos, la terminología “guerra contra las drogas” realza
ciertas perspectivas sobre el manejo del problema y probablemente limita nuestras opciones políticas a la hora de
26
abordar el problema del consumo adictivo de drogas.
Machine Translated by Google

El enigma de la robótica 233

De todos modos, tuvo que ser enviado a prisión. Estas desconexiones lógicas se encuentran en la visión
limitada del libre albedrío instalada en nuestro sistema legal como un fenómeno de todo o nada: o alguien
es libre de elegir y debe ser castigado, o alguien es un esclavo y se debe encontrar al agente real de la
decisión en su lugar. Como hemos visto a lo largo de este libro, la historia no es tan simple.

El sistema legal ha tenido problemas con la cuestión de la culpa y el castigo mucho antes del problema
de que la comprensión del mecanismo de toma de decisiones puede llevar a explicaciones independientes
del libre albedrío. 28 Sin embargo, si nos alejamos de la cuestión de la “culpa” y nos acercamos a objetivos
de misericordia y perdón a nivel individual, mientras mantenemos el objetivo de mantener una sociedad
funcional a nivel social, encontramos que la cuestión del libre albedrío nuevamente se vuelve discutible.

Por supuesto, como hemos comentado en la primera parte de este capítulo, el libre albedrío significa
que podemos predecir en conjunto, pero no en forma individual. 29 Esto significa que la predicción de una
acción futura es sólo eso: una predicción. Como se muestra en la película Minority Report , es
inherentemente peligroso suponer que una predicción es la realidad.
Hay una gran diferencia entre cerrar la puerta
con llave para evitar robos y encerrar al ladrón antes de que entre en tu apartamento (nota H, arriba).

Podemos entender las razones por las que alguien ha hecho algo y, en lugar de preocuparnos por si
debemos culparlo por sus acciones o no, podemos preocuparnos por cómo asegurarnos de que no vuelva
a suceder. El castigo es sólo una herramienta en esa caja de herramientas; hay muchas otras. Saber
cuáles funcionarán, cuándo y cómo implementarlas son cuestiones científicas que dependen de nuestra
comprensión de la máquina de toma de decisiones humana.

Dos grandes ejemplos del uso de otras herramientas son los usos exitosos de la vergüenza por parte
31 Pudieron lograr sus objetivos mostrando al mundo lo que otros
de Mahatma Gandhi y Martin Luther King.
hacían. (No subestimemos la importancia de los noticieros de televisión y cine en sus éxitos.) Al utilizar el
mecanismo intersocial humano que reconoce la fuerza no sólo en términos de capacidad física sino también
en términos de “corazón”, de capacidad de permanecer de pie incluso frente a un poder físico mayor, J.
Gandhi y King pudieron lograr grandes cosas.

De modo que un proceso aleatorio combinado con un mecanismo que garantice que la aleatoriedad se
encuentre dentro de una distribución de probabilidad es suficiente para explicar lo que observamos como
capacidad de acción en los demás. Y reconocer que el castigo altruista es sólo una herramienta en la caja
de herramientas de la sociedad para garantizar la cooperación en lugar de la deserción deja sin respuesta
la cuestión ética de si alguien realmente tiene libre albedrío o no. Sin embargo, hasta ahora hemos evitado
la difícil cuestión de la conciencia: ¿Tiene usted, querido lector, libre albedrío?

La perspectiva interior: Conciencia

Todos tenemos la experiencia de tomar decisiones sin saber por qué las tomamos. Todos tenemos la
experiencia de no prestar atención y mirar hacia arriba para reconocer que hemos hecho algo que
hubiéramos preferido no haber hecho, ya sea dejar que nuestra adicción, nuestro

J Rocky es el héroe de su película porque permanece de pie hasta el final, incluso cuando pierde la pelea.
32
Machine Translated by Google

234 La condición humana

La ira, la lujuria, o que dejamos de prestar atención y nos encontramos llevando a nuestro amigo a
la oficina en lugar de al aeropuerto, nos llevan a la teoría del jinete y el caballo, según la cual hay
un jinete consciente y un caballo inconsciente. El jinete puede dirigir al caballo, pero también puede
ceder el control y dejar que el caballo tome su propio camino.
33 A veces el caballo realiza una acción repentina que el jinete luego tiene que compensar.

De manera similar, todos hemos tenido la experiencia de racionalizar una acción que claramente
se tomó con prisa: “Quise hacer eso”. Después de los famosos experimentos de Libet, que
demostraron que las decisiones conscientes de actuar están precedidas por señales cerebrales
mucho antes del momento en que creemos que tomamos la decisión, muchos filósofos se han
refugiado en la hipótesis de que la conciencia es totalmente una ilusión y que el conductor es sólo
un pasajero que observa cómo se desarrolla la película. Otros han sugerido que la conciencia se
parece más a un secretario de prensa que a un ejecutivo, y que la conciencia implica racionalizar
las acciones que realizamos. Daniel Wegner diferencia las acciones que identificamos como
voluntarias y las que no, y señala que existen casos de (1) acciones sobre las que no tenemos
control pero creemos que lo tenemos y (2) acciones sobre las que sí tenemos control pero creemos
que no lo tenemos. Wegner identifica explícitamente el “libre albedrío” con la ilusión de agencia. Sin
embargo, los experimentos de Libet se basan en la idea de que la decisión consciente de actuar se
produce cuando reconocemos (lingüísticamente) la decisión de actuar. Libet y otros han sugerido
que la conciencia monitorea las acciones que realizamos para poder detenerlas, modificarlas o
vetarlas. 34

El problema, como yo lo veo, es que los filósofos tienen el concepto de que la conciencia debe
ser una cosa externa, externa al mundo físico, o una propiedad emergente de las cosas físicas que
es (de alguna manera) fundamentalmente diferente de las cosas físicas subyacentes.
35 Esta cuestión salió a la luz por primera vez con el determinismo descartiano, a raíz
de las implicaciones de Galileo, Newton y Johannes Kepler de que uno podía predecir con precisión
de los objetos, y que estos no necesitaban una agencia para moverse. no el movimiento
38
necesitaban una agencia para actuar, entonces tampoco la necesitaba la Claramente desesperado

maquinaria del cuerpo. Al no abandonar el libre albedrío humano, Descartes concluyó que, aunque
los animales eran máquinas, él mismo no lo era.

K La teoría del sistema de toma de decisiones múltiples sugiere por qué tenemos deseos múltiples (a veces conflictivos). A veces,

el sistema pavloviano quiere una cosa, mientras que el sistema deliberativo quiere otra... todo mientras el sistema procedimental toma

acciones por su cuenta.

Compárese con Tomás de Aquino (12251274), quien planteó la hipótesis de que los ángeles empujaban
los planetas en sus órbitas. 36 Aunque ya no se toman en serio los ángeles como explicación del movimiento

planetario, en su época era una teoría seria. Tomás creía que las cosas no podían moverse sin un agente. Con
los avances de Galileo, Descartes, Newton, Brahe y Kepler, ya no se necesitaban agentes para mover los
planetas, y se abandonó la teoría del empuje de los ángeles.
En realidad, la cronología es la siguiente: Galileo (15641642) precede a Descartes (15961650), quien a
su vez precede a Newton (16431727). Galileo demostró que se podía medir la realidad física experimentalmente.
Descartes demostró que el espacio podía representarse matemáticamente, y Newton dedujo descripciones matemáticas precisas del

movimiento determinista. Las otras dos figuras clave de esta cronología son Tycho Brahe (15531601) y su alumno Johannes Kepler

(15711630), que demostraron que los planetas se movían en órbitas regulares, que podrían describirse como elipses. Al igual que sucede

con la ciencia moderna, estos hombres conocían bien el trabajo de los demás, leían cada tratado a medida que salía y se basaban en él.
Ninguno de ellos trabajaba de forma aislada. 37
Machine Translated by Google

El enigma de la robótica 235

La famosa frase de Descartes es, por supuesto, cogito ergo sum ( pienso, luego existo ), lo
cual está bien, pero no dice nada sobre si sus semejantes humanos piensan o si el lenguaje que
le hablaban simplemente le daba la ilusión de que pensaban, y no dice nada sobre si sus
semejantes animales piensan, aunque no puedan contarle sus introspecciones. Descartes
concluyó que la glándula pineal es la conexión de un alma consciente externa a un ser físico. Si
bien la glándula pineal conecta el cerebro con el... Un anatomista consumado, Descartes era
40
cuerpo,M todos los mamíferos tienen glándulas
pineales. muy consciente de esto, pero concluyó que solo la glándula pineal humana "funcionaba" para conectar
las almas con los cuerpos. 41

Una versión más moderna de esta hipótesis desesperada se puede encontrar en los cuánticos
Las teorías de Roger Penrose y Stuart Hameroff no , que han argumentado que la conciencia
pueden surgir de un sistema determinista y, por lo tanto, deben depender de fluctuaciones cuánticas.
42
En particular, han argumentado que la mente interactúa con el cerebro
manipulando probabilidades cuánticas: el libre albedrío ocurre porque nuestras almas separadas
pueden manipular las probabilidades cuánticas para darnos libre albedrío. Nótese que la teoría de
Penrose y Hameroff de que un alma externa controla las probabilidades cuánticas es muy diferente
de la discusión anterior de las probabilidades cuánticas como una fuente potencial de aleatoriedad
en otros. Sospecho que si realmente pudiéramos controlar las probabilidades cuánticas, seríamos,
como se muestra en Anathem de Neal Stephenson , en realidad mucho mejores en ciertos
problemas (como descifrar códigos) de lo que somos. Esta teoría cuántica a menudo se enuncia
como una declaración en la línea de Las máquinas no pueden ser conscientes. Dado que soy
consciente,
,43,no soy es
lo cual una máquina.
una reformulación apenas velada del cogito ergo sum de Descartes .
Mi opinión es que el problema es que, cuando lo imaginamos, creemos que sólo hay dos
opciones: o somos seres conscientes que pueden emprender cualquier acción o somos esclavos
,
que no tienen opciones. Pero, como Fergus y Dil en The Crying Game, tenemos personalidades y
somos fieles a nuestra “naturaleza”.
La palabra robot proviene de una obra de teatro de Karel Čapek (titulada RUR [Los robots
universales de Rossum] ), que en realidad trataba sobre el efecto de la industrialización sobre la individualidad.
De manera similar, nuestro concepto más moderno de robots proviene de observaciones de
máquinas sumamente complejas, muchas de las cuales se utilizan en fábricas industrializadas. Esto
refleja nuestro temor de que la robótica conduzca a la esclavitud, pero como hemos visto, el
problema no es la esclavitud. Incluso si la conciencia fuera una ilusión, no cambiaría nuestra
percepción de nuestra conciencia. No es que de repente nos vayamos a convertir en esclavos, ya lo somos o no
norte

El mundo es más complejo que eso. Ciertamente, hay decisiones que se toman sin intención
consciente, pero también hay deliberaciones conscientes muy largas que duran minutos, horas, días,
semanas o incluso meses. Incluso en el caso de decisiones específicas que ocurren demasiado
rápido para ser conscientes, podemos decidir entrenarnos para tomar las decisiones correctas en
el momento correcto. Se necesita tiempo para aprender a andar en bicicleta. Tanto las estrellas del
deporte como los soldados saben que hacer lo correcto en el momento correcto rápidamente (sin
pensar) requiere mucha práctica. Aunque la acción en el momento puede ser reactiva, la decisión de practicar es

La glándula pineal libera hormonas en el torrente sanguíneo en función de la activación de las neuronas y detecta los niveles hormonales en el torrente sanguíneo, traduciendo

las representaciones neuronales en niveles hormonales y los niveles hormonales en representaciones neuronales.
39

Tengo un amigo al que le gusta decir que en realidad no importa si tienes libre albedrío o no. Si
norte

Si lo haces, entonces es mejor que creas que lo haces. Si no lo haces, entonces estás predeterminado a creer que lo haces.
Machine Translated by Google

236 La condición humana

A menudo, es una decisión consciente. En los casos en que decidimos levantarnos e ir a un

seminario de control de la ira o a un centro de tratamiento de adicciones, la decisión consciente
no es no enojarnos o no tomar drogas; la decisión consciente es volver a entrenarnos.
Una discusión más matizada ha aparecido en la literatura de ciencia ficción del pasado cuando
varias décadas—con Star Trek: La Nueva Generación convertida , el androide Data intentó...
en humana; con Blade Runner y sus “replicantes”; y recientemente con la recientemente
, los humanos tienen que decidir si los Cylons tienen
reinterpretada Batalla Galactica en la que
suficiente libre albedrío para ser tratados como humanos.
En muchos de estos ejemplos, el viaje del robot para convertirse en humano se basa en la creencia de
que los robots necesitan sentir emociones. Un tema recurrente en Star Trek: La nueva generación es la
búsqueda de emociones por parte de Data. Sin embargo, a lo largo de toda la película, él es claramente tan
El resto, con sus debilidades, errores y capacidad de toma de decisiones, en , humano como los replicantes.
Blade Runner son identificables sólo porque no tienen las reacciones emocionales correctas ante
imágenes impactantes. Pero un tema en la película es la cuestión de si Rick Deckard, el duro
detective humano que caza a los replicantes, pasaría la prueba emocional de humanidad si se la
sometiera. (Este tema sólo está implícito en la película, pero es algo que preocupa explícitamente
a Deckard en la novela de Philip K. Dick ¿ Sueñan los androides con ovejas eléctricas?, de la
que deriva Blade Runner ). Al final, la película depende de una decisión tomada por el replicante
principal, Roy Batty, quien decide no arrojar a Deckard desde el borde del edificio y, en cambio,
levantarlo de nuevo. Deckard se pregunta por las razones de la decisión, pero nunca duda de
que el replicante tomó una decisión por su propia voluntad que salvó la vida de Deckard.
De manera similar, a lo largo de la nueva serie Batt lestar Galactica , los Cylons toman decisiones
claras, y mientras los humanos debaten si tratar a los Cylons como humanos o máquinas, nunca
dudan ni por un segundo de que los Cylons son tomadores de decisiones peligrosos.
El problema con todas estas discusiones es que (aún) no hemos construido máquinas que
tengan libre albedrío, y no sabemos cómo sería construir una máquina así.
Obviamente, hay muchas máquinas que no tienen libre albedrío, pero eso no excluye la
posibilidad de que exista una máquina con libre albedrío, no excluye la posibilidad de que seamos
máquinas vivientes con libre albedrío, que seamos máquinas que se enamoran, robots que
escriben poesía, que seamos cerebros físicos capaces de tomar nuestras propias decisiones.

Libros y artículos para lectura adicional •

Antonio Damasio (2010). El yo llega a la mente: la construcción del cerebro consciente . Nuevo
York: Panteón .
• Jeff rey Gray (2004). Conciencia: Acercándose sigilosamente al problema difícil . Nueva York:
Oxford University Press. •
Robert Kurzban (2010). Por qué todos (los demás) son hipócritas . Princeton, NJ: Princeton
Prensa universitaria.
• Neil Levy (2007). Neuroética . Cambridge, Reino Unido: Cambridge University Press. •
Daniel M. Wegner (2002). La ilusión de la voluntad consciente . Cambridge, MA: MIT.
Prensa .
Machine Translated by Google

EPÍLOGO

Hemos recorrido un largo camino en este libro, desde nuestras primeras discusiones sobre la toma
de decisiones y el ciclo de percepciónevaluaciónacción del termostato hasta la imaginación, la
moralidad y cómo somos máquinas con libre albedrío. En este libro, hemos explorado la ciencia de la
toma de decisiones y cómo los humanos (y otros animales) toman decisiones, a veces de manera
consciente, a veces menos. Nos gusta pensar que somos criaturas racionales, pero a menudo
tomamos decisiones irracionales. Esta irracionalidad proviene de la separación entre el "yo"
deliberativo y el "otro" pavloviano e impulsado por los hábitos (procedimental), pero esos otros
sistemas de toma de decisiones, los sistemas pavlovianos de selección de acciones y motivación,
los componentes de reconocimiento de situaciones (memoria), los hábitos aprendidos a lo largo de
1
los años, todos conforman la persona que eres. Parafraseando la analogía del caballo y el eres
jinete de Jonathan Haidt, tanto el caballo como el jinete. Estas son las historias que nos contamos a
nosotros mismos, los recuerdos que nos definen quiénes somos.

Aunque este no es un libro de autoayuda, la teoría de que las decisiones que tomamos surgen de
múltiples sistemas de toma de decisiones que interactúan entre sí tiene implicaciones sobre cómo podemos
cambiar nuestras vidas si así lo deseamos. La razón por la que algunas decisiones se toman mediante
sistemas emocionales (pavlovianos), mientras que otras son cadenas de acciones reactivas
(procedimentales) y otras se toman solo después de una extensa consideración de las opciones
(deliberativo) es que cada uno de estos sistemas tiene ventajas y desventajas. El sistema deliberativo es
lento de ejecutar (lleva tiempo considerar esas opciones) pero flexible (considerar dejar tu trabajo no
significa que lo harás). El sistema procedimental es realmente bueno para acciones que deben suceder de
la misma manera cada vez y rápidamente (como tocar un instrumento musical).
Los sistemas emocionales son fundamentales para las interacciones sociales.

Si pudieras pasar de un sistema a otro en el momento adecuado, podrías mejorar tu toma de

decisiones. Por ejemplo, si utilizas el sistema deliberativo, te resultará más fácil rechazar los
deseos impulsivos y emocionales. La gestión de contingencias es una técnica en la que uno se
concentra en una recompensa alternativa concreta como medio de modificación de la conducta.
Esto parece tener el efecto de activar el sistema deliberativo en lugar del sistema emocional o
2
reactivo.
Otro ejemplo es que desconectar el sistema deliberativo y permitir que funcione el sistema procedimental
es fundamental para un rendimiento adecuado en los deportes y en otras conductas que requieren
conductas repetitivas. Mi ejemplo favorito de esto es cómo Annie Savoy (Susan Sarandon) distrae al
sistema deliberativo del lanzador Ebby LaLoosh (Tim Robbins) al proporcionarle lencería femenina para
3 Una vez su
que la use en la película de béisbol Bull Durham .

237
Machine Translated by Google

238 Epílogo

(bien entrenado) El sistema procedimental recibe rienda suelta y descubre que puede lanzar strikes de manera
confiable. Por supuesto, esto solo funciona si el sistema procedimental ha sido entrenado adecuadamente.
Aunque generalmente no tenemos control consciente de los comportamientos procedimentales durante la
4
ejecución de ese comportamiento, la decisión de practicar a menudo es consciente. Como todo Como cada
A
músico sabe, la clave para tocar bien una pieza es practicarla.
De manera similar, los sistemas pavlovianos emocionales son fundamentales para tomar decisiones
siones. 5 apropiadas. El coraje no es la ausencia de miedo, sino la superación del miedo. 6 Uno debería ser

El miedo a un edificio en llamas. Y, como vimos en el capítulo 23, estas reacciones emocionales son
fundamentales para desenvolvernos adecuadamente en el entorno social en el que vivimos. El castigo altruista
(la voluntad de sacrificar parte de las ganancias propias para castigar a un tramposo) se produce porque
sentimos respuestas emocionales a la injusticia. 7
No sólo es posible entrenar a cada uno de los sistemas individualmente, sino que es posible aprender a
navegar entre sistemas, aprendiendo cuándo deliberar y cuándo permitir que se ejecuten. Además, los cambios
8
ejecutar el sistema de reconocimiento en las estructuras de apoyo (como el sistema procedimental para
de situaciones, capítulo 12) pueden cambiar las decisiones de uno. 9 Por ejemplo, darse cuenta de que no
existe “tal cosa como una bebida” para un alcohólico significa que las opciones no son entre el aburrido Dr.
Jekyll y un hombre elegante y de mundo, sino más bien entre el Dr. Jekyll y Mr. Hyde. Esto cambia las
decisiones de uno.
Nuestra comprensión de cómo tomamos decisiones tiene enormes implicaciones para la forma en que nos
entendemos a nosotros mismos, cómo interactuamos con los demás, cómo vemos el mundo que nos rodea y
cómo definimos y tratamos la disfunción mental. Aunque se sabe mucho sobre el sistema de toma de
decisiones y cómo el cerebro crea la mente, todavía hay mucho que se desconoce. La mayoría de los
conceptos que hemos discutido en este libro todavía son áreas de investigación muy activa dentro de la
comunidad científica. Hay una gran cantidad de preguntas abiertas que aún no tienen respuesta. ¿Cómo
interactúan estos múltiples sistemas? ¿Qué controla qué sistema impulsa el comportamiento cuando los
múltiples sistemas de decisión están en conflicto? ¿Cómo ocurre la transición de Deliberativo a Procedimental
(hábito)? ¿Qué es realmente el autocontrol? ¿Cómo nos cambia el cambio de nuestra narrativa conceptual?
¿Cómo afecta el sistema de motivación pavloviano a los sistemas de selección de acciones Deliberativo y
Procedimental (hábito)? ¿Cuál es el papel de la atención en la evaluación, particularmente durante la
deliberación? ¿Qué efecto tiene el tratamiento en la adicción o en otras enfermedades psiquiátricas? ¿Qué
es lo que falla en estas enfermedades psiquiátricas? ¿Cómo podemos determinar las causas subyacentes?
¿Podemos aprender a guiar a cada paciente individual hacia el tratamiento adecuado? Todavía queda mucho
trabajo por hacer en este aspecto. ¿Qué vamos a encontrar a continuación? No lo sé, pero estoy seguro de
que será un gran viaje.

A. David Redish
Minneapolis, Minnesota, 2010–2013

A
A menudo, el impulso para practicar viene del exterior, como lo sabe todo padre que engatusa a su hijo para que
practique un instrumento musical, todo sargento de instrucción que impulsa a los nuevos reclutas y todo asesor que impulsa a
los estudiantes de posgrado.
Machine Translated by Google

APÉNDICE

En estos tres apéndices, abordo cuestiones relacionadas con la función neuronal (A),
la representación (B) y la memoria (C). En cada uno de ellos, hay cuestiones
computacionales interesantes que tienen una relación indirecta con los procesos de
toma de decisiones, pero cuya complejidad es tangencial al tema principal del libro
(cómo tomamos decisiones).
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Apéndice A

PROCESAMIENTO DE INFORMACIÓN EN LAS NEURONAS

La luz del sol danzante en el

camino revela destellos de información.

hojas bailando en la brisa de la mañana

A menudo se dice que el cerebro es un “dispositivo de procesamiento de

información”, que recibe información del mundo, la transforma en una
representación interna y realiza acciones que cambian el mundo que lo
rodea. Incluso si el cerebro procesa información, no es una computadora
como la computadora que está en su escritorio, así como el cisne que
vimos en el Capítulo 2 no es un avión. En este capítulo, brindaré un
análisis inicial de las células, las neuronas y el procesamiento de
información en ellas.

En primer lugar, el cerebro está formado por células. Cada neurona tiene todo el material biológico
necesario para el funcionamiento normal de las células. Cada neurona individual del cerebro tiene
un núcleo y comparte el mismo código genético con todas las demás células del cuerpo. Cada
neurona tiene toda la maquinaria para traducir ese código genético en ARN y, luego, en proteínas.
En segundo lugar, una neurona es un dispositivo de procesamiento de información. Tiene una enorme
cantidad de maquinaria intracelular (y extracelular) que reacciona a los cambios de tal manera que
Calcular información.

Información

¿Qué es la información ? En el mundo moderno, nos enfrentamos al procesamiento de información

A Las matemáticas de la información que hicieron posible la revolución informática (a
todos los días.
veces llamada revolución de la información) fueron elaboradas en la década de 1940 por Claude

A
En La asombrosa historia de la mecánica cuántica , Jim Kakalios sostiene que las tecnologías que
cambiaron nuestro mundo en el siglo XX son todas avances en el procesamiento de la información.

241
Machine Translated by Google

242 Apéndice A

1 B
Shannon, un ingeniero que trabajó para Bell Labs, Basándose en el trabajo que realizó en criptografía,
do

2
tanto por su cuenta como en colaboración con Alan Turing durante la Segunda Guerra Mundial.
Matemáticamente, Shannon se dio cuenta de que la “información” consistía en separar los posibles códigos
en grupos. D Shannon caracterizó esto como responder a preguntas de sí/no. Cada respuesta a
una pregunta de sí/no equivalía a un bit de información. En el mundo moderno, nos encontramos con esta
definición de información todos los días. La memoria de la computadora y la capacidad del disco duro
generalmente se miden en unidades de ocho bits llamadas "bytes" (como en megabytes [un millón de bytes] y
gigabytes [mil millones de bytes]). Un byte consiste en ocho pequeñas cosas físicas que pueden estar cada
una en uno de dos estados (encendido/apagado, sí/no). En la memoria de su computadora o en una memoria
USB, esa pequeña cosa física suele ser un pequeño imán que se puede girar de un lado a otro. En un CD, esa
pequeña cosa física es un minúsculo hoyo excavado en el plástico que refleja la luz de diferentes colores
según la profundidad a la que se haya excavado.
Shannon se dio cuenta de cómo utilizar la teoría de la probabilidad para definir matemáticamente menos
de un bit de información. El juego Twenty Questions se basa en este concepto. Si los pájaros vuelan y los
mamíferos caminan, entonces responder a la pregunta ¿vuela? proporciona información sobre si la persona
está pensando en un pájaro o en un mamífero. Por supuesto, algunos pájaros no vuelan (pensemos en los
pingüinos) y algunos mamíferos sí (pensemos en los murciélagos). Dado que ¿vuela? separa en gran medida,
pero no por completo, a los pájaros de los mamíferos, la respuesta a ¿vuela? proporciona menos de un bit de
información sobre si la persona está pensando en un pájaro o en un mamífero.
La toma de decisiones consiste en cambiar nuestras acciones en función de la información que tenemos
disponible en el mundo.

Neuronas

Las neuronas (como todas las células) mantienen una diferencia de voltaje entre el espacio intracelular y el
extracelular. Hay más iones con carga negativa dentro de la célula que fuera, lo que crea una diferencia de
voltaje entre el interior y el exterior de la célula. En efecto, una neurona es como una batería, que mantiene un
voltaje a través de la membrana celular. Esta batería se mantiene a través de pequeños orificios en la
membrana llamados canales iónicos . E El ion ese

B
Bell Labs era el departamento de investigación del monopolio telefónico AT&T. Para aquellos demasiado
jóvenes como para recordarlo, el sistema de telefonía fija en los Estados Unidos estaba originalmente controlado
por una empresa monopólica, AT&T. Se dividió en muchas pequeñas empresas en 1984.
La mejor descripción de la teoría de la información y su papel en la criptografía que he visto jamás está en el
Cryptonomicon de Neal Stephenson , en el que los Aliados intentan determinar cómo utilizar los códigos alemanes
y japoneses que han descifrado (que descifraron utilizando la naciente teoría de la información) de tal forma que los
alemanes y los japoneses no se den cuenta de que los códigos han sido descifrados.
El concepto de “información” resulta ser idéntico al concepto termodinámico de entropía, y por lo tanto la cantidad de información necesaria

para describir un sistema se denomina “entropía” del sistema.

La física de la entropía, la teoría de la información y la termodinámica quedan fuera del alcance de este libro, pero
hay muchos libros buenos sobre el tema. Recomiendo Decoding the Universe de Charles Seife, The Quark and the
Jaguar de Murray GellMann o The Cosmic Code de Heinz Pagels o su Perfect Symmetry . El nuevo libro de James
Gleick , The Information, A Theory, A History, A Flood, es un excelente análisis de la historia y el significado de la
teoría de la información.
mi
En realidad, los canales iónicos no son agujeros, sino bombas especializadas. Cada canal solo permite
el paso de ciertos iones. Por eso, existen canales de potasio, que solo permiten el paso de potasio (continuación)
Machine Translated by Google

Apéndice A 243

Los canales están formados por proteínas de formas intrincadas que forman dispositivos mecánicos que permiten el
flujo de ciertos iones, mientras que restringen el flujo de otros iones. Las proteínas están formadas por largas cadenas
de aminoácidos que siguen el patrón del ADN, traducido a través de los mecanismos del ARN.

Estos canales iónicos son pequeñas máquinas mecánicas. Mientras que algunos de ellos
están constitutivamente abiertos, permitiendo siempre el flujo de iones específicos, otros pueden
abrirse y cerrarse. Por ejemplo, un tipo de canal, el canal de potasio dependiente de voltaje, tiene
literalmente una bola de aminoácidos en una cadena de aminoácidos unida a la base. Cuando el
voltaje en la célula cambia, la cadena cambia de forma y la bola se mete en el canal, bloqueándolo.
Como otro ejemplo, el canal de sodio dependiente de voltaje se retuerce como un iris para abrirse
o cerrarse dependiendo del voltaje de la membrana. En realidad, hay muchos subtipos de canales
de potasio y sodio dependientes de voltaje, cada uno con propiedades ligeramente diferentes.
Estas propiedades cambian la dinámica de la neurona para que realice el procesamiento de
información que realiza. Este paso desde el cual los canales iónicos se expresan en el lugar de la
neurona hasta cómo esa neurona procesa la información es un área de investigación muy activa
en la neurociencia actual. Algunos de estos pasos son conocidos, otros todavía se están
investigando.

Procesamiento de información en neuronas

La clave para el procesamiento de la información en el cerebro es un fenómeno llamado potencial de acción o (más
coloquialmente) el “pico”. Un pico es un evento breve en el que se abren canales específicos que permiten la entrada
de iones positivos, lo que cambia el voltaje a través de la membrana; luego, el primer conjunto de canales comienza a
cerrarse y se abre un segundo conjunto de canales, lo que reduce el voltaje. Todo este proceso lleva unas milésimas
de segundo (unos milisegundos). Una célula integra los cambios en su voltaje a través de la membrana y dispara un
pico cuando ese voltaje se vuelve lo suficientemente grande (cruza un umbral). 3

Siguiendo las definiciones de Shannon, la información se puede medir comparando el grupo de situaciones en las
que una célula (o un conjunto de células) emite un impulso con el grupo de situaciones en las que la célula (o el
conjunto de células) está en silencio. 4 Recuerde que Shannon definió la información como separaciones entre grupos:

emitir o no un impulso es una pregunta de sí o no sobre algo y lleva información sobre ese algo, sea lo que sea. Para
responder cómo los neurocientíficos aprenden qué es ese algo, tendremos que esperar hasta el Apéndice B, donde
abordaremos cuestiones de medición de a qué están sintonizadas las células .

¿Cómo hacen llegar la información las células a la siguiente célula? Esto nos lleva al concepto de sin ,
ábsideque
). conecta una célula con otra. Una espiga en una célula libera una sustancia química (llamada
neurotransmisor ) a través de un espacio muy pequeño (20 nanómetros o 20 milmillonésimas de metro) entre las
células y cambia el voltaje de la otra célula. Algunas sinapsis son excitatorias
y hacer que la segunda célula tenga más probabilidades de disparar picos, mientras que otras sinapsis son inhibidoras.
y hacer que la segunda celda tenga menos probabilidades de disparar picos.

Los canales iónicos son canales que permiten el paso de iones, canales de sodio, que solo permiten el paso de
sodio, canales de calcio, canales de cloruro, etc. Se sabe muy bien cómo funcionan los canales iónicos y cómo se
,
genera el voltaje de la membrana, y se pueden encontrar descripciones en muchos libros de texto de neurociencia.
Para aquellos interesados, Neuroscience, editado por Dale Purves y colegas, es un excelente punto de partida. Para
aquellos que quieran una comprensión más profunda de los canales en sí, Ion Channels of Excitable Membranes de
Bertil Hille sigue siendo el texto clásico y es legible para un estudiante avanzado.
Machine Translated by Google

244 Apéndice A

Por supuesto, cuando hablamos de sistemas biológicos, las cosas nunca son tan sencillas. En realidad,
hay muchos neurotransmisores diferentes y muchos receptores sinápticos diferentes para detectarlos. Hay
receptores sinápticos en la neurona presináptica. También hay receptores sinápticos, llamados receptores
acoplados a proteína G , que, en lugar de permitir que los iones fluyan hacia adentro, liberan un complejo
proteico unido, que luego interactúa con otras proteínas dentro de la célula. Esto genera un interflujo
extremadamente complejo de procesamiento de información intracelular. En general, no necesitaremos
entrar en detalles sobre las cascadas de proteínas para este libro, pero son una parte importante del
procesamiento celular, particularmente en cómo las células cambian durante el aprendizaje.

En una primera aproximación, las neuronas toman información a través de sus dendritas, realizan
cálculos sobre ella en las dendritas y el soma, y luego envían información a través del axón, principalmente
al decidir cuándo y si disparar un potencial de acción (pico), que viaja por el axón y libera una sustancia
química a través de una sinapsis que conecta con otras neuronas en el cerebro. Como ocurre con todas
las primeras aproximaciones, esta descripción a menudo es errónea en los detalles, aunque sea correcta
en general. Algunas neuronas también realizan cálculos en sus dendritas; algunas neuronas se conectan
a través de sinapsis dendrita a dendrita; algunas neuronas no disparan potenciales de acción; algunas
neuronas se conectan con otras neuronas con conexiones eléctricas en lugar de sinapsis químicas; etc.
Pero la descripción inicial de una neurona con una dendrita, un soma y un axón, conectada a otras neuronas
a través de sinapsis, es suficiente por ahora.

Podemos imaginarnos a cada neurona en equilibrio entre las entradas excitatorias que la estimulan a
activarse y las entradas inhibidoras que la suprimen. El cerebro pasa el tiempo en un equilibrio dinámico
entre opciones, como un jugador de béisbol que se apoya sobre las puntas de los pies, listo para saltar
hacia adelante para robar la segunda base o listo para lanzarse de nuevo a la primera. Lo hace exactamente
por la misma razón que el corredor de bases: para poder reaccionar rápidamente.
Las teorías actuales sugieren que muchas disfunciones cerebrales son condiciones en las que algo se
ha desequilibrado. La epilepsia, por ejemplo, es casi con certeza una consecuencia de una inestabilidad
en la excitación (que alienta a las neuronas a disparar picos) y la inhibición (que las frena). 5 Lo interesante
de la naturaleza del equilibrio dinámico (en particular debido a su dependencia de la retroalimentación) es
que se puede producir el pico de epilepsia como un incendio forestal con una inestabilidad en la excitación
o una inestabilidad en la inhibición. También se están investigando otras enfermedades, como la
esquizofrenia, como equilibrios dinámicos que se han vuelto inestables. 6

Este equilibrio existe en todos los niveles, desde el nivel de sistemas, donde múltiples sistemas de
toma de decisiones compiten por una decisión, hasta el nivel neuronal, donde las entradas excitatorias e
inhibitorias se equilibran para mantener las neuronas funcionando al ritmo justo, hasta el nivel subcelular,
donde residen el aprendizaje y la memoria.

Memoria
La memoria puede definirse como cambios que reflejan una historia de modo que las respuestas futuras
difieran debido a ella. Así como todo lo que nos permitió diferenciar dos señales es información, todo lo que
cambia de manera confiable en respuesta a un pasado puede considerarse un recuerdo de ese pasado. La
abolladura en el guardabarros del automóvil "recuerda" que fue golpeado. El guardabarros será más débil
y puede responder de manera diferente la próxima vez. Uno de los principios de este libro es
Machine Translated by Google

Apéndice A 245

que todas las observaciones psicológicas y mentales que observamos tienen instancias físicas.

La materialización física de la memoria reside en los cambios que se producen en las sinapsis
que conectan las neuronas entre sí y en las cascadas de proteínas internas dentro de cada neurona.
Los cambios primarios en el sistema nervioso durante el aprendizaje se producen en las sinapsis: el
grado de efecto que la célula presináptica tiene sobre la célula postsináptica cuando esta última
activa su pico. Ahora se sabe que estos cambios se producen en todo el cerebro, en el hipocampo,
Nosotros ahora
la corteza, el cerebelo, los ganglios basales e incluso la médula espinal. 7
Sepa que estas fortalezas de conexión dependen del entorno interno de las cascadas de proteínas
8
dentro de la célula y del momento de los picos presinápticos y postsinápticos.

Un viaje de lo sensorial a lo motor

Podría ser útil hacer un recorrido desde un receptor sensorial hasta el cerebro. Como vimos en
nuestro ejemplo del termostato al principio del libro, un proceso de decisión requiere medir el mundo,
procesar la información oculta en esas mediciones y luego actuar en función de esa información.
¿Cómo percibe el mundo el sistema neuronal?
El primer paso es que debe haber neuronas sensoriales, neuronas que disparan potenciales de
F
acción en respuesta a estímulos Algunas células, como los bastones y los conos de la retina, reaccionan

sensoriales a través de cascadas de proteínas. Los bastones y los conos contienen una proteína
sensible a la luz llamada opsina ; en respuesta a los fotones que golpean la retina, estas moléculas
cambian su forma, lo que provoca una cascada de otros cambios proteicos, el último de los cuales
es abrir un canal iónico y cambiar el voltaje en la célula. En otras células, la proteína de traducción
es un canal iónico directo en sí misma. Por ejemplo, las células pilosas del oído contienen canales
iónicos con pequeños resortes hechos de proteína en ellos. A medida que la onda sonora mueve los
pelos de la célula, los pelos tiran de los resortes proteicos, estirando el canal iónico y permitiendo
que los iones fluyan hacia adentro, cambiando el voltaje de la célula. Entonces, literalmente, estas
células tienen sensores que traducen o transducen la realidad física del mundo al mundo de
información interior de nuestros cerebros.
En el otro extremo, las neuronas motoras envían axones a los músculos. Los músculos son
células excitables al igual que las neuronas y también pueden disparar potenciales de acción (picos).
Debido a que todos los músculos se alinean en estructuras ordenadas, la activación de muchos
potenciales de acción en el tejido muscular se puede detectar eléctricamente con bastante facilidad.
Estos potenciales de acción basados en los músculos son los que se detectan en un ,
electrocardiograma (EKG [la K proviene del alemán Kardio que significa "corazón"]). En otros grupos
musculares, estas mismas señales generalmente se detectan con electromiografía (EMG [ myo
proviene de la palabra griega para músculo]). Cuando mueves cualquier músculo de tu cuerpo, los
músculos disparan potenciales de acción. Los potenciales de acción abren canales de calcio en la
célula muscular, que luego se traducen nuevamente en fuerza física por una proteína sensible al
calcio ( miosina ) que se contrae en presencia de calcio.

F
En realidad, la mayoría de las células sensoriales directas de los mamíferos no disparan potenciales de acción. Liberan

sustancias químicas sinápticas a una velocidad proporcional a su voltaje. Sin embargo, las células que se encuentran más abajo (por

ejemplo, las células ganglionares visuales de la retina o las neuronas del nervio auditivo) generalmente disparan potenciales de acción.
Machine Translated by Google

246 Apéndice A

La red neuronal que constituye el cerebro puede recibir información del mundo a través de sus
sistemas sensoriales y puede actuar sobre el mundo a través de sus sistemas motores. Este libro
trata de los pasos intermedios, de cómo una red de células, en constante flujo dinámico, procesa
la información que contiene para tomar las medidas adecuadas en las situaciones adecuadas.

Libros y artículos para lectura adicional • Eric

Kandel (2006). En busca de la memoria: el surgimiento de una nueva ciencia de la mente .

Nueva York: Norton .

• Joseph E. LeDoux (2002). El yo sináptico . Londres, Reino Unido: Penguin. •

Peter Dayan y Larry F. Abbott (2001). Neurociencia teórica . Cambridge, MA:
Prensa del MIT .

Los detalles de cómo funcionan las neuronas se dan en los primeros capítulos de muchos libros de texto
de neurociencia, muchos de los cuales son realmente fáciles de leer para aquellos que no tienen miedo de
sumergirse en el tema.

• Dale Purves et al. (2008). Neurociencia . Sunderland, MA: Sinauer Associates. • Neil R.
Carlson (2010). Fisiología del comportamiento . Boston: Pearson. • Eric
Kandel, James H. Schwartz y Thomas M. Jessell (2000). Principios de la neurociencia .
Ciencia . Nueva York: Elsevier .
Machine Translated by Google

Apéndice B

RECOPILACIÓN DE INFORMACIÓN DEL CEREBRO

Las nubes ocultan la cumbre,

pero la creo en mi mente.

Al ver la montaña, la creo en

mi mente.

Las neuronas transmiten información disparando potenciales de acción y se conectan

con otras neuronas a través de sinapsis. Como acabamos de ver, un potencial de
acción es un cambio breve en el voltaje de la membrana de la célula (normalmente
de un milisegundo o más de duración). Si tuviéramos un cable u otro medio conductor
cerca de esa neurona cuando dispara su potencial de acción, sería detectable en el
cable como un pico rápido. Si tuviéramos un instrumento lo suficientemente sensible,
podríamos detectar ese pico. Hay muchas tecnologías que nos permiten ver señales
que reflejan esta actividad. Estas tecnologías nos permiten (en efecto) leer la mente
del animal, preguntarle qué está pensando, ver lo que ve y oír lo que oye. También
veremos tecnologías que nos permitan manipular (a un nivel limitado) esas señales
físicas y cambiar lo que hay en la mente del animal, lo que ve y lo que oye.

Representación de información con células en pico: curvas de ajuste

Cada neurona activa sus impulsos que transportan información sobre algún aspecto del mundo, alguna señal sensorial,
alguna acción motora que debe realizarse, algún proceso interno o alguna combinación de los tres. Una de las
preguntas clave en la neurociencia del comportamiento es: ¿Qué información codifica el patrón de impulsos de una
neurona?
Generalmente respondemos a esta pregunta relacionando la activación neuronal de una célula con alguna variable
de comportamiento a través de una curva de sintonización . Clásicamente, una curva de sintonización define la
probabilidad de que veas picos de una neurona determinada cuando ocurre un evento. Por ejemplo, una célula auditiva
en la corteza auditiva primaria puede estar sintonizada a una frecuencia de sonido específica. Si escuchas un tono a
esa frecuencia, esa célula disparará picos.
Otras células se sintonizarán con aspectos de ese sonido, el timbre, incluso la canción específica si la reconoces. Una
célula visual en la corteza visual primaria puede estar sintonizada con un punto de luz, pero otras células en las cortezas
visuales más profundas (a veces llamadas "células de orden superior") pueden estar sintonizadas con un punto de luz.

247
Machine Translated by Google

248 Apéndice B

Las cortezas cerebrales (porque sus representaciones requieren más procesamiento) están adaptadas a
caras, árboles u otros objetos.
Es importante tener en cuenta que la curva de ajuste de una célula no explica por qué la célula está
ajustada a esa información en el mundo, sólo que el disparo de la célula está correlacionado con ella .
Las células visuales están sintonizadas con las señales visuales porque la luz impacta en la retina, que
activa las células ganglionares de la retina, que transmiten información al tálamo, que luego envía señales
a la corteza visual, haciendo que las señales disparadas por la neurona en la corteza visual se correlacionen
con la entrada visual. Las células de la corteza motora primaria están sintonizadas con movimientos
musculares específicos porque envían su salida a las neuronas que controlan los motores en la médula
espinal, por lo que su activación influye en el músculo y sus señales se correlacionan con su
movimientos.
Muchos neurocientíficos dirán que las curvas de sintonía sólo se pueden aplicar a variables de conducta
que se relacionan directamente con el mundo inmediato del animal, señales sensoriales (después de un
destello de luz, un sonido específico) o acciones motoras (precedentes al movimiento de un músculo
específico), pero el cerebro es un objeto físico. Cuando piensas en tu abuela, se activan algunas células
que representan la información sobre ella.
Si piensas en cómo se veía la última vez que la viste, se activan células que representan información sobre
su rostro. Si piensas en su voz, se activan células que representan información sobre cómo sonaba.

Gran parte de la literatura neurocientífica popular más antigua hablaba de la “célula abuela”, lo que
implicaba que había una sola célula en el cerebro que se activaba con los pensamientos de la abuela y
sólo de la abuela. Como veremos más adelante, esta hipótesis es incorrecta.
Las representaciones en el cerebro están distribuidas . Algunas células se activarán más para las mujeres
que para los hombres, otras células para las personas mayores más que para los jóvenes y otras células
para aspectos específicos de su abuela, como su voz o su rostro, y es ese conjunto de células el que
representa el concepto de su abuela, no cualquiera de esas células.
Para entender el concepto de una representación distribuida, imagine que enciende la televisión y ve
que está mostrando un partido de fútbol. Quiere saber qué equipos están jugando porque quiere decidir si
es un partido que quiere ver, pero la cámara simplemente pasa por encima de la audiencia. (Para que
este experimento mental funcione, deberá ignorar el hecho de que los programas deportivos de televisión
modernos tienen pequeños cuadros de texto en la esquina de la pantalla que le indican quién está jugando
y cuál es el resultado). A partir de la ropa de los fanáticos, probablemente podría hacer una muy buena
suposición sobre los dos equipos. Mirar a un solo fanático no le dirá. Tal vez a esa persona simplemente le
guste ese equipo. Es posible que los fanáticos no usen la camiseta del equipo, pero es probable que usen
ropa con los colores del equipo. Si nota que la mayoría de los fanáticos usan los colores de un equipo
específico, eso es una buena indicación de qué equipos están jugando. Probablemente notará que hay
camisetas y colores de dos equipos que se representan con mucha más frecuencia. Los aficionados
representan información sobre qué equipos están jugando. De hecho, probablemente puedas determinar
qué equipo está jugando bien en un momento dado por las expresiones en los rostros de los aficionados
de un equipo en comparación con los del otro. Los aficionados son una representación distribuida de los
dos equipos: puedes aprender mucho sobre el juego con solo observar a los aficionados.

Matemáticamente, una célula puede representar cualquier variable siempre que su activación esté
relacionada de manera fiable con esa variable. Por ejemplo, las células del hipocampo de los roedores están
sincronizadas con la ubicación del 1animal.
A medida que el animal se desplaza por un entorno, una célula de lugar
determinada disparará picos en una ubicación preferida (el campo de lugar de la célula). Esto no es un
Machine Translated by Google

Apéndice B 249

No es una respuesta sensorial ni una señal de iniciación motora, sino una representación de la
ubicación.
Las curvas de sintonización a menudo implican una activación intensa ante un único estímulo
preferido, que luego disminuye a medida que el estímulo difiere de ese estímulo preferido. Por ejemplo,
las neuronas auditivas en la corteza auditiva primaria tienen una frecuencia preferida en la que activan la
mayor cantidad de picos; a medida que la frecuencia del sonido suministrado disminuye en cada dirección,
2 Cada neurona auditiva tiene una frecuencia preferida
la cantidad de picos que activa la célula disminuye.
diferente. Cuando escuchas una nota, cada célula disparará picos que reflejen los armónicos de esa nota.
Las células de lugar en el hipocampo tienen una ubicación preferida. En el centro de ese campo de lugar,
la célula dispara la mayor cantidad de picos de manera más confiable; a distancias de ese campo de
lugar, la célula dispara cada vez menos picos, hasta que se queda en silencio. Cada célula de lugar está
sintonizada con una ubicación diferente en el espacio en un entorno diferente. La representación de una
posición en el entorno implica una distribución de células que disparan, algunas (con ubicaciones
preferidas cerca de la posición) disparan mucho y algunas (con ubicaciones preferidas lejos de la posición)
disparan solo un poco.
Sin embargo, las curvas de ajuste no tienen por qué tener un único estímulo preferido. 3 Lo único
que importa es que el pico de la célula sea informativo de manera confiable acerca de la variable conductual.
Dado que la información tiene como objetivo definir grupos, esto equivale a decir que la variable
conductual debe brindar información confiable sobre los tiempos de activación de la célula. 4
Esto significa que podemos determinar información sobre la representación del mundo que tiene el
animal a partir del disparo de las células. Volvamos a las células de lugar. Cada célula de lugar está
sintonizada con una ubicación diferente en el espacio. Esto significa que podemos invertir la curva de
sintonización: si sabemos qué ubicación está representada por esa célula de lugar, entonces cuando esa
célula de lugar dispara picos, podemos inferir que el animal está representando información sobre esa
ubicación. Aun así, un campo de lugar típico es bastante grande. (En ratas, los campos de lugar pueden
variar en tamaño desde 20 centímetros hasta metros5 de
) Aún más importante, la relación entre los picos de
longitud.
disparo y la ubicación del animal no es del 100%. A veces, una célula dispara picos cuando el animal está
fuera del campo de ubicación de la célula; a veces, la célula no dispara cuando el animal está en el campo
de ubicación. Pero si tenemos dos células con campos de ubicación superpuestos, podemos ser más
precisos porque podemos determinar si la primera célula está disparando pero no la segunda, si la
segunda célula está disparando pero no la primera, o si ambas están disparando.
Las tecnologías actuales nos permiten registrar simultáneamente hasta varios cientos de células de
animales despiertos y en movimiento. Al integrar la información de cientos de células, podemos descifrar
6 A partir de varios cientos de células,
la ubicación con bastante precisión.
podemos decodificar la ubicación con una precisión de más de un centímetro. Incluso podemos
determinar cuándo las células representan una ubicación diferente de la ubicación actual del
animal. 7
Podemos determinar dónde está imaginando o pensando el animal.
Podemos leer la mente de la rata.

A
La forma en que estas células de lugar determinan la ubicación del animal para decidir cuándo disparar las
púas es un asunto complejo: la rata no tiene un GPS incorporado para determinar su ubicación. Lo que sucede en
realidad es que mantiene un registro de su posición mediante la estimación (si sé dónde estoy y doy un paso hacia
adelante, sigo sabiendo dónde estoy, estoy un paso por delante de donde estaba) y aprende a asociar señales
espaciales (como puntos de referencia) con esas representaciones de ubicación, lo que permite al animal restablecer
su representación cuando se pierde. Para aquellos interesados, mi libro anterior Beyond the Cognitive Map describe
este proceso con gran detalle.
Machine Translated by Google

250 Apéndice B

Otras señales

Potenciales de campo locales (LFP)

Dado que ya hemos hablado sobre el registro de señales eléctricas y la identificación de patrones de
activación neuronal a partir de ellas, una buena próxima señal para discutir es el potencial de campo local ( LFP ).
Si se toma la misma señal eléctrica que aparece en los electrodos y se escuchan los componentes de baja
frecuencia en lugar de los de alta frecuencia, se pueden registrar. Actualmente, nadie está completamente
B LFP.
seguro de cómo se generan las LFP, pero parecen estar relacionadas con las corrientes eléctricas
8
lentas que surgen de las sinapsis.
En muchas estructuras cerebrales como el hipocampo y los ganglios basales, las células cercanas no
tienden a procesar la misma información, y las señales LFP no llevan información sobre la tarea en cuestión,
pero sí sobre cómo el cerebro está procesando esas tareas. 9 Estas señales LFP tienden a indicar el estado
del sistema y probablemente reflejen diferentes regímenes de procesamiento. Por ejemplo, cuando estás
atento, escuchando activamente a alguien que te habla o intentando activamente comprender nueva
información que estás leyendo, la señal LFP en tu hipocampo muestra un ritmo de 7 a 10 Hz, casi sinusoidal,
llamado “actividad lenta rítmica” (RSA) o theta (por la banda de frecuencia que cubre). Por el contrario, si
te estás desvaneciendo, sin escuchar realmente, perdiendo la atención, quedándote dormido, la señal LFP
en tu hipocampo muestra una actividad arrítmica de espectro más amplio llamada “actividad irregular de
gran amplitud” ,(LIA). 10

En contraste, en el neocórtex de los mamíferos, las células cercanas sí procesan información similar. 11 (Una
de las cosas más notables sobre la corteza de los mamíferos es que, aunque el cerebro en sí es
incuestionablemente tridimensional en su conectividad y su estructura, la corteza en sí es más una lámina que
una estructura tridimensional. Las seis capas de corteza forman una lámina delgada que cambia enormemente en
área pero no mucho en profundidad entre mamíferos. La evolución parece estar tomando una plantilla específica
y copiándola en 12 ) Debido a que las unidades de procesamiento en dos dimensiones para hacer cortezas cada
en pequeñas columnas de 0,3 milímetros de ancho, donde todas vez más grandes. corteza están dispuestas
las células en una columna están procesando cosas similares, hay evidencia de que las LFP en la corteza pueden
llevar señales sobre la información en esa columna. 13

Imagina que estás intentando entender el juego de fútbol americano pero no puedes verlo. Todo lo que
tienes es un micrófono que puedes bajar para escuchar a una sola persona.
Quizás puedas escuchar al mariscal de campo o al entrenador y aprender mucho sobre el juego.
Esto es como una grabación unicelular, donde descubres que la señal de tu micrófono te dice mucho sobre
la variable de comportamiento (el juego). Por otro lado, puedes terminar escuchando al fanático borracho
en la tercera fila, o al hombre de negocios discutiendo sobre ventas de acciones, y no encontrar mucha
relación con lo que está sucediendo en el juego. Sin embargo, si levantas tu micrófono y escuchas el rugido
de la multitud, también puedes aprender sobre el juego. Si escuchas

B Recuerde que los picos son destellos de 1 milisegundo, por lo que se ven mejor con filtros de frecuencia
configurados alrededor de 1 kilohertz (cambios que ocurren en el orden de 1 milisegundo). Los picos generalmente se
registran utilizando filtros configurados de 600 Hz a 10 kHz, que detectan cosas que suceden en el orden de un
milisegundo o más rápido. Los LFP generalmente se registran utilizando filtros configurados de 0,1 a 400 Hz, que
detectan cosas que suceden en el orden de décimas o centésimas de segundo.
Machine Translated by Google

Apéndice B 251

Si la multitud grita "¡Defensa! ¡Defensa!" o si la multitud está muy callada, puedes determinar con bastante precisión qué

equipo está a la ofensiva y cuándo. Puedes saber cuándo ocurre una jugada realmente buena (o realmente mala)

simplemente escuchando el volumen de la multitud. Eso es como el LFP en el hipocampo o en los ganglios basales. Si

todos los fanáticos de un equipo están sentados juntos y todos los fanáticos del otro equipo están sentados juntos, incluso

podrías saber qué equipo está ganando por el volumen de los gritos de cada grupo. Eso es como el LFP en la corteza.

El electroencefalograma (EEG)
Muchas personas están familiarizadas con una forma de LFP registrada fuera del cráneo: el electroencefalograma (EEG).

14 Los electrodos de EEG se colocan alrededor del cuero cabelludo y registran los mismos tipos de ondas que los LFP.

Al igual que con los LFP, los EEG se utilizan principalmente para categorizar los estados cerebrales. Muchas personas,
por ejemplo, están familiarizadas con el sueño de ondas lentas y REM, que se pueden identificar por las oscilaciones del

EEG. Los diferentes estados de ánimo y atención también se pueden medir por los cambios del EEG. Por ejemplo, los

estados tranquilos y relajados a menudo se identifican con ritmos de EEG (que surgen de la corteza) en el rango de 8 a

12 Hz (confusamente llamados "ondas alfa" en la literatura sobre EEG y "ondas theta" en la literatura sobre LFP).

Las personas pueden aprender a controlar sus ritmos EEG. 15 En la actualidad, existen juegos que
utilizan señales de EEG para controlar pelotas o luces. Se dice que estos juegos permiten “controlar
la pelota con la mente”. Miden las señales de EEG de un auricular y utilizan la relación de potencia
en diferentes regímenes de frecuencia (normalmente alfa [8–12 Hz] a beta [12–30 Hz]) para cambiar
la velocidad de un ventilador que impulsa una pelota hacia arriba o hacia abajo. 16
Cuando las señales de EEG se miden en respuesta a eventos de impulso en lugar de observar las frecuencias en

curso en la oscilación, estas señales a veces se denominan potenciales relacionados con eventos (ERP). 17 Ocurren
cuando un solo evento impulsa suficiente actividad en el cerebro para ser detectado como un cambio brusco en el EEG.

Una de las señales ERP más estudiadas es la negatividad relacionada con el error (ERN), en la que el EEG registrado

en la parte frontal del cuero cabelludo cambia en respuesta a la realización de un movimiento. Curiosamente, esta
18 un error.
actividad ocurre aproximadamente 100 milisegundos después de que uno comienza el movimiento, lo que

puede ser mucho antes de que el movimiento se complete. (El ERN parece reflejar esa señal de "oops, eso está mal" que

a veces sentimos cuando reaccionamos demasiado rápido). Ahora sabemos que el ERN surge de señales en la corteza

cingulada anterior, que está involucrada en el monitoreo de acciones y permite que uno tome una acción diferente de la

que normalmente tomaría. (Véase, por ejemplo, la discusión sobre la superación de una fobia y el enfrentamiento de los

propios miedos en nuestra discusión sobre el autocontrol en el Capítulo 15.)

Registro de picos de pacientes humanos Los

experimentos primarios de medición de información en este libro provienen de experimentos con animales porque

tenemos la tecnología para registrar neuronas individuales y conjuntos neuronales en animales. C Dicha tecnología

también funciona en humanos, pero requiere

do
Es importante destacar el gran cuidado que tienen los neurocientíficos, en particular los neurocientíficos del
comportamiento, en el tratamiento de sus animales. Un animal angustiado no realiza bien las tareas, en particular las
tareas complicadas como las que se requieren para los experimentos de toma de decisiones. Todos los experimentos

con animales (continuación)

Machine Translated by Google

252 Apéndice B

implantación de electrodos de alambre en el sujeto; por lo tanto, esto se hace sólo con fines clínicos
tratamiento.
En ocasiones, se permite a los científicos aprovechar la implantación clínica y (con el permiso del
sujeto y la supervisión de un comité de revisión) registrar los electrodos implantados por otros motivos.
Dos ejemplos de casos en los que se implantan de forma rutinaria dichos electrodos son la
determinación de los sitios de inicio de las convulsiones epilépticas y la estimulación cerebral profunda
para el tratamiento de la enfermedad de Parkinson.
En pocas palabras, la epilepsia implica que las neuronas se vuelven locas. El primer tratamiento
que se intenta son generalmente los medicamentos anticonvulsivos, pero eso funciona sólo para una
porción limitada de la población epiléptica. 19 Si los tratamientos farmacológicos no funcionan, una
opción alternativa es literalmente quemar la parte del cerebro que se vuelve loca. Por supuesto, dañar
la parte equivocada del cerebro es extremadamente problemático (hemos visto algunos ejemplos
trágicos en este libro), y los médicos son muy cuidadosos para hacer todo lo posible para asegurarse
de que sólo obtienen el punto de partida correcto para la epilepsia y que la parte que van a extirpar no
está involucrada en facultades intelectuales críticas. Para hacer esto, implantan electrodos y registran
20
neuronas individuales y LFP mientras el sujeto realiza
Dado quetareas.
tener los electrodos en el cerebro no es un
proceso doloroso y el registro de las neuronas no daña el cerebro, muchos pacientes están felices de
realizar algunas tareas cognitivas adicionales y permitir que los científicos registren su cerebro durante
el procedimiento.
Sin embargo, estas grabaciones sólo se pueden tomar en situaciones muy limitadas (durante las
raras ocasiones en que un paciente tiene una razón clínica para tener electrodos implantados) y en
pacientes con cerebros disfuncionales (por eso están recibiendo el tratamiento clínico). Para estudiar la
función normal en no pacientes, necesitamos una tecnología capaz de registrar señales neuronales de
sujetos despiertos. Ya hemos hablado del EEG. Existe una tecnología de medición relacionada llamada
MEG que funciona como el EEG pero utiliza el componente magnético de la onda electromagnética.
Aunque el cráneo distorsiona menos el MEG que el EEG, tanto el MEG como el EEG sufren de una
incapacidad para localizar la señal. Estas tecnologías pueden apuntar a la "corteza frontal" en lugar de
a la "corteza visual" (que está en la parte posterior del cerebro), pero no pueden decirte qué está
sucediendo en el componente de reconocimiento de formas de la corteza visual, o el cuerpo estriado
de los ganglios basales, o el hipocampo.

Imágenes por resonancia magnética funcional (fMRI)

Si ha seguido la neurociencia en la prensa popular durante las últimas décadas, probablemente se esté
preguntando por qué no he incluido la resonancia magnética funcional (fMRI) hasta ahora. La fMRI se
ha convertido en una técnica muy querida por la prensa popular porque permite obtener información
sobre el cerebro de sujetos humanos normales y crea imágenes hermosas.
Se puede realizar en personas normales que realizan tareas humanas complejas, como el lenguaje y la
cognición. Pero lo que es realmente importante entender sobre la fMRI (y sus parientes, como la
tomografía por emisión de positrones [PET]) es que mide el flujo sanguíneo, no la actividad neuronal.
21

Los experimentos que se llevan a cabo en cualquier universidad moderna deben ser aprobados por un comité de cuidado
de animales que incluye tanto a veterinarios y activistas comunitarios como a científicos. Este comité no solo tiene la tarea
de verificar el tratamiento de los animales, sino también de determinar si el experimento que se está realizando es “lo
suficientemente importante” como para justificar el uso de los animales.
Machine Translated by Google

Apéndice B 253

La fMRI mide el giro magnético de las moléculas de hemoglobina en la sangre.

La sangre de los mamíferos transporta oxígeno a los tejidos uniéndolo a la molécula de hemoglobina. La
hemoglobina con oxígeno unido es más roja que la hemoglobina libre; también tiene una resonancia
diferente a los cambios magnéticos. Una máquina de fMRI es un conjunto de imanes muy grande y muy
potente. Al cambiar el campo magnético de maneras específicas, puede detectar el nivel de oxígeno en la
sangre.
Las máquinas de fMRI modernas con imán de alto campo pueden medir el nivel de oxigenación en un
cubo de tejido de aproximadamente un milímetro. Si bien un vóxel (píxel de volumen) de 1 mm × 1 mm × 1
mm parece pequeño, las neuronas individuales tienen típicamente 50 micrómetros de diámetro (8000
veces más pequeñas). Por razones computacionales, los experimentos de fMRI a menudo utilizan vóxeles
mucho más grandes, incluso de 3 o 4 mm de lado. (La PET requiere un tamaño de vóxel aún mayor). Eso
significa que cada vóxel podría contener cien mil neuronas.
Incluso aceptando que las neuronas son sólo una pequeña porción del tejido cerebral (la mayor parte del
cual contiene estructuras de soporte, como capilares, células gliales de soporte y los axones y dendritas
de las neuronas), ese vóxel todavía contiene decenas de miles de neuronas.
¿Qué tiene que ver entonces la oxigenación de la sangre con la actividad neuronal? A estas alturas, sabemos que están

relacionadas, pero no exactamente de qué manera. Ésta sigue siendo un área de investigación activa en neurociencia.
22
Sabemos que cuando un área está “neuronalmente activa” (por ejemplo, su
corteza visual primaria está más activa cuando está mirando una escena visual parpadeante, como una
película, que cuando está cerrando los ojos y escuchando una escena auditiva, digamos escuchando
música), las células están usando glucosa, extrayendo energía adicional del cuerpo.
23;D Las neuronas sobrecargadas envían una señal a los capilares para permitir que fluya
más sangre. En realidad, las neuronas no necesitan más oxígeno, por lo que fluye más sangre, pero se
extrae la misma cantidad de oxígeno, por lo que lo que fluye se vuelve menos desoxigenado, lo que es
detectable con una resonancia magnética. Estos cambios en el flujo sanguíneo se denominan respuesta
hemodinámica, que se produce en el transcurso de unos 4 a 5 segundos. (Recuerde que un solo pico
neuronal es 1 milisegundo, es decir, ¡1/1000 de segundo!) El tiempo de reacción humano típico a un
estímulo sorprendente es de solo unos pocos cientos de segundos.
dred milisegundos. Los investigadores de resonancia magnética han desarrollado formas de inferir la
"actividad neuronal" a partir de la respuesta hemodinámica para identificar el momento, relacionando
esencialmente el flujo sanguíneo con eventos que ocurrieron 4 a 5 segundos antes de que se detectara la
señal, pero incluso eso no puede llegar a lo que están haciendo las neuronas individuales o el momento
específico de sus picos.
No está claro en este momento qué está causando que las neuronas gasten toda esa energía. Esto
significa que la fMRI puede decirnos qué partes del cerebro están trabajando duro, pero no puede decirnos
cómo las neuronas en esa parte del cerebro están procesando la información.

El cerebro es un componente del cuerpo que consume mucha energía. Aunque representa solo un par de por ciento del
peso corporal (un cerebro típico pesa un poco menos de 1,5 kg [3 libras]), consume aproximadamente el 20% de las reservas
24
de energía habituales.
Esta es la clave del béisbol: un lanzamiento a 100 mph tarda 400 milisegundos en llegar al plato. Esto significa que un
bateador tiene aproximadamente menos de la mitad de la distancia entre el montículo y el plato para decidir si golpear o no la
pelota y para determinar dónde estará la pelota y cuándo cruzará el plato. Por supuesto, si un bateador puede predecir qué
lanzamiento vendrá antes de que el lanzador lo lance, el bateador puede estar mejor preparado para reconocer el lanzamiento.
Esta es la esencia de la inteligencia: usar la información y las expectativas para ayudar a tomar mejores decisiones rápidamente.
Machine Translated by Google

254 Apéndice B

Correlación y causalidad

Todas las tecnologías descritas anteriormente son correlacionales . Se preguntan hasta qué punto cambian

juntas dos señales: una señal neuronal (activación de neuronas, LFP, EEG, flujo sanguíneo en el cerebro) y una variable

conductual (la ubicación del animal, una señal sensorial, una acción motora). Lógicamente, la correlación no es causalidad. El

hecho de que dos cosas ocurran simultáneamente no significa que una haya causado la otra. La correlación es necesaria

(aunque no suficiente) para la causalidad y, en la práctica, es un indicador bastante bueno de causalidad. Sin embargo, los

científicos en general, y los científicos médicos en particular, están particularmente preocupados por la causalidad porque no

quieren cometer el error de pensar que dos cosas que ocurren simultáneamente se causan mutuamente. Por eso han

desarrollado varias tecnologías que permiten controlar el sistema.

Lesiones

El método más antiguo de manipulación del sistema era dañarlo físicamente, lesionar una parte del
mismo. Si esa parte es crítica para realizar alguna tarea, entonces el animal (humano o no) se verá
afectado en esa tarea. Obviamente, no se puede entrar y lesionar tejidos humanos con fines
experimentales. Sin embargo, el cerebro es un órgano biológico particularmente sensible, que
requiere un flujo sanguíneo constante. Cortar el suministro de sangre (o incluso el de oxígeno)
incluso durante unos pocos minutos puede provocar la muerte neuronal, dejando a la persona con
una desafortunada lesión cerebral.
26 Esto es lo que ocurre durante un accidente cerebrovascular, por ejemplo.
F

Debido a la forma en que se ramifican los vasos sanguíneos del cerebro, es común que un accidente cerebrovascular

ocurra por encima de la corteza parietal derecha (justo encima y detrás de la oreja derecha). 28 Cuando esta parte del cerebro

está dañada, las personas tienen problemas para reconocer el lado izquierdo de los objetos visuales.

G Esta incapacidad para reconocer objetos en un lado del campo visual se denomina negligencia hemiespacial

porque implica la incapacidad de procesar (descuida) la mitad del (hemi) campo visual espacial. Los pacientes con negligencia

hemiespacial dibujarán solo el lado derecho de un reloj y verán el reloj solo si está en el lado derecho de su campo visual.

La negligencia hemiespacial ocurre incluso en espacios imaginados. En un experimento clásico, Eduardo Bisiach y Claudio

Luzatt pidieron a pacientes con negligencia hemiespacial que imaginaran la Piazza Del Duomo en Milán (la ciudad natal de los

pacientes). 30 Pidieron a los pacientes que imaginaran estar de pie en el extremo sur de la Piazza y que nombraran los edificios

de la plaza. Cada paciente enumeraba solo los edificios del lado este (su derecha). Cuando se les pidió que imaginaran estar

de pie en el extremo norte y que nombraran los edificios, nombraron solo los del lado oeste (su derecha). Cuando se les

presionó, dijeron que eso era todo lo que podían.

F
En realidad, durante un accidente cerebrovascular se producen varios procesos dañinos a lo largo de minutos, horas o días.

Uno de esos procesos es que la disminución del flujo sanguíneo puede hacer que las células pierdan el equilibrio y comiencen a disparar a un

ritmo elevado, lo que provoca la muerte de las células. Un tratamiento que pueda llegar a las células antes de que mueran puede ayudar a

reducir o incluso prevenir el daño cerebral causado por un accidente cerebrovascular. 27

Los sistemas sensoriales y motores se cruzan en el cerebro. Así, el campo visual izquierdo y la mano izquierda son procesados por el
GRAMO

lado derecho del cerebro. Lo que, en la evolución de los sistemas, los llevó a cruzarse todavía es objeto de debate, pero hay algunas pruebas

de que los primeros animales de presa tenían conexiones directas desde los sistemas sensoriales hasta los músculos del lado opuesto. 29 Si

algo viene hacia ti por el lado izquierdo, ¡quieres ir hacia la derecha rápidamente!
Machine Translated by Google

Apéndice B 255

¡Imagínense, aunque habían nombrado los otros edificios sólo unos minutos antes!
31
La imaginación visual utiliza los mismos sistemas perceptivos que usamos al ver.
Otros accidentes cerebrovasculares comunes afectan notoriamente ciertas áreas motoras y del
lenguaje, lo que lleva a incapacidades para procesar el lenguaje. Debido a que diferentes accidentes
cerebrovasculares afectan la capacidad de reconocer o producir lenguaje, incluso en la década de 1870,
Paul Broca (18241880) y Carl Wernicke (18481905) pudieron identificar por separado las ubicaciones del
cerebro humano que controlaban la producción del habla (ahora llamada área de Broca ) o el reconocimiento
del habla (ahora llamada área de Wernicke ). 32
Las lesiones cerebrales también pueden surgir de procedimientos médicos, algunos intencionales,
otros no. Por ejemplo, la epilepsia que no se puede controlar por medios farmacológicos (con medicamentos)
33
aún puede controlarse a veces eliminando el foco o el sitio de origen. La La epilepsia es como una avalancha.

epilepsia es una enfermedad que no tiene un punto de partida, desde el cual se propaga. Si ese punto de
partida es constante de una crisis a otra en un paciente y se puede encontrar, se puede eliminar. Por
supuesto, eliminar una parte del cerebro daña su capacidad para procesar información, pero a veces se
debe encontrar un equilibrio entre vivir con epilepsia y vivir con un cerebro dañado.
La resección (extirpación) del hipocampo en pacientes epilépticos (como HM) fue fundamental para el
descubrimiento de que existen al menos dos sistemas de toma de decisiones separados (deliberativo,
dependiente de la función hipocampal, y procedimental, independiente de la función hipocampal). 34
El problema de inferir funciones a partir de estudios de lesiones es que para resolver tareas se
necesitan muchos componentes. Volvamos a la analogía del termostato del capítulo 2: hay muchas lesiones
que se podrían hacer al termostato que enfriarían tu casa.
El horno podría estar averiado. Si es un horno a gas, la llama piloto podría estar apagada o el gas
apagado. El sensor de temperatura podría estar averiado. Todo esto haría que el calefactor no se
encendiera y que la casa estuviera fría, pero no queremos concluir que el sensor de temperatura y la luz
piloto estuvieran haciendo lo mismo.
El otro problema de las lesiones es el de la compensación . Como organismos biológicos, tenemos
sistemas de respaldo. (Durante la mayor parte de la evolución, no había un taller de reparación al que
acudir si algo se estropeaba, por lo que los animales que desarrollaron sistemas de respaldo tenían más
probabilidades de sobrevivir y procrear que los que no los tenían). Si un animal ha tenido tiempo suficiente
para recuperarse de la lesión, puede haber encontrado nuevas formas de hacer algo y puede ser capaz de
resolver las mismas tareas de formas diferentes a las que lo haría un animal intacto.

Inactivación temporal de partes del cerebro

Para evitar la compensación, y puesto que no se puede controlar moralmente las lesiones que se ven en
los seres humanos (las únicas lesiones humanas que se van a ver son las causadas por fenómenos
naturales), los científicos han desarrollado varias técnicas complejas para inactivar partes del cerebro de
forma fiable. La técnica más común utilizada en animales es farmacológica, en la que se infunde en una
zona del cerebro una cantidad muy pequeña de una sustancia química que afecta temporalmente a las
neuronas. Por ejemplo, la lidocaína bloquea un tipo determinado de canal de iones de sodio, lo que impide
que las neuronas se activen. Cuando el dentista inyecta lidocaína debajo de la encía, impide que los
nervios de la piel se comuniquen con el cerebro, lo que deja la boca entumecida ante cualquier dolor que
pudiera causar el procedimiento posterior.
En los seres humanos, no se desea inyectar sustancias químicas en el cerebro de los sujetos
experimentales, pero recientemente se ha desarrollado una nueva tecnología llamada estimulación
magnética transcraneal (EMT). 35 La EMT crea un campo magnético que cambia rápidamente y que puede estimular
Machine Translated by Google

256 Apéndice B

y luego interrumpen la activación neuronal en un área específica de la corteza. El efecto es disruptivo pero
yo
transitorio y desaparece después de unos minutos.

Manipulaciones genéticas

Debido a que los procesos neuronales (como los canales sinápticos que escuchan neurotransmisores
específicos) dependen de la estructura genética de la célula de manera continua, al cambiar esa estructura
genética se modifica la forma en que la célula procesa la información. Ahora existen nuevas tecnologías
37 I
que permiten la manipulación directa de esa estructura genética. ;
Si se modifica el ADN (por ejemplo, para incluir la información para construir un nuevo y diferente tipo de
canal iónico), entonces la célula seguirá ese ADN.
Ahora sabemos que el ADN es más como un lenguaje de programación, con enunciados del tipo “si
entonces” y otros tipos de control local (como en “si la proteína X está presente, entonces también se
genera la proteína Y ”). Esto significa que las manipulaciones genéticas modernas pueden expresar nuevas
proteínas (nuevos canales iónicos, nuevos procesos) de modo que aparezcan sólo en un subconjunto
limitado de células, como por ejemplo sólo en las neuronas CA3 del hipocampo; o de modo que aparezcan
sólo en presencia de una sustancia química extrínseca, como el antibiótico doxiciclina; o de modo que sólo
aparezcan después de un cierto tiempo, como por ejemplo sólo en células que están activas (que disparan
muchos picos) durante la tarea. 39 Estas manipulaciones producen cambios en las capacidades de los
animales para resolver tareas, lo que nos informa sobre cómo funciona el sistema, físicamente.
En los últimos años, los investigadores han desarrollado una nueva tecnología que consiste en
implantar genéticamente en un animal un canal iónico sensible a la luz. 40 Estos canales producen cambios
de voltaje en respuesta a determinadas frecuencias de luz. Esto significa que si se proyecta una luz sobre
células que tienen estos canales, se puede inducir a las células a que emitan picos o impedir que lo hagan.
Como estos canales iónicos se pueden colocar en células específicas de áreas específicas del cerebro,
pueden proporcionar un control notable del mecanismo neuronal. Se trata de un campo en auge llamado
optogenética y tiene el potencial de revolucionar nuestra comprensión de los mecanismos reales de la
función cerebral.

Estimulación: manipulaciones eléctricas

Por supuesto, los sistemas celulares también son eléctricos y también se puede pasar corriente al sistema
para manipularlo. Por ejemplo, un tratamiento común para la enfermedad de Parkinson es la estimulación
cerebral profunda, en la que se coloca un electrodo en una estructura (comúnmente el núcleo subtalámico,
una parte de los ganglios basales). La estimulación regular de este electrodo (entre 50 y 200 Hz,
dependiendo de lo que funcione para el paciente) de alguna manera restablece el funcionamiento normal.
41
El núcleo subtalámico, lo que le permite procesar la información correctamente nuevamente.
La estimulación cerebral profunda hace maravillas en algunos pacientes, no sabemos por qué, no sabemos

La seguridad de la TMS aún es objeto de debate. 36 Para la mayoría de las personas, parece que los efectos a corto
plazo desaparecen bastante rápido, pero los efectos a largo plazo aún se desconocen.
I
Cabe señalar que hemos podido manipular los genes durante miles de años. Los humanos criaron perros para que
cría selectiva 38
fueran más amigables, vacas para que dieran más leche y maíz para que fuera comestible
mucho antes de las manipulaciones genéticas modernas. Las tecnologías modernas simplemente hacen que la
manipulación sea más directa.
Machine Translated by Google

Apéndice B 257

Se sabe cuál es el mecanismo. Hay muchas teorías, entre ellas la de que impide la activación
neuronal, apagando así una estructura disfuncional; que restablece las oscilaciones neuronales que
se han vuelto patológicas; y que facilita (o dificulta) la transmisión de información por parte de los
axones que pasan por la estructura. 42
La estimulación también puede utilizarse para manipular la información que se representa en el
cerebro. A mediados de los años 90, William Newsome y sus colegas lograron cambiar las decisiones
que tomaba un mono que observaba un estímulo visual estimulando ciertas partes de la corteza
visual. El mono tenía que decidir si un conjunto de puntos en una pantalla se movía en una dirección
u otra. Al estimular la parte del cerebro que representaba el movimiento visual, pudieron cambiar la
decisión del mono, presumiblemente modificando su percepción.
43

En realidad, la estimulación para escribir información en el cerebro se ha utilizado en humanos

durante más de 40 años. Los implantes cocleares funcionan colocando contactos eléctricos a lo largo de
44
oreja.
la parte interna del oído. Un micrófono externo traduce el sonido en la señal eléctrica adecuada
que esperan las células del oído. Los contactos eléctricos estimulan las células, lo que permite que el
cerebro escuche sonidos.

Varios laboratorios han intentado utilizar implantes de retina para restaurar la visión en pacientes
traducidasciegos . 45 De manera similar a los implantes cocleares, las imágenes externas son
por una cámara a señales eléctricas que se envían a electrodos de estimulación en la retina. Los
primeros ensayos clínicos están ahora en marcha. Una de las principales complicaciones de los
implantes cocleares y visuales es que la estimulación tiene que coincidir con las representaciones
neuronales que el cerebro espera. Al comprender los principios de la representación, hemos podido
comenzar el proceso de la cibernética, recuperando realmente la función perdida.

Libros y artículos para lectura adicional • Andrea

M. Green y John F. Kalaska (2011). Aprendiendo a mover máquinas con el 61–75 . • Adam Johnson,
mente. Tendencias en neurociencias, 34, André
A. Fenton, Cliff Kentros y A. David Redish (2009).
En busca de la cognición en la estructura del ruido. Tendencias en Ciencias Cognitivas, 13 55– ,
64 .
• Frederick Rieke, David Warland, Rob de Ruyter van Steveninck y William Bialek
(1996). Spikes . Cambridge, MA: MIT Press.

J Si aún necesitas convencerte en este punto de que la mente existe dentro del cerebro, esta es la prueba final.
La manipulación de la activación de las células cerebrales modifica la percepción, la decisión y la acción que
se lleva a cabo. Somos seres físicos.
Machine Translated by Google

Esta página se dejó en blanco intencionalmente

Machine Translated by Google

Apéndice C

CONTENIDO T MEMORIA DIRECCIONABLE

Los cactus brillan al sol.

Entonces las nubes ocultaron la
montaña, las calles como cañones se llenaron de agua...

Huelo dulce de

tuna en flor.

Los recuerdos en el cerebro se almacenan como patrones de activación a

través de las células y se recuperan según el contenido que contienen. Este
proceso se denomina “completar un patrón” porque un recuerdo se recupera
completando un patrón parcial de activación celular. Los mecanismos
neuronales de esto son bien comprendidos y tienen implicaciones
importantes para la forma en que reconocemos y recordamos, lo que tiene
implicaciones importantes para los sistemas de toma de decisiones.

Cuando una cámara digital toma una fotografía de la fiesta de cumpleaños de tu hijo y la escribe en su
tarjeta de memoria flash, traduce esa fotografía en un conjunto de señales de encendido y apagado (“bits”
A ), que escribe en la tarjeta. Luego escribe la ubicación en la “tabla de asignación de archivos”, que es
básicamente un índice de ubicaciones en la tarjeta de memoria. Cuando quieres recuperar la fotografía, la
cámara comprueba el índice, lo sigue y lee el archivo. Cuando la cámara almacenó por primera vez la
fotografía en su tarjeta de memoria, le dio un nombre como img_3541.jpg,
Lo cual no te dice nada sobre el contenido de esa imagen. Tu cerebro también puede almacenar información
como el recuerdo de la fiesta de cumpleaños de tu hijo en pequeños cambios a través de muchas neuronas,
en este caso a través de cambios en la fuerza de conexión entre neuronas. Pero no hay un índice central.
En cambio, el recuerdo completo se recupera del contenido parcial.
el olor de la tarta de cumpleaños, el sonido de la risa de los niños, la visión de un juguete específico.

A Recuerde que un bit es la respuesta a una pregunta de sí/no (Apéndice A). Ocho bits = un byte.
Cuando tu ordenador tiene 4 GB de memoria, eso equivale a 4 gigabytes, o 4 mil millones de bytes. Por supuesto,
no hace mucho tiempo los ordenadores solo tenían 1 MB (un megabyte = 1 millón de bytes) o incluso 640 KB (un
kilobyte = 1 mil bytes). Ahora, la tarjeta flash de mi cámara digital tiene 32 GB, y hay disponibles incluso más grandes.

259
Machine Translated by Google

260 Un apéndice

Recuperación Imagen Memoria direccionable por contenido

por índice

Stonehenge druidas

Salisbury
plano
neolítico Inglaterra

samurai

arquitectura de pagoda Japón

castillo
Himeji

Nuestra Señora París

Monet catedral gótica

Vidrieras

Figura C.1 Memoria direccionable por contenido. La información puede ser direccionada por índices (ya
sea por nombres relacionados [como stonehenge.jpg] o por nombres no relacionados [como
img_1054.jpg]) o por memoria direccionable por contenido. Las memorias direccionables por contenido
se almacenan de manera que se vinculen imágenes y conceptos similares. Así, una imagen borrosa
de Stonehenge, una imagen recortada en papel de Himeji y un dibujo a lápiz de Notre Dame recuperan
sus respectivas imágenes. De manera similar, las memorias pueden ser recuperadas por contenido conceptual.

El término memoria direccionable por contenido proviene de la literatura sobre ciencias de la computación y
psicología de la década de 1980. En ciencias de la computación, el término se usaba para contrastar con la
memoria direccionable por índice, que es la forma en que su computadora portátil, de escritorio o teléfono
inteligente almacena
1
Eninformación.
psicología, el término se utilizó porque la memoria humana se activa con 2
como las imágenes, los sonidos o los olores de la fiesta de cumpleaños. (comparar la figura C.1),
El concepto, sin embargo, proviene del famoso libro de Donald Hebb de 1949. 3

Conjuntos de células

Una de las frases más famosas de la neurociencia es “las células que se activan juntas se conectan
entre sí”, que supuestamente proviene de un libro de 1949 sobre neuropsicología del psicólogo
Donald Hebb. Sin embargo, esa frase no está en realidad en el libro de Hebb; en cambio, la cita es
de un párrafo que concluye: “Cuando un axón de la célula A está lo suficientemente cerca como para
excitar a una célula B y participa repetida o persistentemente en su activación, se produce algún
proceso de crecimiento o cambio metabólico en una o ambas células de modo que aumenta la
eficiencia de A, como una de las células que activa a B” (Hebb, 1949/2002, p. 62). De este párrafo,
obtenemos los términos sinapsis hebbiana y aprendizaje hebbiano .
El concepto de que la cocombustión conduce a un aumento de la conectividad es casi seguro
anterior a Hebb. En cierto sentido, es la traducción obvia de las teorías de que la mentación es
asociativa, que se remontan a David Hume en el siglo XVIII, si no antes. 4 El propio Hebb dice que
la idea general es antigua (Hebb, 1949/2002, p. 70). En su perspectiva histórica sobre la LTP, Bruce
McNaughton cuenta que Hebb se sorprendió por el entusiasmo por la
Machine Translated by Google

Apéndice C 261

la “sinapsis hebbiana”, que data al menos de Lorento de No, y que es el único mecanismo de
asociación evidente. 5 De hecho, el famoso párrafo del libro de Hebb es el paso de
suposición en su teoría, no el paso de predicción: el párrafo completo comienza con “Supongamos que…”
Lo que Hebb realmente estaba proponiendo era que si vemos este mecanismo en un sistema cortical,
entonces obtendríamos conjuntos de células y memoria direccionable por contenido .
Hebb definió un ensamblaje celular como un conjunto de células que trabajan juntas para representar
un conjunto específico de información. A veces, el término "ensamblaje celular" se utiliza para identificar una
sola cosa; por lo tanto, el conjunto de células activas cuando piensas en el perro que tuviste cuando eras
niño forma un ensamblaje celular. A veces, el término se utiliza para identificar un conjunto de cosas; por lo
tanto, el conjunto de células activas cuando ves o piensas en perros formaría un ensamblaje celular.
6
El concepto importante en ambos casos es que no es una sola célula la que forma estos conjuntos.
En ambos casos, estamos hablando de grupos de células que trabajan juntas. Una sola célula puede
participar en múltiples conjuntos de células, pero algunas células diferirán entre ellas. Esto significa que solo
en el agregado un observador podrá diferenciar representaciones en esta población de células. Podemos
preguntar cuál es la curva de ajuste de una sola célula, pero no podemos decodificar la representación a
partir de ella. Para eso necesitamos una población de células, un conjunto de células. Este tipo de
representación se llama distribuida porque la representación está distribuida en toda la población.

El concepto de Hebb era que las células que representan, por ejemplo, el sonido del ladrido de ese
perro, el color de su pelaje y cómo te sentiste cuando lo abrazaste, estarían todas vinculadas entre sí porque
estas experiencias tendían a ocurrir simultáneamente. 7 Así, el sabor de un ratatouille preparado como
lo hacía tu madre podía traer de vuelta una avalancha de recuerdos: de tu ciudad natal, de tu juventud y de
esa emoción familiar que puede derretirte el corazón. 8 Las sinapsis hebbianas completarían una parte del
ensamblaje celular para formar la memoria completa. La memoria podría abordarse únicamente por su
contenido.
La derivación conceptual de Hebb se produjo antes de la base matemática necesaria para estudiarla, y
los conceptos de ensamblaje celular y memoria direccionable por contenido no se probaron ni exploraron
hasta los años 1980 y 1990, después del desarrollo de las tecnologías computacionales y neurofisiológicas
9
necesarias.

La memoria como compleción de patrones

En términos computacionales, la memoria direccionable por contenido equivale a completar una imagen
10
patrón. parcial. Imagine una imagen degradada, donde algunos de los píxeles han sido reemplazados
por ruido. Con suficiente ruido, gran parte de la imagen cambiará tanto que ya no podrá reconocerla, pero
durante mucho tiempo antes de eso, aún podrá reconocer la imagen, incluso a través del ruido.

Los modelos informáticos de este tipo han demostrado que un sistema muy bueno para completar
patrones parciales es almacenar conexiones entre cada píxel que representan las similitudes y diferencias
entre los píxeles. Para simplificar, imaginemos una imagen en blanco y negro, donde cada píxel está
encendido o apagado . Si dos píxeles están encendidos, pueden apoyarse
mutuamente, pero cuando el par de píxeles están opuestos entre sí (uno encendido, el otro apagado), se
contrarrestan entre sí. Esta es una red estudiada originalmente por John Hopfield, quien demostró en un
artículo muy famoso de 1982 que una red de este tipo completará una imagen degradada a una imagen
11
almacenada original. Hopfield era físico en CalTech en ese momento.
Machine Translated by Google

262 Un apéndice

Usando matemáticas originalmente derivadas de la física para describir cómo el hierro se vuelve
magnético cuando se enfría (los polos magnéticos de los átomos individuales se alinean lentamente),
mostró cómo se puede definir un error o superficie de energía para entender cómo el sistema pasó
de la imagen ruidosa y degradada a la imagen recordada.
Imaginemos que representamos la actividad de todas nuestras neuronas como un punto en un
espacio de muy alta dimensión.
12 Cada neurona proporciona una dimensión y la posición a lo largo de
esa dimensión es la tasa de disparo de la neurona. Esto es más fácil de pensar con sólo dos
neuronas, por lo que tenemos sólo dos dimensiones, pero las matemáticas funcionan con cualquier
número de dimensiones. En cualquier momento en el tiempo, nuestro patrón de disparo a través de
la población de neuronas es un punto en este espacio n dimensional. Podemos describir la función
de error (energía) como altura en una tercera dimensión (( n + 1)th dimensión). Esto nos da una
superficie con colinas y valles. Lo que Hopfield fue capaz de demostrar fue que su red siempre rodaría
cuesta abajo y que los pesos sinápticos en su red podrían construirse de modo que el fondo de los
valles correspondiera correctamente a los patrones almacenados (recordados). La fuerza de la
conexión entre las células del patrón determina la profundidad de la cuenca que representa ese
13
patrón y la probabilidad de que una ruede hacia abajo en ella.
Imaginemos que almacenamos algún patrón (por ejemplo, una imagen de El pensador de Rodin )
en nuestra red (Figura C.2). Esto significa que el patrón de actividad en toda la red que corresponde a
nuestra imagen de esa imagen icónica va a estar en el fondo de uno de estos valles. Luego degradamos
ese patrón añadiendo ruido. Cuando ponemos ese patrón degradado en nuestra red, comienza en
algún punto diferente de nuestra memoria almacenada. Pero entonces la actividad de nuestra red
,
comienza a cambiar: las neuronas que están apagadas pero tienen muchas otras neuronas conectadas
que dicen que deberían estar encendidas, comienzan a encenderse; las neuronas que están
encendidas, pero no tienen mucho apoyo para permanecer encendidas, se apagan. A medida que
cambia el patrón de actividad, nos movemos a lo largo de esa superficie de energía/error. Somos una
pelota que rueda cuesta abajo. Finalmente, llegaremos al fondo del valle de El pensador .
Por supuesto, como vimos en nuestro análisis de las neuronas reales (Apéndice A), las neuronas
no están encendidas o apagadas . En cambio, emiten picos, pero estos picos son en respuesta a
señales que llegan a las dendritas de la neurona, que dependen del disparo de otras neuronas y del
peso sináptico entre esas otras neuronas y la neurona en cuestión. Esto produce una red de
neuronas que trabajan juntas.

E=88
E=82
E=74

E=39
E=21
E=0

Figura C.2 Patrones degradados. Podemos medir la diferencia entre patrones como el error
cuadrático medio E. A medida que el patrón cambia con respecto al patrón recordado, el error
aumenta. Podemos utilizar este error como una función de energía. Si se puede encontrar un
medio para moverse hacia abajo en esta función de "error", nos encontraremos completando el
patrón, "recordando" nuestra imagen. Los recuerdos direccionables por contenido funcionan de esta
manera: moviéndose cuesta abajo de la función de error o energía.
Machine Translated by Google

Apéndice C 263

El concepto de esta red de neuronas que trabajan juntas para recordar un recuerdo se
,
denomina a veces conexionismo , porque son las conexiones (sinapsis) entre las neuronas donde
se almacena el recuerdo. La contribución de B. Hopfield fue simplificar el modelo hasta el punto en
que pudo definir la función de energía o error y demostrar que su sistema recordaría el recuerdo
almacenado mediante la finalización de patrones. De hecho, este tipo de modelos funcionan bien,
incluso si solo cambiamos las conexiones excitatorias y usamos la inhibición solo para mantener
un nivel general de actividad, o si tenemos neuronas graduadas, que están tratando de recordar
tasas de disparo o si tenemos, modelos detallados de neuronas en descarga. 15;C Estos

modelos han podido explicar cómo los cambios en los neuromoduladores (como la dopamina, la acetilcolina
o la serotonina) pueden cambiar la capacidad de una red para almacenar recuerdos, así como patrones de
frecuencia de disparo muy específicos (y a menudo sorprendentes) observados en grabaciones neuronales
22 Lo que estos modelos nos dan es una explicación de la memoria
de animales en comportamiento.
consecuencias interesantes.
como categorización , lo cual tiene una serie de

La memoria como categorización

¿Qué sucedería si se almacenaran dos recuerdos en esta red? En ese caso, habría dos valles. Esto
significaría que habría un conjunto de patrones que se extenderían hacia el primer valle y un conjunto
diferente de ubicaciones que se extenderían hacia el segundo valle. A cada uno de estos conjuntos
lo llamamos cuenca de atracción para un valle determinado. Así como el agua al este de la Divisoria
Continental en las Montañas Rocosas de los Estados Unidos fluye hacia el este hasta el Atlántico,
mientras que el agua al oeste de la Divisoria Continental fluye hacia el oeste hasta el Pacífico, los
puntos de partida de una cuenca de atracción fluyen hacia un recuerdo, mientras que los puntos de
partida de la otra cuenca fluyen hacia la otra (Figura C.3).
Lo que realmente ocurre aquí es que el patrón de colinas y valles depende de las conexiones
entre las células. Al cambiar esas conexiones, cambiamos las colinas y los valles y cambiamos
la forma en que nuestra memoria completa los patrones. Almacenar un recuerdo implica cambiar

B El término “conexionismo” se limita a menudo a modelos muy abstractos como el modelo de Hopfield, que obviamente es una descripción muy pobre de las neuronas

reales. Sin embargo, el concepto original del conexionismo era la idea general de que son las conexiones las que importan y que el procesamiento de la información puede

ocurrir mediante el flujo de información a través de esas conexiones.

do
Uno de los grandes debates actuales en neurociencia es si la información está representada por la

momento específico de los picos o por la tasa de disparo promedio. Las 16 Mi sospecha es que tanto los picos como los promedios

tasas de disparo contienen información que es utilizada por el cerebro.

En algunos casos, resulta evidente que la sincronización específica es fundamental. Por ejemplo, en el sistema de ecolocalización

de los murciélagos, los picos se sincronizan con una precisión de un microsegundo (una millonésima de segundo), porque la velocidad
17 En otros casos, está menos claro.
del sonido significa que el murciélago tiene que reconocer diferencias de tiempo de microsegundos.

Las despolarizaciones en las neuronas corticales, particularmente en sus entradas a lo largo de sus dendritas, no producen picos de
18
manera confiable, lo que sugiere que los picos se basan más en la frecuencia en la corteza.

Mi opinión sobre esto es que existe un continuo que depende de la estructura neuronal involucrada. Un experimento
mental útil es que podemos reformular esta pregunta como "¿En cuánto tiempo podrías desplazar la punta aleatoriamente
antes de que se pierda la información?" 19 Obviamente, inclusolas puntas corticales no podrían desplazarse en segundos.
20 De manera similar, el sistema de ecolocalización de los murciélagos necesita una precisión de las puntas del

microsegundo. 21 Pero, ¿se perdería la información cortical si desplazaras las puntas corticales en un microsegundo? ¿En un milisegundo
¿Por un centisegundo?
Machine Translated by Google

264 Un apéndice

Figura C.3 Cuencas hidrográficas de América del Norte como cuencas de atracción. El ejemplo más
simple de una cuenca de atracción es el de una divisoria de aguas. El agua al oeste de la Divisoria Continental termina
en el Océano Pacífico, mientras que el agua al este de ella termina en el Atlántico. La mayor parte del agua

canadiense fluye hacia el Ártico, pero una parte fluye hacia la vía marítima del San Lorenzo y otra hacia el Pacífico. El
agua de la Gran Cuenca fluye hacia el Gran Lago Salado y no termina en un océano. (Mapa modificado del Servicio

Geológico de Estados Unidos).

23
esas conexiones para que la memoria esté en el fondo de un valle. Para recordar un
recuerdo es necesario rodar por esa superficie hasta el fondo del valle (Figura C.4). Al cambiar los
pesos de conexión se modifican las cuencas de atracción de cada valle y se modifican los recuerdos
que se recuerdan a partir de qué señales. Resulta que (como predijo originalmente Hebb) la
sinapsis hebbiana (o las modificaciones de la misma que incluyen tanto aumentos como
disminuciones 24 ) cambia los pesos de conexión de la manera correcta para cambiar las cuencas
de atracción. De hecho, muchos recuerdos, con muchos valles y muchas cuencas de atracción, se
pueden almacenar en estas redes. Ahora hay buena evidencia de que varias estructuras cerebrales
25
que almacenan y recuerdan la memoria funcionan de esta manera, incluido el hipocampo y la corteza frontal.
Se pueden ver ejemplos de los efectos de estas cuencas en cómo afectan la categorización:
por ejemplo, en el habla, en la capacidad de reconocer diferencias entre sonidos, o, en la
percepción, en la capacidad de diferenciar colores.
Aunque el habla humana es capaz de producir muchos sonidos de manera fiable, cada lengua
selecciona un subconjunto de esos sonidos para utilizarlos para comunicar información. 26 Así, las
lenguas xhosianas del sur de África incluyen diferentes tipos de chasquidos (por ejemplo, un golpe
de lengua frente a un sonido de deglución), algo que no está incluido en ninguna lengua indoeuropea.
Algunos idiomas diferencian sonidos que otros no. Por ejemplo, en japonés, los sonidos /l/ y /r/
(como en “glosario”) se clasifican como el mismo sonido. Las palabras japonesas incluyen los
sonidos /l/ y /r/, pero los hablantes nativos de japonés no perciben la diferencia. Todos los idiomas
tienen sonidos que clasifica juntos. El inglés, por ejemplo, no diferencia los sonidos /t/ aspirados y
no aspirados, aunque el inglés utiliza ambos.
Machine Translated by Google

Apéndice C 265

Memoria 1

Memoria 2

Memoria 3
Figura C.4 Cuencas de atracción. La cuenca de atracción es el conjunto de puntos que, cuando se les
permite cambiar a través de un sistema dinámico, convergen en el mismo lugar. Si pensamos en el estado
de un sistema neuronal como un punto en un espacio de alta dimensión, entonces podemos describir el
flujo de puntos en este espacio como un espacio de colinas y valles. Los patrones similares cambiarán para
recordar un patrón almacenado.

consonantes aspiradas y no aspiradas (por ejemplo, entre el sonido de la /t/ en la

D
Las palabras inglesas “ton” y “stun”), los angloparlantes generalmente no perciben la diferencia.
En hindi, la aspiración de ciertas consonantes diferencia las palabras (así como /l/ y /r/ diferencian
“light” y “right”). Podemos explicar esta capacidad de categorización en términos de
cuencas de atracción 27 (Figura C.5).

En realidad, los dos sonidos (/l/ y /r/) forman un continuo en la forma de la boca y la posición de la
lengua. /l/ es la lengua tocando la parte superior delantera del paladar, mientras que /r/ es la lengua
contra los dientes laterales. (La /r/ enrollada del francés o el español incluye un ronroneo glotal con la
lengua contra los dientes laterales). En japonés, todos los sonidos de este continuo entre /l/ y /r/ caen
en la misma cuenca de atracción; activan el mismo conjunto de células y se clasifican como un solo
sonido. En inglés, trazamos una línea entre los extremos de este continuo, separándolos. Más /l/

Los sonidos similares caen en la categoría /l/, mientras que los sonidos más parecidos a /r/ caen en
la categoría /r/; activan diferentes conjuntos celulares y se categorizan de manera diferente. Esta
comprensión de la categorización ha llevado a nuevas técnicas para enseñar a los hablantes de japonés a

D
Para comprobar que la /t/ es diferente en “ton” y “stun”, coloca tu mano a unos centímetros de tu boca y di las
dos palabras. Sentirás tu respiración al decir la /t/ en “ton”, pero no en “stun”.
Machine Translated by Google

266 Un apéndice

/Yo/ /R/
Hablantes de inglés
diferenciar /L/
y /R/...

pero los hablantes

/Yo/ /R/
mezcla de japonés no lo hacen.

Figura C.5 El reconocimiento de fonemas depende de las cuencas de atracción aprendidas.

La diferencia entre poder distinguir dos categorías depende de que se encuentren en cuencas
diferentes. Los hablantes nativos de inglés han aprendido que los sonidos /l/ y /r/ se encuentran en
cuencas diferentes, mientras que los hablantes nativos de japonés han aprendido que se encuentran
en la misma cuenca. Esto hace que sea muy difícil para los hablantes nativos de japonés reconocer
las diferencias entre los sonidos /l/ y /r/.

Reconocer la diferenciación en inglés entre /l/ y /r/ comenzando con la separación más grande,
enfatizando así la diferencia entre ellas, y luego entrenando explícitamente las habilidades de
categorización. 28 Esto permite a los hablantes japoneses crear nuevas cuencas de atracción,
aprender a separar estas categorías y mejorar su capacidad para diferenciar los sonidos. 29 De
manera similar, los padres que hablan con niños pequeños enfatizan demasiado la diferencia
entre vocales individuales, lo que puede ayudar a demostrarles a los niños las claras diferencias
de categoría. 30
Otro ejemplo clásico de categorización aprendida es la diferenciación de colores, que resulta
ser ayudada por ser capaz de nombrar los colores. 31 Aunque hay universales en algunas de las
etiquetas de color entre idiomas, probablemente debido a la neurofisiología 32 (Lo bueno de la
color, cada idioma diferencia los colores de forma un poco diferente. Lo bueno del visión del
color es que uno puede usar colores puros, lo que significa que uno puede medir cuantitativamente
la diferencia entre los dos colores en términos de la longitud de onda de la luz). Los hablantes de
inglés son más capaces de distinguir colores en el límite entre azul y verde que dos colores que
son ambos azules o que son ambos verdes, incluso cuando se enfrentan a pares de colores que
están separados por la misma diferencia de longitud de onda. 33 Esta es una propiedad general
encia. en todos los idiomas. Por ejemplo, mientras que el inglés tiene un único término para el color
azul (“blue”), el ruso tiene dos (синий “seenee”, azul oscuro, y голубой “goloboi”, azul claro). Esto
no significa que los angloparlantes no puedan distinguir el azul claro del oscuro; a menudo
hablamos del azul cielo y del azul marino. Estos son efectos pequeños y sutiles; ciertamente,
reconocemos las diferencias entre los muchos azules en una gran caja de crayones. Estos efectos
no deben confundirse con la idea de que algunos conceptos no existen en algunos idiomas y que
uno no puede pensar en las cosas de una manera que no sea la suya.
No se puede nombrar.

Por ejemplo, algunas personas han argumentado que algunos idiomas no representan el
personas viven siempre en el presente. La hipótesis de “Sapir tiempo o el número, y que esas
Whorf” (nombrada en honor a los lingüistas Edward Sapir y Benjamin
Machine Translated by Google

Apéndice C 267

Whorf, que no debe confundirse con el klingon Worf) y es más conocido por el uso de la neolengua
, se manipulan modificando el lenguaje mismo. Si
en 1984 de George Orwell , donde los conceptos
bien es evidente que el discurso político cambia al enmarcar los conceptos y las cuestiones,
todavía es posible pensar en las cosas, incluso sin terminología para ellas. 35 De manera similar,
el mito de que los inuit tienen veinte palabras para la nieve 36 no debe tomarse como algo tan
37
diferente del inglés. de nieve: aguanieve El inglés también puede identificar veinte tipos diferentes
, hielo, lluvia, nieve ,
, nieve esponjosa , nieve intensa etc. Sin duda, reconocemos las diferencias

entre estas formas de nieve (¡yo lo hago cuando intento palear la nieve de la entrada de mi casa!). La
diferencia es que los inuit tienden a utilizar palabras más precisas para la nieve porque es una parte
importante de sus vidas. De manera similar, mientras que un observador casual puede etiquetar a un
pájaro como "un pájaro", un observador de aves o un cazador sería más preciso y lo etiquetaría como un
"halcón" o incluso un "halcón de cola roja". 38

Los hablantes de ruso han aprendido a categorizar el azul oscuro (синий,seeee) y el azul claro
(голубой, goloboi) en lugar de categorizar el azul juntos. Los hablantes nativos de ruso son más
rápidos para identificar diferencias en los colores azules que cruzan el límite синий (seenee)
голубой (goloboi) que los hablantes nativos de inglés. Estas habilidades dependen del lenguaje:
si a uno se le da una tarea de bloqueo lingüístico (como repetir cadenas aleatorias de números en
silencio mientras se realiza la tarea E ), entonces las diferencias entre los pares de colores que
39
cruzan categorías y los pares de colores dentro de categorías desaparecen.
Se supone que la diferencia entre los hablantes nativos de inglés y los hablantes nativos de
ruso es que los hablantes nativos de ruso han desarrollado dos cuencas de atracción para
separar el azul claro del azul oscuro, mientras que los hablantes nativos de inglés tienen sólo
una. Lo que resulta particularmente interesante de estas categorías es que no son arbitrarias;
se relacionan con experiencias perceptivas universales y con una interacción entre nuestras
percepciones sensoriales y el mundo. 40 Los conjuntos de células de las estructuras de
reconocimiento de colores de nuestra corteza funcionan a partir de las señales de color
específicas del mundo (el azul del cielo, el azul del océano, el rojo de una puesta de sol, el
verde de una hoja, el amarillo de un girasol) y las señales de color específicas que pueden
detectar los fotorreceptores de la retina de nuestros ojos .

E Hemos visto varios casos a lo largo del libro en los que la capacidad de tomar decisiones depende del uso de recursos que

también se utilizan en tareas lingüísticas o de función ejecutiva (conscientes, que requieren esfuerzo mental). Si esos recursos se

utilizan en otra tarea, la capacidad desaparece. La segunda tarea interfiere con la primera. Algunos buenos ejemplos de tareas que

bloquean la función ejecutiva y lingüística incluyen recordar una larga cadena aleatoria de letras o números, decir el alfabeto al revés o

contar hacia atrás desde 1000 de siete en siete. Intente hacer las dos últimas tareas al mismo tiempo.

¡Es realmente difícil!

Los seres humanos normales tienen tres fotorreceptores detectores de color llamados conos, cada uno de los cuales tiene una

amplia sensibilidad al color (lo que hace que esta sea una representación distribuida del color). Los cálculos posteriores que se

producen en nuestra retina y corteza visual comparan la actividad en pares contrastantes de fotorreceptores detectores de color. Esta

es la razón por la que si miras una imagen roja durante suficiente tiempo, cuando mires una pantalla blanca, verás una imagen residual

verde. (Los conos rojos se han cansado y no se activan con tanta fuerza como deberían cuando apartas la mirada hacia la pantalla

blanca). Las personas daltónicas suelen carecer de uno o más de los conos, por lo que las personas con daltonismo rojoverde (falta

del fotorreceptor rojo) pueden diferenciar azul y amarillo, pero no rojo y verde. Los detalles de la percepción del color ocuparían un

libro entero en sí mismos, pero para aquellos interesados, la mayoría de los libros de texto de neurociencia tienen una buena

descripción de los mecanismos de la percepción del color.

41
Machine Translated by Google

268 Un apéndice

La neurofisiología de los ensamblajes celulares

Desde el punto de vista neurofisiológico, el estudio de los ensamblajes celulares, la memoria direccionable por
contenido y la compleción de patrones requiere la capacidad de registrar la actividad de un gran número de
neuronas simultáneamente, pero por separado. No basta con ver la actividad general de una red, como, por
ejemplo, a partir de un electroencefalograma, un análisis de fase lineal o una resonancia magnética funcional;
es necesario ver el patrón real de activación neuronal. Además, no basta con ver la actividad de una sola
neurona, porque lo que importa no es si una sola neurona se activa cuando se presenta un estímulo o se realiza
una acción; lo que se necesita es ver cómo la actividad de una sola neurona refleja la actividad de sus vecinas.

Los primeros pasos importantes hacia la identificación de conjuntos celulares en sistemas nerviosos reales
se debieron al trabajo de Bruce McNaughton y sus colegas en la década de 1990, donde desarrollaron técnicas
capaces de registrar grandes conjuntos de neuronas simultáneamente. En un famoso artículo publicado en
42
1993, Matt Wilson y Bruce McNaughton registraron simultáneamente más de cien células de ubicación del
hipocampo . El hipocampo ha sido un lugar particularmente útil para examinar conjuntos celulares porque las
células del hipocampo en la rata tienen una representación muy identificable: codifican la ubicación del animal
en el espacio.

43 Esto ha permitido a los neurocientíficos utilizar matemáticas derivadas originalmente

para el razonamiento espacial para examinar los conjuntos de células del hipocampo. 44
Más recientemente, ha sido posible examinar los patrones de las células corticales durante la selección de
acciones examinando la trayectoria del patrón de activación neuronal del conjunto a través del espacio de alta
dimensión. Como se ha comentado anteriormente, podemos imaginar la población como un punto en un espacio
de muy alta dimensión, una dimensión para cada neurona. La actividad de las células en un momento dado
puede describirse como un punto en ese espacio. Varios laboratorios que estudian la toma de acciones han
descubierto que justo antes de que el animal realice la acción, el patrón de activación de la población de células
de la corteza motora se mueve a un punto constante en ese espacio y luego toma una trayectoria constante
hacia otro punto en ese espacio. Se han realizado análisis
similares para conjuntos de neuronas prefrontales en ratas: el patrón de activación de la población de células se
agrupa en subespacios en momentos importantes, por ejemplo, cuando el animal cambia de tarea . 46

Tal como predijo Hebb, la representación mental de las decisiones requiere comprensión de patrones.
finalización de conjuntos celulares e implica trayectorias a través del espacio de ensamblaje celular.

Libros y artículos para lectura adicional • George

Lakoff (1990/1997). Women, Fire, and Dangerous Things (Mujeres, fuego y cosas peligrosas) . Chicago:
University of Chicago
Press. • Donald O. Hebb (1949/2002). The Organization of Behavior (La organización del comportamiento ).
Nueva York: Wiley/Lawrence
Erlbaum. • John Hertz, Anders Krogh y Richard G. Palmer (1991). Introduction to the Theory of Neural
Computation (Introducción a la teoría de la computación neuronal ). Reading, MA: AddisonWesley.

También podría gustarte

Resumen Comportamiento Organizacional Robins
72% (54)
Resumen Comportamiento Organizacional Robins
55 páginas
Cuestionario de Evaluación IPDE EXCEL
100% (3)
Cuestionario de Evaluación IPDE EXCEL
10 páginas
Porque Los Buenos Lideres Toman Malas Decisiones
Aún no hay calificaciones
Porque Los Buenos Lideres Toman Malas Decisiones
6 páginas
Causas y Efectos Del Estrés Laboral
Aún no hay calificaciones
Causas y Efectos Del Estrés Laboral
19 páginas
Neurociencia en La Toma de Desiciones
100% (1)
Neurociencia en La Toma de Desiciones
45 páginas
Toma de Decisiones y El Cerebro-1
100% (1)
Toma de Decisiones y El Cerebro-1
9 páginas
Grupo 2 - Informe
Aún no hay calificaciones
Grupo 2 - Informe
7 páginas
Monografia Neurocien Grupo7
Aún no hay calificaciones
Monografia Neurocien Grupo7
25 páginas
Toma de Decisiones - Qué Es, Fases y Partes Del Cerebro Implicadas
100% (1)
Toma de Decisiones - Qué Es, Fases y Partes Del Cerebro Implicadas
14 páginas
Libertad y Determinismo
Aún no hay calificaciones
Libertad y Determinismo
2 páginas
Cómo Decida Por Jonah Lehrer - 5 Estrellas Revisión
Aún no hay calificaciones
Cómo Decida Por Jonah Lehrer - 5 Estrellas Revisión
2 páginas
ApTD - S1 - EnlaceWeb - Cómo Tomamos Decisiones Entre La Razón y La Emoción
Aún no hay calificaciones
ApTD - S1 - EnlaceWeb - Cómo Tomamos Decisiones Entre La Razón y La Emoción
8 páginas
Cerebro y Toma de Decisiones Fanny
Aún no hay calificaciones
Cerebro y Toma de Decisiones Fanny
11 páginas
Paper CÃ Mo Hace El Cerebro para Decidir Braidot N.
Aún no hay calificaciones
Paper CÃ Mo Hace El Cerebro para Decidir Braidot N.
12 páginas
Critical Thinking (Pensamiento Crítico)
Aún no hay calificaciones
Critical Thinking (Pensamiento Crítico)
9 páginas
Como Decide Nuestro Cerebro
Aún no hay calificaciones
Como Decide Nuestro Cerebro
2 páginas
¿Somos Libres para Decidir
Aún no hay calificaciones
¿Somos Libres para Decidir
10 páginas
ApTD - S1 - ConoceMás - EnlaceWeb - de Qué Manera Nuestro Cerebro Toma Las Decisiones
Aún no hay calificaciones
ApTD - S1 - ConoceMás - EnlaceWeb - de Qué Manera Nuestro Cerebro Toma Las Decisiones
4 páginas
Decisiones y Deseo
Aún no hay calificaciones
Decisiones y Deseo
8 páginas
3 - Como Tomamos Decisiones
Aún no hay calificaciones
3 - Como Tomamos Decisiones
17 páginas
Tania Castillejos Maza - 20250108 - 195244 - 0000
Aún no hay calificaciones
Tania Castillejos Maza - 20250108 - 195244 - 0000
2 páginas
Tania Castillejos Maza - 20250108 - 195315 - 0000
Aún no hay calificaciones
Tania Castillejos Maza - 20250108 - 195315 - 0000
2 páginas
1 - 151220120211 - Cómo Decidimos
Aún no hay calificaciones
1 - 151220120211 - Cómo Decidimos
5 páginas
Ranulfo Romo
Aún no hay calificaciones
Ranulfo Romo
2 páginas
Taller Toma de Decisiones
Aún no hay calificaciones
Taller Toma de Decisiones
6 páginas
BASES NEUROBIOLO769GICAS DE LAS EMOCIONES Clase 5 Neuroeducacion y Educion Emocional
Aún no hay calificaciones
BASES NEUROBIOLO769GICAS DE LAS EMOCIONES Clase 5 Neuroeducacion y Educion Emocional
12 páginas
Bases Neurofisiologicas Toma de Decisiones
Aún no hay calificaciones
Bases Neurofisiologicas Toma de Decisiones
29 páginas
Toma de Decisiones y El Cerebro
Aún no hay calificaciones
Toma de Decisiones y El Cerebro
16 páginas
Las Neurociencias y La Toma de Decisiones
100% (1)
Las Neurociencias y La Toma de Decisiones
3 páginas
El Estudio de La Neurociencia en La Toma de Decisiones
Aún no hay calificaciones
El Estudio de La Neurociencia en La Toma de Decisiones
5 páginas
Neurofinanzas
100% (1)
Neurofinanzas
2 páginas
El Poder de La Decision Mas Que Una Simple Eleccio
Aún no hay calificaciones
El Poder de La Decision Mas Que Una Simple Eleccio
10 páginas
El Sueño de La Razon
Aún no hay calificaciones
El Sueño de La Razon
71 páginas
24 Neuroventas ¿Como Decide Comprar Quien Te Compra - 1
Aún no hay calificaciones
24 Neuroventas ¿Como Decide Comprar Quien Te Compra - 1
11 páginas
Cerebro y Toma de Desiciones
Aún no hay calificaciones
Cerebro y Toma de Desiciones
4 páginas
Uma Jornada Pelos Mistérios Do Cérebro - Pt.es
Aún no hay calificaciones
Uma Jornada Pelos Mistérios Do Cérebro - Pt.es
101 páginas
Como Repercuten Nuestra Mente en Nuestra Decision y Objetivos
Aún no hay calificaciones
Como Repercuten Nuestra Mente en Nuestra Decision y Objetivos
21 páginas
La Emocion en La Toma de Decisiones - Por CW PDF
Aún no hay calificaciones
La Emocion en La Toma de Decisiones - Por CW PDF
3 páginas
Claudia Castillo
Aún no hay calificaciones
Claudia Castillo
2 páginas
? Neurociencia y Toma de Decisiones
Aún no hay calificaciones
? Neurociencia y Toma de Decisiones
1 página
PDF NEUROBUSINESS - ES CAP Parte1
Aún no hay calificaciones
PDF NEUROBUSINESS - ES CAP Parte1
14 páginas
Toma de Decisiones PDF
Aún no hay calificaciones
Toma de Decisiones PDF
7 páginas
Neurociencia y Personalidad
Aún no hay calificaciones
Neurociencia y Personalidad
3 páginas
Mecanismos Cerebrales de La Toma de Decisiones
Aún no hay calificaciones
Mecanismos Cerebrales de La Toma de Decisiones
8 páginas
Ejemplo 3
Aún no hay calificaciones
Ejemplo 3
3 páginas
Joaquin Fuster Filosofia PDF
Aún no hay calificaciones
Joaquin Fuster Filosofia PDF
2 páginas
El Libre Albedrío, Con Joaquín Fuster
100% (2)
El Libre Albedrío, Con Joaquín Fuster
2 páginas
NeuroeconomIa PDF
Aún no hay calificaciones
NeuroeconomIa PDF
50 páginas
Para Responder A La Pregunta
Aún no hay calificaciones
Para Responder A La Pregunta
1 página
Tarea 3.1 Ensayo
Aún no hay calificaciones
Tarea 3.1 Ensayo
7 páginas
Cerebro Izquierdo y Lo Que Hay Que Tener Rosenzweig Es 23226
Aún no hay calificaciones
Cerebro Izquierdo y Lo Que Hay Que Tener Rosenzweig Es 23226
5 páginas
Neurobiologia en La Toma de Decisionesy Social Cognition PDF
Aún no hay calificaciones
Neurobiologia en La Toma de Decisionesy Social Cognition PDF
27 páginas
Filo Sofia
Aún no hay calificaciones
Filo Sofia
5 páginas
Ma Buenas: Decisiones
Aún no hay calificaciones
Ma Buenas: Decisiones
11 páginas
El Cerebro Decide
Aún no hay calificaciones
El Cerebro Decide
2 páginas
Por Qué Buenos Líderes Toman Malas Decisiones
Aún no hay calificaciones
Por Qué Buenos Líderes Toman Malas Decisiones
7 páginas
Sesión 3 El Cerebro Taller Toma de Decisiones. Mayo 21 de 2020
Aún no hay calificaciones
Sesión 3 El Cerebro Taller Toma de Decisiones. Mayo 21 de 2020
3 páginas
La Mente Planificadora
Aún no hay calificaciones
La Mente Planificadora
11 páginas
Inteligencia Intuitiva. Experimentos en Psicologia Intuitiva Malcolm Gladwell
100% (3)
Inteligencia Intuitiva. Experimentos en Psicologia Intuitiva Malcolm Gladwell
178 páginas
E. Costos Basados en Actividades
Aún no hay calificaciones
E. Costos Basados en Actividades
10 páginas
Cinthia Unidad 2
Aún no hay calificaciones
Cinthia Unidad 2
26 páginas
Monografia de Pensamiento
100% (8)
Monografia de Pensamiento
19 páginas
Catherine (Guia) - ElOtroLado
Aún no hay calificaciones
Catherine (Guia) - ElOtroLado
13 páginas
Estrategia de Instalaciones y Su Capacdad
100% (2)
Estrategia de Instalaciones y Su Capacdad
21 páginas
Código de Ética Profesional de Los Museos ICOM
Aún no hay calificaciones
Código de Ética Profesional de Los Museos ICOM
8 páginas
Hacia Dónde Va La Ciencia en México - INVESTIGACION JURIDICA PDF
Aún no hay calificaciones
Hacia Dónde Va La Ciencia en México - INVESTIGACION JURIDICA PDF
96 páginas
Matriz Liderazgo
100% (1)
Matriz Liderazgo
112 páginas
Psicologia Organizacional Tarea #2
Aún no hay calificaciones
Psicologia Organizacional Tarea #2
5 páginas
031 Toma de Decisiones II
Aún no hay calificaciones
031 Toma de Decisiones II
12 páginas
Mango Bueno PDF
Aún no hay calificaciones
Mango Bueno PDF
122 páginas
Vipfe
Aún no hay calificaciones
Vipfe
31 páginas
Para Qué Sirve La Interventoría de Las Obras Públicas en Colombia
Aún no hay calificaciones
Para Qué Sirve La Interventoría de Las Obras Públicas en Colombia
28 páginas
Guia Sistema Integral de Informacion en Salud-Siis Todo
Aún no hay calificaciones
Guia Sistema Integral de Informacion en Salud-Siis Todo
76 páginas
Presupuesto Modulo 1
Aún no hay calificaciones
Presupuesto Modulo 1
28 páginas
Procesos de Decisión de Markov
100% (1)
Procesos de Decisión de Markov
2 páginas
El Problema General de La Planeación Pauta para Un Enfoque Contingente
100% (1)
El Problema General de La Planeación Pauta para Un Enfoque Contingente
42 páginas
101 Administracion I-Sp
Aún no hay calificaciones
101 Administracion I-Sp
9 páginas
Guia de Aprendizaje #5
Aún no hay calificaciones
Guia de Aprendizaje #5
9 páginas
Guia Maap CST-430 Costos para La Toma de Decisiones APROBADA
Aún no hay calificaciones
Guia Maap CST-430 Costos para La Toma de Decisiones APROBADA
40 páginas
Unidad 2. Arboles de Decisiones
Aún no hay calificaciones
Unidad 2. Arboles de Decisiones
38 páginas
ACTA DE COLMENA Guayaquil 9 de Junio Del 2023
100% (1)
ACTA DE COLMENA Guayaquil 9 de Junio Del 2023
4 páginas
DEFINICIÓN DEL TERRENO DEL GERENTE Admiii
Aún no hay calificaciones
DEFINICIÓN DEL TERRENO DEL GERENTE Admiii
10 páginas
Finalidad de La Organizacion
100% (1)
Finalidad de La Organizacion
15 páginas
Barbara Rogoff
Aún no hay calificaciones
Barbara Rogoff
4 páginas
Hermano Mayor
Aún no hay calificaciones
Hermano Mayor
4 páginas