Cómo construye nuestro cerebro hábitos: “La dopamina...”

El estudio investiga la relación entre la dopamina y las dos formas de aprendizaje: mediante recompensa versus la predicción de la reacción por repetición

Guardar
Cómo construye nuestro cerebro hábitos
Cómo construye nuestro cerebro hábitos (Pexels)

Durante décadas, la dopamina ha sido considerada el neurotransmisor clave en el aprendizaje basado en recompensas. Sin embargo, un estudio publicado en Nature el 14 de mayo por un equipo de neurocientíficos del Instituto de Genómica Funcional de Montpellier (Inserm, CNRS) redefine este papel. En su investigación han demostrado que esta hormona también refuerza los hábitos mediante un mecanismo independiente del valor de la recompensa. Esta segunda vía permite que los individuos repitan acciones pasadas de forma automática, incluso sin obtener un beneficio inmediato.

“La dopamina relacionada con el movimiento puede actuar como una señal de enseñanza libre de valores que apoya el aprendizaje, reforzando asociaciones repetidas”, explican los autores. Esta idea, derivada de experimentos con ratones y modelos computacionales, permite comprender cómo se forman los hábitos como automatismos estables, al margen de los incentivos.

¿Qué sistema de aprendizaje tiene una mayor relación con la señal dopaminérgica?

Cuando humanos y animales toman decisiones, tienden a repetir comportamientos que han resultado exitosos y también aquellos que simplemente han ejecutado con anterioridad. El estudio revela que estas dos estrategias dependen de señales dopaminérgicas distintas: por un lado, el error de predicción de recompensa (RPE), que refuerza conductas asociadas al valor del resultado; por otro, el error de predicción de acción (APE), que fortalece la repetición de acciones previas sin tener en cuenta si fueron recompensadas. Mediante una tarea de discriminación auditiva, los investigadores observaron que la actividad de la dopamina en la cola del cuerpo estriado (TS) no produce recompensa ni respuesta sensorial, sino movimiento. A lo largo del aprendizaje, esa señal disminuye, lo que indica que se ajusta a la previsibilidad de la acción.

Cuanto más predecible es una acción ante un estímulo, menor es la señal dopaminérgica, en línea con lo que predice el segundo modelo: “Nuestros resultados revelan que la señal dopaminérgica del TS relacionada con el movimiento es consistente con la codificación de APE”, señala el estudio. El equipo dirigido por Jérémie Naudé comprobó que los ratones eran más propensos a repetir una acción si la señal de dopamina en el TS era alta durante la elección anterior, incluso cuando no obtenían recompensa.

Cómo construye nuestro cerebro hábitos
Cómo construye nuestro cerebro hábitos (Pexels)

Además, mediante estimulación optogenética, es decir, al insertar información genética en células cerebrales, se logró imitar la liberación natural de dopamina en esta región y observaron cómo los animales sesgaban su comportamiento hacia la repetición, sin necesidad de resultados de recompensa. De esta manera se establece que “estimular la liberación de dopamina en el TS puede reforzar asociaciones estado-acción, pero no estado-resultado”. Así, se descarta que este tipo de dopamina afecte directamente al movimiento o al placer. Por el contrario, su función sería consolidar patrones de conducta repetidos, lo que permite automatizar acciones y liberar recursos cognitivos para otras tareas.

A nivel teórico, el trabajo propone un modelo de aprendizaje dual: uno basado en valores, que evalúa las consecuencias de cada acción, y otro libre de valores, que refuerza la repetición de asociaciones pasadas. Mientras que el primero permite una conducta flexible y adaptativa, el segundo consolida respuestas estables. Combinados, ambos sistemas permiten un aprendizaje más rápido y robusto. Este modelo explica por qué ciertos hábitos se mantienen incluso cuando la recompensa desaparece.

También sugiere que, en fases tempranas del aprendizaje, el sistema dopaminérgico basado en recompensa domina, pero con el tiempo el control se transfiere al sistema habitual, más eficiente para entornos predecibles. Más allá de lo explicado, los experimentos descartaron que esta señal esté relacionada con respuestas a estímulos sensoriales, amenazas o novedad. Por ejemplo, cuando se reprodujo un sonido desconocido durante la tarea, la respuesta dopaminérgica aumentó únicamente si implicaba una acción familiar no predicha por ese nuevo estímulo. Esto respaldaría la idea de que el APE mide la diferencia entre lo que se hace y lo que se espera hacer.

Implicaciones para la neurociencia del hábito

Envejecimiento precoz y riesgo de enfermedad neurodegenerativa: los viajes espaciales pasan factura a los astronautas.

Desde una perspectiva evolutiva, este sistema ofrece ventajas claras. Automatizar respuestas ante situaciones repetidas, ahorra recursos y acelera la toma de decisiones. Como recuerda el neurocientífico Jérémie Naudé: “Los hábitos permiten actuar sin pensar. Debieron tener ventajas evolutivas, facilitando la supervivencia en entornos variables”.

El hallazgo tiene implicaciones en campos como el estudio de trastornos compulsivos, adicciones o rutinas motoras en enfermedades neurodegenerativas. También ofrece nuevas claves sobre cómo romper hábitos no deseados: no basta con modificar el valor percibido de una acción, sino que hay que interferir con las señales que refuerzan su repetición.

En conjunto, esta investigación redefine el papel de la dopamina en el aprendizaje y aporta un nuevo marco para entender cómo el cerebro consolida comportamientos automáticos. Más allá del placer, la dopamina enseña a actuar por repetición. O, como ya intuía el filósofo Alain en 1955: “El hábito: un arte de actuar sin pensarlo y mejor aún que pensarlo”.