Нейробиологи выяснили, почему так сложно избавиться от привычек

Ученые из Sainsbury Wellcome Centre при Калифорнийском университете в Лос-Анджелесе (SWC, UCLA) сделали прорыв в понимании того, как мозг формирует привычки. В исследовании, опубликованном в журнале Nature, они впервые выявили вторую систему обучения мозга — так называемую систему прогнозирования действий, которая дополняет известную систему прогнозирования вознаграждения. Это открытие не только объясняет, как возникают привычки, но и дает ключ к пониманию зависимостей, компульсий и болезни Паркинсона.
Две системы вместо одной
Ранее считалось, что обучение в мозге происходит за счет системы RPE (reward prediction error) — когда дофаминовые нейроны сообщают о том, насколько результат лучше или хуже ожидаемого. Это как при покупке еды: попробовал — понравилось — выбрал снова. Но новое исследование показало, что мозг использует еще одну схему: APE (action prediction error) — она сообщает, как часто мы повторяем действие, даже если результат не самый лучший.

Как объясняет доктор Маркус Стивенсон-Джонс, руководитель группы SWC:
«Как только вы вырабатываете предпочтение к определенному действию, вы можете обойти систему, основанную на ценностях, и просто полагаться на политику по умолчанию — на то, что делали раньше. Это освобождает когнитивные ресурсы для других решений».
Почему это важно?
Эта система помогает мозгу сэкономить усилия: мы можем автоматически выполнять рутинные задачи (например, водить машину), а сознание сосредоточить на чем-то более важном (например, разговоре).
Например, если вы часто выбираете один и тот же сэндвич, со временем перестаете раздумывать над выбором — просто берете его по привычке.
Исследование показало, что два типа сигналов формируются в разных частях мозга:
RPE проецируется в вентральное полосатое тело (VS) и другие области, но не в хвост полосатого тела (TS).
APE проецируется в TS и, как выяснили ученые, связан исключительно с движением, а не с вознаграждением.
Чтобы проверить это, исследователи использовали задачу на слуховое различение у мышей: животные должны были выбирать направление в зависимости от тона. Когда хвост полосатого тела в мозге блокировали, мыши могли учиться только на основе RPE, а не APE. В результате они хуже запоминали предпочтения и медленнее обучались. Это показало: на ранних этапах обучения работает RPE, а на поздних — APE.
«При повреждении хвоста полосатого тела мы наблюдали, что мыши сначала учатся нормально, но не достигают экспертного уровня, потому что у них остается только одна система обучения — RPE», — отметил доктор Стивенсон-Джонс.
Открытие объясняет, почему вредные привычки так трудно сломать: они закрепляются в системе APE, которая «по умолчанию» воспроизводит одни и те же действия. Именно поэтому эффективнее заменить привычку (например, жевать никотиновую жвачку вместо курения), чем пытаться просто прекратить делать что-то.
Это открытие также помогает понять болезнь Паркинсона. При этом заболевании погибают дофаминовые нейроны среднего мозга, особенно в компактной части черной субстанции, связанные с движением. Это и может объяснять, почему у пациентов с Паркинсоном возникают проблемы с привычным поведением, например с ходьбой, но они могут кататься на велосипеде или выполнять другие сложные задачи.
«Теперь у нас есть теория парадоксального движения при болезни Паркинсона: привычная система нарушена, а гибкая, основанная на ценностях, остается рабочей», — заключает доктор Стивенсон-Джонс.
Это открытие может стать основой для новых методов лечения зависимостей, компульсий и нарушений привычного поведения, а также для разработки новых подходов в терапии болезни Паркинсона.
Астроциты могут объяснить огромный объем памяти человеческого мозга
Найден генетический ключ к взрывной эволюции человеческого мозга