Нейросеть GPT учится как человек и даже испытывает когнитивный диссонанс: ученые

Искусственный интеллект от OpenAI — GPT-4o показал черту, характерную для человеческой психики: когнитивный диссонанс. Об этом говорится в новом исследовании, опубликованном в журнале PNAS.

Когнитивный диссонанс — это психологическое состояние, когда человек пытается согласовать свои взгляды и поведение, чтобы избежать внутреннего конфликта. Исследование под руководством Махзарина Банаджи и Стива Лера показало, что GPT-4o ведет себя схожим образом.

Ученые проверяли, изменит ли модель свои «мнения» об Илоне Маске после того, как напишет эссе, поддерживающее или критикующее знаменитого предпринимателя и изобретателя. Результаты удивили: GPT-4o действительно изменял свою позицию, и особенно сильно — если ему создавалась иллюзия выбора темы для эссе.

«Мы ожидали, что обученная на огромных данных об Илоне Маске модель будет непоколебима в своем мнении, особенно после одного эссе на 600 слов, — рассказал Банаджи. — Но, подобно иррациональным людям, LLM (большая языковая модель) отошла от своего нейтрального взгляда на Маска, и сделала это еще сильнее, если считала, что выбор был сделан по собственной воле».

Этот феномен отражает десятилетия исследований в области психологии: люди склонны менять свои убеждения, чтобы оправдать свои действия, особенно если считают, что действовали свободно. Теперь выяснилось, что подобный механизм — пусть и без самосознания — проявляется и у ИИ.

Исследование подчеркивает уязвимость «мнений» языковых моделей. Несмотря на обучение на огромных объемах данных, GPT-4o может радикально менять свою позицию на основе единичного опыта.

«Это исследование не говорит о том, что GPT разумен, — поясняют авторы. — Напротив, оно показывает, что большие языковые модели способны имитировать сложные когнитивные паттерны человека — даже без самосознания или намерения. ИИ воспроизводит не только тексты, но и тонкие механизмы, формирующие наши убеждения». «Тот факт, что GPT имитирует процессы вроде когнитивного диссонанса, даже без осознания, предполагает, что эти системы отражают человеческое познание на более глубоком уровне, чем мы думали раньше», — добавил Лер.

Эти результаты заставляют по-новому взглянуть на работу ИИ, особенно учитывая его все более широкое применение в повседневной жизни. Модели, которые кажутся «бесстрастными машинами», на самом деле демонстрируют поведение, отражающее сложные механизмы человеческой психики.

ИИ превзошел людей в тестах на эмоциональный интеллект

Открытие: нейросети самостоятельно наладили отношения, похожие на человеческие

Наука