Данные, загружаемые пользователями в социальные сети, регулярно становятся объектом исследования для ученых. В прошлом году команда Райаны Мерчант из Центра цифрового здоровья Пенсильванского университета показала, что анализ постов пользователя в фейсбуке позволяет предсказывать у него депрессию за три месяца до постановки диагноза врачом. Сейчас те же исследователи в сотрудничестве с коллегами и Университета Стони Брук продемонстрировали, что анализ слов в соцсети может также успешно указывать на тревожное расстройство, психозы, зависимости и даже диабет. Ученые собрали всю историю постов почти 1 000 человек, согласившихся принять участие в исследовании, их демографические данные (пол, возраст, регион) и информацию о заболеваниях. Далее они построили три модели: в первой они смотрели на то, с какой вероятностью можно «угадать» заболевание только по демографической информации; во второй — только по используемым словам в постах на Facebook; в третьей — по двум этим типам данных одновременно. Угадывать с помощью алгоритма предстояло наличие какого-либо заболевания или психологической особенности из списка. Всего в нем был 21 пункт, включая депрессию, психоз, тревожное расстройство, зависимость от алкоголя, наркотиков, диабет и другое. Оказалось, что все их можно предсказать, основываясь исключительно на анализе постов, а о десяти из них статусы в соцсети позволяют судить более достоверно, чем демографические данные. Среди вербальных маркеров, указывающих на заболевание, оказались как вполне логичные и ожидаемые, так и те, что авторы работы затруднились объяснить. Так, например, таким маркером для алкогольной зависимости предсказуемо стали слова «напиток» (drink) и «бутылка» (bottle). А для диабета такими ключевыми словами оказались «бог» (God) и «молитва» (pray). Индикаторами психоза и наркотической зависимости оказались ругательства. Авторы работы считают, что алгоритм, анализирующий посты в социальных сетях, мог бы стать дополнительным инструментом диагностики для врачей. Ученые планируют новое исследование, в ходе которого участникам будет предложено предоставить доступ к постам в соцсетях врачам. Они хотят выяснить, удастся ли медикам использовать эти данные для совершенствования диагностики в реальной практике, и насколько охотно сами пользователи будут соглашаться на такие условия.