Разработка российских ученых ускорит внедрение нейросетей в сферу науки и инноваций

МОСКВА, 15 мая. /ТАСС/. Исследователи из России разработали подход, позволяющий учить большие языковые модели лучше понимать русскоязычную научную терминологию и при этом улучшающий их энергоэффективность. Адаптированная при его помощи система ИИ работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная модель, сообщила пресс-служба НИУ ВШЭ.

"Универсальные языковые модели знают много, но поверхностно. Нам же нужна модель, которая понимает, о чем пишут российские ученые и инженеры. Благодаря проведенным исследованиям мы смогли научить алгоритм мыслить в категориях предметной области, понимать связи между сложными понятиями и корректно интерпретировать запросы", - пояснила ведущий эксперт Центра стратегической аналитики и больших данных ИСИЭЗ (Москва) Анастасия Малашина, чьи слова приводит пресс-служба НИУ ВШЭ.

Как отмечают исследователи, объем публикуемых результатов научных экспериментов, а также патентов и другой важной и полезной информации постоянно растет, что побуждает ученых активнее разрабатывать и внедрять в свою работу нейросети для обработки и анализа этих данных. Существующие системы ИИ такого рода, как правило, обучены на данных на английском языке и не учитывают специфики научной информации на других языках, в том числе на русском.

Ученые Института статистических исследований и экономики знаний НИУ ВШЭ дообучили существующие большие языковые модели, чтобы получить инструмент, способный более точно анализировать научные тексты на русском языке с пониманием предметной специфики. Основой послужил корпус данных iFORA-QA, вручную собранный более чем 150 экспертами ИСИЭЗ из аналитических материалов и отчетов в области науки, технологий и инноваций.

По словам разработчиков, после адаптации точность ИИ при ответах на узкопрофессиональные вопросы в сфере науки, технологий и инноваций выросла, скорость генерации увеличилась в 2,7 раза, а использование памяти сократилось на 73% по сравнению с открытой мультиязычной моделью. Также исследователи планируют встроить в данную систему дополнительные инструменты, которые помогут снизить риск появления галлюцинаций в работе ИИ и помогут модели рассуждать и работать с неполной или неоднозначной информацией.

"Мы создаем целостную систему интеллектуальных агентов, адаптированную под реалии российской науки. Она будет работать на базе большой языковой модели и сможет автономно анализировать научно-техническую информацию и выявлять скрытые связи. Это шаг к автоматизации научной аналитики, где ИИ становится партнером исследователя", - подытожила Малашина.