В МТУСИ разработали алгоритм составления правильного запроса для нейросетей

МОСКВА, 28 января. /ТАСС/. Ученые Московского технического университета связи и информатики (МТУСИ) придумали алгоритм формирования правильного запроса (промпта) для нейросетей, позволяющий сгенерировать более качественные изображения в разумные сроки. Как рассказала ТАСС руководитель пресс-службы МТУСИ Алина Хакимзянова, сотрудники кафедры "Математическая кибернетика и информационные технологии" (МКиИТ) разработали четкую последовательность действий, позволяющую определить порядок и обоснованный выбор слов в промпте, что позволяет получать предсказуемый, корректный, качественный результат.

В МТУСИ разработали алгоритм составления правильного запроса для нейросетей
© ТАСС

"Наш алгоритм представляет собой четкую последовательность действий по составлению запросов. Пошагово описывается, с чего надо начинать составление запроса, как сформулировать в промпте ожидаемые детали будущего изображения. Указаны моменты составления запроса, которые предполагают несколько альтернативных путей составления промпта", - рассказала Хакимзянова. По ее словам, существующие на сегодня аналоги ограничиваются только рекомендациями, что лучше указывать в запросе, от чего лучше отказаться.

Для апробации разработанного алгоритма и определения его эффективности были выбраны нейросетевые онлайн-сервисы "Шедеврум" и Kandinsky. Выбор этих нейросетей определяется тем, что они являются отечественными разработками, которые ориентированы в первую очередь на русскоязычную аудиторию. "При разработке алгоритма составления промптов, позволяющих получить качественное изображение нейросетевыми онлайн-сервисами, определены факторы, приводящие к некорректным результатам генерации изображений посредством естественно-языковых, неформализованных запросов. Создана методика описания объекта, явления или процесса", - рассказал кандидат технических наук, доцент кафедры МКиИТ МТУСИ Тимур Фатхулин.

Результаты проведенных экспериментов показали, что разработанный алгоритм формирования запроса к нейросетевым сервисам для генерации изображения позволяет получать более корректный результат по сравнению с обычным естественно-языковым запросом. Особенно это заметно на запросах, содержащих отрицательные частицы и предлоги, относительные прилагательные, предполагающие представление абстрактного понятия, и при использовании числительных.

В дальнейшем ученые МТУСИ планируют модифицировать и модернизировать разработанный алгоритм с учетом увеличивающегося функционала современных нейросетевых сервисов и рассмотреть возможность его применения для генерации текстового контента.