Войти в почту

Новый метод улучшит генерацию изображений с помощью ИИ

Ученые из Университета Райса представили новый метод генерации изображений с помощью предобученных диффузионных моделей, названный ElasticDiffusion. В традиционных моделях, таких как Stable Diffusion и DALL-E, возникают проблемы с созданием изображений различных размеров и соотношений сторон, что приводит к дефектам, например, к странным деформациям или повторяющимся элементам.

Новый метод улучшит генерацию изображений с помощью ИИ
© Ferra.ru

ElasticDiffusion решает эти проблемы, разделяя локальные и глобальные сигналы в процессе генерации. Локальный сигнал отвечает за детали, такие как форма глаза или текстура шерсти, в то время как глобальный сигнал формирует общую структуру изображения. Этот подход позволяет создавать более точные изображения без повторений и визуальных искажений.

Метод ElasticDiffusion требует больше времени для генерации изображений — до 6−9 раз больше по сравнению с традиционными моделями. Однако ученые надеются сократить это время и сделать процесс генерации более эффективным, что откроет новые возможности для применения ИИ в создании изображений.

© Vicente Ordóñez-Román/Rice University