GLIDE by OpenAI
Текст в изображение - Создание фотореалистичных изображений
О GLIDE от OpenAI
Недавно OpenAI запустила GLIDE (Guided Language-to-Image Diffusion for Generation and Editing) - модель на основе искусственного интеллекта, которая позволяет пользователям создавать фотореалистичные изображения на основе естественноязыковых подсказок. У этой модели сопоставимая производительность с DALL-E, но она использует гораздо меньше ресурсов, так как работает только с 3,5 миллиардами параметров, в то время как DALL-E использует 12 миллиардов.
С помощью GLIDE пользователи могут легко и быстро создавать визуальные элементы на основе текстовых вводов, что упрощает уточнение и редактирование изображений. Его также можно использовать для изменения существующих изображений с помощью естественноязыковых команд, таких как добавление объектов, теней, отражений и выполнение заполнения изображения. Кроме того, у него есть возможность преобразовывать простые линейные рисунки в реалистичные фотографии, и он даже может выполнять задачи нулевого образца и восстановления для сложных обстоятельств.
Люди предпочитают изображения, созданные с помощью GLIDE, по сравнению с DALL-E, даже если первая модель использует меньше параметров. Более того, у нее более короткая задержка выборки и нет необходимости в переупорядочивании CLIP.
GLIDE by OpenAI скриншоты
Читать на английском