Imagen by Google
Конкурент DALL·E 2 от Google Research
О Imagen by Google
Imagen - это технология преобразования текста в изображения, созданная Google Research, которая позволяет создавать фотореалистичные изображения на основе текстового описания. Она объединяет мощь большой модели языка-трансформера для понимания текста и силу моделей диффузии для создания изображений высокого качества. Исследования показали, что общие большие модели языка (например, T5), предварительно обученные на наборах данных только текста, эффективно кодируют текст для синтеза изображений. Увеличение размера языковой модели в Imagen значительно улучшает как качество образцов, так и соответствие изображений и текста больше, чем увеличение размера модели диффузии изображений.
Скриншоты Imagen by Google
Читать на английском