В чем разница между DALL-E 2 и DALL-E 3?

В чем разница между DALL-E 2 и DALL-E 3?

DALL-E 2

 

Модель с 3,5 миллиардами параметров, которая может создавать изображения из текста. Модель использует крупный и разнообразный набор данных пар текст-изображение, который включает детальные категории и атрибуты.

Плюсы и минусы DALL-E 2:

1. Широко доступна для общественности через веб-интерфейс и API.
2. Генерирует изображения с более низким разрешением чем DALL-E 3.
3. Использует вариационный автоэнкодер (VAE) для синтеза изображений, который может создавать менее реалистичные и разнообразные изображения, чем диффузионная модель, используемая DALL-E 3.

 

DALL-E 3

 

Последняя версия, анонсированная в сентябре 2023 года. DALL-E 3 намного лучше, чем DALL-E 2, создает изображения, которые точно следуют описанию, и отображает заданный в запросе текст внутри изображения.

Модель использует более крупный и более сбалансированный набор данных пар текст-изображение, который включает в себя сложные и разнообразные сценарии, такие как сцены с несколькими объектами и их взаимодействие, или изображения с текстовыми метками и знаками.

Плюсы и минусы DALL-E 3:

1. Генерирует изображения с более высоким разрешением 1024×1024, 1024×1792, 1792×1024 пикселей, что обеспечивает больше деталей и четкости.
2. Значительные улучшения в создании текста и в изображении человека.
3. Наносит водяные знаки и добавляет метаданные, которые показывают, что изображение создано нейросетью.

 

Наглядное сравнение моделей:

 

 

Описание: Вертолет

 

DALL-E 2:

DALL-E 3:

 

Описание: Офисное помещение без людей

 

DALL-E 2:

DALL-E 3:

 

Описание: Вымышленная карта

 

DALL-E 2:

DALL-E 3:

 

Описание: Девушка в очках

 

DALL-E 2:

DALL-E 3:

 

На нашем сайте используется новейшая DALL-E 3. Попробуйте сгенерировать изображения. Кто знает, может быть получится шедевр?

 

Теги: openai dalle