В чем разница между DALL-E 2 и DALL-E 3?
DALL-E 2
Модель с 3,5 миллиардами параметров, которая может создавать изображения из текста. Модель использует крупный и разнообразный набор данных пар текст-изображение, который включает детальные категории и атрибуты.
Плюсы и минусы DALL-E 2:
1. Широко доступна для общественности через веб-интерфейс и API.
2. Генерирует изображения с более низким разрешением чем DALL-E 3.
3. Использует вариационный автоэнкодер (VAE) для синтеза изображений, который может создавать менее реалистичные и разнообразные изображения, чем диффузионная модель, используемая DALL-E 3.
DALL-E 3
Последняя версия, анонсированная в сентябре 2023 года. DALL-E 3 намного лучше, чем DALL-E 2, создает изображения, которые точно следуют описанию, и отображает заданный в запросе текст внутри изображения.
Модель использует более крупный и более сбалансированный набор данных пар текст-изображение, который включает в себя сложные и разнообразные сценарии, такие как сцены с несколькими объектами и их взаимодействие, или изображения с текстовыми метками и знаками.
Плюсы и минусы DALL-E 3:
1. Генерирует изображения с более высоким разрешением 1024×1024, 1024×1792, 1792×1024 пикселей, что обеспечивает больше деталей и четкости.
2. Значительные улучшения в создании текста и в изображении человека.
3. Наносит водяные знаки и добавляет метаданные, которые показывают, что изображение создано нейросетью.
Наглядное сравнение моделей:
Описание: Вертолет
DALL-E 2:
DALL-E 3:
Описание: Офисное помещение без людей
DALL-E 2:
DALL-E 3:
Описание: Вымышленная карта
DALL-E 2:
DALL-E 3:
Описание: Девушка в очках
DALL-E 2:
DALL-E 3:
На нашем сайте используется новейшая DALL-E 3. Попробуйте сгенерировать изображения. Кто знает, может быть получится шедевр?
Комментарии (0)