Яндекс представил обновленную версию визуальной нейросети — YandexART 2.0. Новая модель обладает расширенными возможностями создания сайтов и SEO-продвижения:
- Генерация надписей непосредственно на изображениях.
- Поддержка нескольких стилей на одной картинке.
- Более естественное размещение объектов в пространстве и относительно друг друга.
- Учёт большего количества деталей из текстовых запросов при создании изображений.
Эти функции могут помочь пользователям в развитии бизнеса, например, в создании логотипов, этикеток, иллюстраций для сайтов и социальных сетей. Компании смогут повысить эффективность своих рекламных кампаний благодаря этим новым возможностям.
О технологии YandexART 2.0
Основой YandexART 2.0 стала гибридная архитектура, сочетающая преимущества сверточных и трансформерных нейросетей. Сверточная модель, вдохновленная принципом работы человеческого зрения, выделяет важные элементы изображения, такие как контуры, текстуры и формы. Однако она не способна обрабатывать длинные контексты и множество деталей, с чем превосходно справляется трансформерная модель. Их сочетание в YandexART 2.0 позволило улучшить точность и гибкость в обработке текстовых запросов, что делает возможным создание, например, фотореалистичных изображений с элементами разных стилей.
Модель прошла обучение на огромных массивах данных, включающих сотни миллионов изображений и их текстовые описания. Для повышения качества описаний Яндекс использовал собственную VLM-модель, которая автоматически анализировала изображения и давала детализированные пояснения. Эти усовершенствования позволили нейросети точнее воспринимать и учитывать детали, указанные пользователями в запросах.
Способности YandexART 2.0
Для создания текстовых элементов на изображениях нейросеть прошла дополнительное обучение на большом количестве изображений с текстом, что позволило ей создавать надписи, в том числе на латинице. Это открывает новые возможности для дизайна и разработки контента.
Для оценки работы YandexART 2.0 Яндекс разработал специальную систему, которая учитывает четыре ключевых параметра: релевантность, эстетичность, наличие дефектов и сложность изображения. По результатам тестов, YandexART 2.0 превзошла Midjourney v6.1 по комплексности в 66% случаев, по эстетике в 58%, и практически сравнялась по релевантности к запросам пользователей.
YandexART для бизнеса
YandexART 2.0 доступна через Yandex Cloud, и её можно использовать через API для интеграции в бизнес-приложения. Она позволяет ускорить создание реалистичных изображений для рекламных и маркетинговых целей. Предприниматели могут легко генерировать иллюстрации для статей, социальных сетей и баннеров, а также разрабатывать идеи для брендирования одежды.
В Яндекс Директе уже можно создавать рекламные объявления с помощью YandexART 2.0. На сегодняшний день 11% рекламодателей используют сгенерированные нейросетью изображения, и эксперименты показывают, что их сочетание с креативами повышает эффективность кампаний на 10-15%.
YandexART для пользователей
Пользователи могут воспользоваться YandexART через Алису, подключив опцию Алиса Про. Нейросеть позволяет не только генерировать изображения, но и корректировать их в процессе. Например, можно попросить Алису создать иллюстрацию свечи ручной работы, а затем добавить к ней еловые ветви.
YandexART 2.0 позволяет легко создавать аватарки, логотипы, иконки, открытки и принты на одежду. С подключенной опцией Алиса Про пользователи получают неограниченный доступ к генерации изображений в разных форматах как на мобильных устройствах, так и на компьютерах.
Изображение сгенерировано ИИ