Шедеврум — нейросеть для генерации изображений — полный обзор
Первые шаги Шедеврум
«Шедеврум», ставший самым скачиваемым приложением в appstore и googleplay — в момент выхода оказался очень сырым стартапом Яндекса и получил много критики от пользователей. Интернет заполонили несуразные изображения, сгенерированные нейросетью по адекватным, простым и понятным запросам. Сеть ранее плохо справлялась с поставленными задачами, посмотрим, как обстоит дело сейчас.
Как работает «Шедеврум»
«Шедеврум» генерирует изображения методом каскадной диффузии: сначала создает картинки в соответствии с запросом, затем поэтапно увеличивает их разрешение и добавляет детали. Нейросеть учитывает пожелания. Например, «фотореализм» или «высокая детализация». Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться».
Нейросеть умеет генерировать изображения, а запросы можно составлять на русском и английском языках.
Можно описать изображение, задать стилистику, уточнить детали. В отличие от большинства аналогичных сервисов, «Шедеврум» хорошо понимает русскоязычные запросы и учитывает их при генерации.
Как использовать Шедеврум
Шедеврум представляет из себя мобильное приложение, доступное на операционных системах Android и iOs.
После скачивания и установки Вам необходимо зарегистрироваться.
Во вкладке Недавние можно просматривать последние сгенерированные пользователями нейросети изображения.
Во вкладке Лучшие выводятся те изображения, которые получили больше всего лайков. Можно посмотреть лучшие изображения за день, неделю или всё время.
По причине того, что нейросеть пока находится на стадии бета тестирования, доступ может быть периодически ограничен для новых пользователей. Если вы видите надпись Хочу создавать, значит после нажатия на эту кнопку вам придётся подождать. После чего вам придёт уведомление, что вы можете начать генерацию изображений. Режим ожидания обычно занимает от нескольких минут до получаса в зависимости от наплыва новых пользователей.
Если вам сразу доступна генерация изображений, то можете считать что вам повезло.
Чтобы сгенерировать изображение, необходимо нажать на плюсик в правом верхнем углу экрана. Откроется окно ввода промта.
Например, можно попросить нейросеть сделать изображение более реалистичным или выбрать стиль известного художника. Яндекс также рекомендует подсматривать какие промты использовали другие пользователи нейросети. Их вы можете увидеть под каждой фотографией в ленте на главном экране приложения.
Попробуем сгенерировать наше первое изображение в Шедеврум.
Долгим нажатием на одной из картинок можно получить увеличенную версию изображения.
После генерации приложение предложит четыре варианта картинки, как Midjourney. Выбранное изображение можно сохранить и опубликовать в ленте. Сохранить картинку без публикации в ленту не получится и отредактировать готовое изображение возможности нет.
Лимиты и ограничения
На данный момент отсутствуют какие-либо лимиты на генерацию изображений. Можно генерировать столько сколько хочется.
Но есть некоторые ограничения на содержание изображений:
- нельзя генерировать конкретных людей;
- изображение не должно содержать политической или религиозной тематики;
- запрещены изображения эротического содержания;
- запрещены сцены насилия и жестокости.
В настоящий момент, доступна версия «Beta 0.2.0» и в нее уже включена возможность генерации текста. Тексты получаются вполне приличными и содержательными.
Наш вариант по ссылке
Достоинства
- доступна бесплатно
- возможность генерировать как изображения, так и текст
- возможность делиться изображениями и использовать чужие промты
- возможность задавать стили будущих изображений
Недостатки
- первая версия приложения генерировало неадекватные изображения, но сейчас качество заметно улучшилось
- нет возможности редактирования готового изображения
- необходима регистрация
- работает только приложение, на сайте нейросети нет возможности генерации изображений, что в некоторых случаях может затруднить использование или создать необходимость переноса изображений со смартфона на компьютер
Обновление:
Yandex запустил нейросеть YandexART (Yandex AI Rendering Technology), способную создавать изображения и анимацию в соответствии с запросами пользователей. Новая технология уже внедрена в Шедеврум, обеспечивая визуальные решения для рекламных кампаний в Яндекс Бизнесе. Компания также планирует интегрировать эту нейросеть в свои другие сервисы.
Особенностью YandexART является ее способность улавливать российский культурный контекст. Например, она может создавать изображения с известными местами России, а также персонажами популярных отечественных мультфильмов и сказок, включая таких персонажей, как Чебурашка.
Технология формирования изображений и анимации YandexART основана на методе каскадной диффузии: нейросеть генерирует начальные изображения и постепенно повышает их разрешение, добавляя детали. По сравнению с предыдущими моделями диффузии, применяемыми в Шедевруме, YandexART способна создавать более реалистичную и детализированную графику. По оценкам асессоров Яндекса, результаты работы нейросети улучшились на 60%.
Для обучения YandexART используются эстетичные изображения, которые отбираются через 3 режима фильтрации. Объем обучающего набора данных увеличился на 1,5 раза и составляет 330 миллионов изображений с текстовым описанием. Кроме того, для улучшения итоговых результатов применяется метод дообучения с подкреплением. Специалисты проанализировали сотни тысяч изображений, созданных нейросетью, и отметили наиболее удачные и неудачные варианты.
На данный момент YandexART доступна в Шедевруме и Яндекс Бизнесе. В ближайшем будущем нейросеть будет интегрирована в Яндекс Клавиатуру.
Полный разбор бесплатной нейросети для генерации изображений Stable Diffusion
Создание изображений высокого качества, возможность пользовательской настройки генерации, установка программы на компьютер, полный обзор с примерами