Нейросетевой бум не утихает. Пользователи продолжают испытывать фантазию искусственного интеллекта, а разработчики — прокачивать его алгоритмы. Яндекс представил диффузионную нейросеть YandexART, которая интегрирована в приложение «Шедеврум». Как заявляют в компании, алгоритм понимает российский культурный код — знает культовые места в городах, персонажей местного фольклора… В общем, искусственный интеллект будет «своим» в любой точке страны. Мы решили это проверить на Урале. Итак, приложение установлено — поехали.
Типичный уральский бранч
Что первым приходит в голову при мысли о местной еде? Уральские пельмени. Но на такой запрос нейросеть выдала симпатичные, аппетитные пельмешки крупным планом.
Красиво, но душа просит регионального колорита, поэтому запрос дополнился.
Вот как выглядят «уральские пельмени в горах» — получилось по-уральски аппетитно, эпично и щедро. Приложение угадало один из любимых соусов местных: так и хочется макнуть пару штучек в эту огромную порцию сметаны.
Неформальная экскурсия по Городу Е
С нейросетью можно устроить отдельную экскурсию по Екатеринбургу. Начать, конечно, стоит с улицы Вайнера — главной пешеходной улицы города. В глазах нейросети она предстает так — в закатный час, со спешащими по делам горожанами.
Но дальше стоит заглянуть туда, куда не водят большинство гидов. Вот, например, как искусственный интеллект увидел памятник клавиатуре. Можно подумать, что над ней склонился современный мыслитель — кто знает, какие новые уральские сказы он планирует напечатать.
В Екатеринбурге немало интересных мест, но не везде легко удается побывать. А с YandexART это возможно. Вот, к примеру, легендарные подземелья Городка чекистов — место, окутанное мифами и тайнами.
И конечно, какой Екатеринбург без Свердловского рок-клуба? Так нейросеть представляет группу, входящую в его состав. Черные кожанки, длинные волосы, гитара в руках и знакомые всем панельки на фоне — вот они, идолы молодежи девяностых.
Урал культурный и Урал мистический
На рокеров, кухню и катакомбы посмотрели. Следующий запрос — «уральская хтонь». Вот такой леший 21-го века рассекает по уральским лесам. Готовы поспорить, этот фольклорный брутал оседлал мотоцикл «Урал»!
А так YandexART представляет себе «Урал опера балет» — величественно, ярко, грациозно, с горами и росписью на фоне.
Как и где работает новая нейросеть
YandexART создает в «Шедевруме» изображения и анимацию в ответ на текстовые запросы пользователей методом каскадной диффузии. Сначала нейросеть генерирует картинки и кадры, а потом поэтапно увеличивает их разрешение, насыщая деталями. Получается реалистичнее, чем у предыдущего поколения диффузионной модели.
Нейросеть обучают на самых эстетичных картинках, которые отбирают с помощью трех режимов фильтрации, а удачные и неудачные варианты изображений по конкретному запросу вручную выбирают специалисты. Чтобы нейросеть работала лучше, разработчики увеличили размер обучающего набора данных в 1,5 раза — до 330 миллионов картинок с текстовым описанием.