«Сбер» представил новую модель генерации картинок
Kandinsky построена на мультимодальной нейросети ruDALL-E, которую «Сбер» представил в ноябре 2021 года. 2 млн уникальных пользователей за полгода сгенерировали в этом сервисе 125 млн изображений. Команды Sber AI и SberDevices улучшили качество работы модели, дообучив её на 179 млн изображений. Теперь она создаёт реалистичные изображения, качественно передавая различные текстуры, тени и отражения.
Kandinsky создаёт изображения в три этапа. Сначала одна нейросеть генерирует заданное число изображений, используя текстовое описание. Затем вторая выбирает наиболее удачные и максимально соответствующие задаче картинки, а третья увеличивает их в размере.
«Мы продолжаем развивать нейронные сети, которые следуют принципам трёх М — мультимодальности, мультизадачности и мультиязычности. Kandinsky — это мощный прорыв в этой сфере. Она способна точнее сравнивать и анализировать различные изображения, чтобы создавать настоящие живописные картины. Автоматическая генерация изображений открывает новые возможности для бизнеса, который и станет одним из главных бенефициаров новой технологии», — заявил первый зампред правления Сбербанка Александр Ведяхин.
Как ранее писал «Секрет», дочерняя компания Alphabet DeepMind запустила нейросеть AlphaCode, которая способна писать программы с нуля. Для этого ей необходимо только описание задачи. Разработчики уверяют, что их детище может написать код не хуже среднего программиста и уже в ближайшем будущем позволит полностью автоматизировать процесс написания кода.
Фото: press.sber.ru