secretmag.ru
Опубликовано 02 ноября 2021, 15:12
1 мин.

«Сбер» разработал нейросеть, которая создаёт картинки по русскоязычному описанию

«Сбер» запустил ruDALL-E — первый сервис, который создаёт изображения по запросу на русском языке. В его основе лежит нейросеть DALL-E, которую в январе представила OpenAI. Она обучена не только создавать пейзажи, но и рисовать антропоморфных животных и необычные объекты. Итоговый сервис функционирует на базе трёх нейросетей: первая распознаёт текст и создаёт изображения, вторая выбирает те, что соответствуют описанию, третья увеличивает качество фото.

«Сбер» разработал нейросеть, которая создаёт картинки по русскоязычному описанию

«Сбер» утверждает, что ruDALL-E одновременно учится на картинках и текстах и может создать бесконечное число новых изображений по одному описанию. Для её обучения потребовалось 23 тысячи GPU-часов на массиве данных из 120 млн пар текст-изображение. Это самый большой нейросетевой вычислительный проект в России и СНГ.

Нейросеть DALL-E для генерации картинок по описаниям на английском языке запустили в январе 2021 года. После этого команды SberDevices, Sber AI и SberCloud воспроизвели её код и начали обучение модели на платформе ML Space на базе суперкомпьютера «Кристофари».

Ранее «Секрет» писал, что нейросеть смогла завершить неоконченную 10-ю симфонию Людвига ван Бетховена, существующую лишь в небольших набросках. На оттачивание системы, способной создавать музыку, ушло 10 лет.

23 июля Роспатент впервые зарегистрировал софт, созданный искусственным интеллектом. Разработчики Sber AI обучили нейросеть писать код, чтобы она могла распознавать и анализировать объекты в виртуальной реальности.

Фото: Pixabay, Pixabay License