Выступление в СМИ | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Автор (участник): Димитров Денис Валерьевич
СМИ: Журнал "Habr"
Дата: 2 ноября 2021 г.
Аннотация:
2021 год в машинном обучении ознаменовался мультимодальностью — активно развиваются нейросети, работающие одновременно с изображениями, текстами, речью, музыкой. Правит балом, как обычно, OpenAI, но, несмотря на слово «open» в своём названии, не спешит выкладывать модели в открытый доступ. В начале года компания представила нейросеть DALL-E, генерирующую любые изображения размером 256×256 пикселей по текстовому описанию. В качестве опорного материала для сообщества были доступны статья на arxiv и примеры в блоге. С момента выхода DALL-E к проблеме активно подключились китайские исследователи: открытый код нейросети CogView позволяет решать ту же задачу — получать изображения из текстов. Но что в России? Разобрать, понять, обучить — уже, можно сказать, наш инженерный девиз. Мы нырнули с головой в новый проект и сегодня рассказываем, как создали с нуля полный пайплайн для генерации изображений по описаниям на русском языке. В проекте активно участвовали команды Sber AI, SberDevices, Самарского университета, AIRI и SberCloud. Мы обучили две версии модели разного размера и дали им имена великих российских абстракционистов — Василия Кандинского и Казимира Малевича: ruDALL-E Kandinsky (XXL) с 12 миллиардами параметров; ruDALL-E Malevich (XL) c 1.3 миллиардами параметров.

Страница выступления в Интернет

Добавил в систему: Димитров Денис Валерьевич

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ИНХС РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ИНХС РАН

ruDALL-E: генерируем изображения по текстовому описанию, или Самый большой вычислительный проект в Россиивыступление в СМИ