Перейти к содержанию

Kandinsky

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
Kandinsky
Тип нейронная сеть
Языки интерфейса русский
Первый выпуск 2022 год
Ссылки
Сайт sberbank.com/promo/kandi…

Kandinsky — проект, сервис и приложение компании «Сбер», с помощью которого пользователи могут генерировать изображения по текстовому описанию с помощью нейросетей.

История

В ноябре 2021 года были выложены в открытый доступ код и параметры модели ruDALL-E XL, содержащей 1,3 млрд параметров, а также создан сервис генерации изображений. В июне 2022 года была представлена улучшенная модель — ruDALL-E XXL с 12 млрд параметров, которую дообучили на 179 млн изображений с текстовыми описаниями. В итоге была получена первая версия сервиса Kandinsky[1].

23 ноября 2022 года на конференции «Путешествие в мир искусственного интеллекта» Сбер представил новую версию нейросети — Kandinsky 2.0. От предыдущей она отличается своей мультиязычностью и диффузным подходом. Вторая версия обучалась на 1 млрд пар «текст-изображение»[2].

В начале апреля 2023 года вышла Kandinsky 2.1. Она была обучена ещё на дополнительных 170 млн пар изображений с текстом. Нейросеть была также усовершенствована за счет новой обученной модели автоэнкодера. Помимо закодированных текстовых описаний, модель использует специальное представление изображения моделью CLIP[3]. На начало июля 2023 года пользователи создали с помощью нейросети более 70 млн изображений. Наиболее популярными запросами были «Россия», «любовь», «аниме», «кот» и «космос»[4].

12 июля 2023 года Сбер выпустил версию нейросети Kandinsky 2.2. Сообщается, что теперь сервис умеет создавать фотореалистичные изображения в улучшенном качестве и изменять соотношение сторон при генерации. Нейросеть дополучили на датасете, содержащем 1,5 млрд пар «текст — изображение»[5]. В течение суток после выхода Kandinsky 2.2 пользователи сгенерировали 1 млн изображений, лидерами по популярности стали темы «коты», «море» и «аниме»[6].

12 октября 2023 года в Kandinsky 2.2 появилась возможность генерировать четырёхсекундные ролики по текстовому описанию[7].

22 ноября 2023 года Сбер представил новую версию нейросети — 3.0 в рамках конференции «AI Journey». Одной из главных особенностей модели является более лучшее знание русской культуры[8]. 22 апреля 2024 года пользователям стала доступна усовершенствованная версия сервиса — 3.1, появившаяся в этом месяце. В ней улучшилось качество генерируемых картинок засчет дообучения на дотасете эстетичных изображений[9].

Описание

Согласно заявлениям разработчиков, сервис поддерживает более 100 языков, включая русский.

Сервис поддерживает четыре основных режима работы:

  • генерация изображения по текстовому описанию
  • микширование двух изображений
  • микширование изображения и текстового описания дополнения
  • стилистическая переработка изображения

Актуальная версия — Kandinsky 3.1.

См. также

Примечания

  1. «Сбер» представил Kandinsky — ИИ-модель для генерации изображений по текстовому описанию на русском языке. 3dnews.ru (14 июня 2022). Дата обращения: 11 июля 2023. Архивировано 11 июля 2023 года.
  2. Сбер показал нейросеть Kandinsky 2.0 для генерации изображений по текстам. РБК (23 ноября 2022). Дата обращения: 11 июля 2023. Архивировано 11 июля 2023 года.
  3. Сбер представил нейросеть Kandinsky 2.1. Lenta.ru (4 апреля 2023). Дата обращения: 11 июля 2023. Архивировано 11 июля 2023 года.
  4. Сбер подсчитал число созданных нейросетью Kandinsky 2.1 изображений. Lenta.ru (4 июля 2023). Дата обращения: 12 июля 2023. Архивировано 12 июля 2023 года.
  5. Сбер представил новую версию своей нейросети Kandinsky. Газета.ru (12 июля 2023). Дата обращения: 13 июля 2023. Архивировано 13 июля 2023 года.
  6. За сутки пользователи Kandinsky 2.2 от Сбера создали миллион изображений. Lenta.ru. — новость. Дата обращения: 14 июля 2023. Архивировано 14 июля 2023 года.
  7. Нейросеть Kandinsky 2.2 научилась создавать анимационные видеоролики. Российская газета (12 октября 2023). Дата обращения: 14 октября 2023. Архивировано 13 октября 2023 года.
  8. Сбер представил новую версию нейросети Kandinsky 3.0. ТАСС (22 ноября 2023). Дата обращения: 30 апреля 2024.
  9. Изобразительная нейросеть Kandinsky 3.1 стала доступна для всех пользователей. 3dnews.ru (22 апреля 2024). Дата обращения: 30 апреля 2024.

Ссылки

Какая нейросеть лучше? Kandinsky 2.1 vs Шедеврум