YandexGPT

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
YandexGPT
Логотип программы YandexGPT
Тип Большая языковая модель
Разработчик Яндекс
Первый выпуск 17 мая 2023 года
Последняя версия 3 (28 марта 2024)
Состояние функционирует
Ссылки
Сайт yandex.ru/project/alice/…

YandexGPTнейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.

Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета[1]. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.

Где используется YandexGPT

YandexGPT — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», «Яндекс Станциях», а также в умных телевизорах с «Алисой».

YandexGPT работает на главной странице «Яндекса», в «Поиске»[2], «Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании. Компания даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные В2В-решения на её основе.

С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ‑разработчики, банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез)[5].

Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки, создания чат‑ботов, виртуальных ассистентов и т.д.

История

В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model)[6]. Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.

17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью[7].

5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы[8].

15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум»[9]. Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией[10].

В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.

27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков[11].

7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2[12]. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось[13]. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев[14].

14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске»[15]. Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.

С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете[16]. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь[17].

28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud[18]. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %[19].

24 октября 2024 года была представлена YandexGPT 4 — четвёртое поколение языковой модели, представленное в двух версиях: Pro и Lite. По заявлению разработчика, версия YandexGPT 4 Pro превосходит YandexGPT 3 Pro в 70 % случаях, а облегчённая версия Lite отвечает не хуже прошлого поколения. Особенностью YandexGPT 4 стало умение строить цепочки рассуждений[20][21].

Обучение Yandex GPT

Обучение проходит в несколько этапов:

1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты[22].

2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.

Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса»[23]. Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи[24]. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.

3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении[22].

Интересные факты

В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов[25]. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания[26].

Для обучения YandexGPT используются суперкомпьютеры «Яндекса»[27].

Примечания

  1. Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться. РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  2. «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске». Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  3. YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток. Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  4. Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23. Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  5. «Яндекс» предоставил компаниям доступ к YandexGPT. Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 29 июня 2023 года.
  6. Кодачигов, Валерий Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть. Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  7. «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT. Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  8. Нейросеть YandexGPT научилась запоминать контекст диалога (рус.), Ведомости.
  9. «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  10. Яндекс встроил нейросеть YandexGPT в приложение Шедеврум. Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
  11. YandexGPT теперь может кратко пересказать текст. Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
  12. "Яндекс" запустил YandexGPT 2. ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  13. Вышла новая версия нейросети от Яндекс — YandexGPT 2. Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
  14. «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
  15. «Яндекс» начал тестировать быстрые ответы YandexGPT. Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  16. В "Яндекс.Браузере" появилась функция пересказа видео. ТАСС (6 октября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  17. Нейросеть "Яндекса" научилась кратко пересказывать видеоролики. Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 6 января 2024 года.
  18. «Яндекс» представил третье поколение нейросетей YandexGPT. РБК (28 марта 2023). Дата обращения: 30 марта 2023.
  19. 3DNews Daily Digital Digest. Яндекс представил третье поколение нейросетей YandexGPT (28 марта 2024). Дата обращения: 11 апреля 2024.
  20. Нейросеть YandexGPT 4 научилась рассуждать. iXBT (24 октября 2024). Дата обращения: 24 октября 2024.
  21. Юлия Овчинникова, Анна Балашова. «Яндекс» представил новое поколение нейросетей. РБК (24 октября 2024). Дата обращения: 24 октября 2024.
  22. 22,0 22,1 YandexGPT в Алисе: как мы создаём языковую модель нового поколения. Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 5 января 2024 года.
  23. СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0. Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  24. Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России. Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  25. BFM.ru Нейросеть YandexGPT смогла сдать ЕГЭ по литературе. BFM.ru - деловой портал. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  26. Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе. Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  27. YandexGPT научилась создавать тексты в режиме реального времени. ТАСС. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.

Ссылки