YandexGPT
YandexGPT | |
---|---|
Тип | Большая языковая модель |
Разработчик | Яндекс |
Первый выпуск | 17 мая 2023 года |
Последняя версия | 3 (28 марта 2024) |
Состояние | функционирует |
Ссылки | |
Сайт | yandex.ru/project/alice/… |
YandexGPT — нейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.
Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета[1]. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.
Где используется YandexGPT
YandexGPT — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», «Яндекс Станциях», а также в умных телевизорах с «Алисой».
YandexGPT работает на главной странице «Яндекса», в «Поиске»[2], «Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании. Компания даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные В2В-решения на её основе.
С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ‑разработчики, банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез)[5].
Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки, создания чат‑ботов, виртуальных ассистентов и т.д.
История
В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model)[6]. Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.
17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью[7].
5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы[8].
15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум»[9]. Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией[10].
В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.
27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков[11].
7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2[12]. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось[13]. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев[14].
14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске»[15]. Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.
С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете[16]. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь[17].
28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud[18]. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %[19].
24 октября 2024 года была представлена YandexGPT 4 — четвёртое поколение языковой модели, представленное в двух версиях: Pro и Lite. По заявлению разработчика, версия YandexGPT 4 Pro превосходит YandexGPT 3 Pro в 70 % случаях, а облегчённая версия Lite отвечает не хуже прошлого поколения. Особенностью YandexGPT 4 стало умение строить цепочки рассуждений[20][21].
Обучение Yandex GPT
Обучение проходит в несколько этапов:
1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты[22].
2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.
Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса»[23]. Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи[24]. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.
3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении[22].
Интересные факты
В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов[25]. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания[26].
Для обучения YandexGPT используются суперкомпьютеры «Яндекса»[27].
Примечания
- ↑ Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться . РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске» . Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток . Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23 . Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ «Яндекс» предоставил компаниям доступ к YandexGPT . Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 29 июня 2023 года.
- ↑ Кодачигов, Валерий Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть . Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT . Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ Нейросеть YandexGPT научилась запоминать контекст диалога (рус.), Ведомости.
- ↑ «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста . 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Яндекс встроил нейросеть YandexGPT в приложение Шедеврум . Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
- ↑ YandexGPT теперь может кратко пересказать текст . Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
- ↑ "Яндекс" запустил YandexGPT 2 . ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
- ↑ Вышла новая версия нейросети от Яндекс — YandexGPT 2 . Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
- ↑ «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев . 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
- ↑ «Яндекс» начал тестировать быстрые ответы YandexGPT . Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
- ↑ В "Яндекс.Браузере" появилась функция пересказа видео . ТАСС (6 октября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
- ↑ Нейросеть "Яндекса" научилась кратко пересказывать видеоролики . Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 6 января 2024 года.
- ↑ «Яндекс» представил третье поколение нейросетей YandexGPT . РБК (28 марта 2023). Дата обращения: 30 марта 2023.
- ↑ 3DNews Daily Digital Digest. Яндекс представил третье поколение нейросетей YandexGPT (28 марта 2024). Дата обращения: 11 апреля 2024.
- ↑ Нейросеть YandexGPT 4 научилась рассуждать . iXBT (24 октября 2024). Дата обращения: 24 октября 2024.
- ↑ Юлия Овчинникова, Анна Балашова. «Яндекс» представил новое поколение нейросетей . РБК (24 октября 2024). Дата обращения: 24 октября 2024.
- ↑ 22,0 22,1 YandexGPT в Алисе: как мы создаём языковую модель нового поколения . Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 5 января 2024 года.
- ↑ СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0 . Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России . Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ BFM.ru Нейросеть YandexGPT смогла сдать ЕГЭ по литературе . BFM.ru - деловой портал. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе . Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ YandexGPT научилась создавать тексты в режиме реального времени . ТАСС. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
Ссылки
- YandexGPT
- YandexGPT в Алисе: как мы создаём языковую модель нового поколения . Хабр (5 июня 2023). Дата обращения: 11 июня 2023.