YandexGPT
YandexGPT | |
---|---|
Тип | Большая языковая модель |
Разработчик | Яндекс |
Первый выпуск | 17 мая 2023 года |
Последняя версия | 4 (24 октября 2024) |
Состояние | функционирует |
Сайт | ya.ru/ai/gpt-3 |
YandexGPT — нейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.
Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета[1]. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.
Использование YandexGPT
[править | править код]YandexGPT — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», «Яндекс Станциях», а также в умных телевизорах с «Алисой».
YandexGPT работает на главной странице «Яндекса», в «Поиске»[2], «Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании. Компания даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные В2В-решения на её основе.
С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ‑разработчики, банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез)[5].
Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки, создания чат‑ботов, виртуальных ассистентов и т. д.
В июне 2024 года с помощью YandexGPT был улучшен машинный перевод в «Яндекс Переводчике», «Поиске» и в переводе видео в «Яндекс Браузере»[6].
История
[править | править код]В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model)[7]. Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.
17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью[8].
5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы[9].
15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум»[10]. Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией[11].
27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков[12].
В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.
7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2[13]. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось[14]. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев[15].
14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске»[16]. Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.
С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете[17]. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь[18].
В декабре 2023 года Яндекс Казахстан открыл доступ к YandexGPT API для казахстанских компаний[19].
28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud[20]. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %[21].
28 мая 2024 года вышло третье поколение облегчённой версии нейросети YandexGPT Lite[22].
24 октября 2024 года появилось четвёртое поколение нейросети — YandexGPT 4, включающее облегчённую модель Lite и мощную Pro[23].
Нейро
[править | править код]16 апреля 2024 года Яндекс представил сервис «Нейро», он объединяет в себе возможности традиционных поисковых технологий и больших языковых генеративных моделей. В «Нейро» пользователь может задать системе любой вопрос простыми словами, YandexGPT 3 проанализирует поисковую выдачу Яндекса по запросу и объединит найденную информацию в одном сообщении со ссылками на источники. Взаимодействие с сервисом ведется в формате диалога, заданный ранее вопрос можно уточнить, а так же его можно дополнить картинкой[24][25].
Обучение Yandex GPT
[править | править код]Обучение проходит в несколько этапов:
1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты (токены)[26].
2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.
Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса»[27]. Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи[28]. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.
3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении[26].
Для обучения YandexGPT используются суперкомпьютеры «Яндекса»[29].
Возможности
[править | править код]В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов[30]. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания[31].
Критика
[править | править код]В мае 2024 года заместитель председателя Совета безопасности Дмитрий Медведев раскритиковал в своем телеграм-канале нейросеть YandexGPT, на основе которой работает виртуальный помощник «Алиса». По словам зампреда Совбеза[32], разработанный компанией искусственный интеллект не даёт ответы на «нейтральные» вопросы, косвенно связанные с политикой. Медведев счёл, что такой подход «подрывает доверие» к «Яндексу». В самой компании не стали комментировать высказывания политика[33]. Нейросеть YandexGPT не готова разговаривать об Украине, о вторжении России на Украину, статусе Крыма, ДНР и ЛНР. Нейросеть также не готова разговаривать о марксизме, Владимире Путине, Александре Лукашенко, Владимире Зеленском, Михаиле Саакашвили, Юлии Навальной и рассказывать какие-либо сведения из их биографии[34]. Подвержена цензуре тема памятников Степану Бандере[34].
Примечания
[править | править код]- ↑ Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться . РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске» . Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток . Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23 . Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ «Яндекс» предоставил компаниям доступ к YandexGPT . Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 29 июня 2023 года.
- ↑ Гормалева, Наталья «Яндекс» улучшил качество машинного перевода с помощью YandexGPT . rb.ru (7 июня 2024). Дата обращения: 10 июля 2024.
- ↑ Кодачигов, Валерий Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть . Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT . Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ "Нейросеть YandexGPT научилась запоминать контекст диалога". Ведомости. Архивировано 10 июня 2023. Дата обращения: 29 декабря 2023.
- ↑ «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста . 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Яндекс встроил нейросеть YandexGPT в приложение Шедеврум . Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
- ↑ YandexGPT теперь может кратко пересказать текст . Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
- ↑ "Яндекс" запустил YandexGPT 2 . ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
- ↑ Вышла новая версия нейросети от Яндекс — YandexGPT 2 . Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
- ↑ «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев . 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
- ↑ «Яндекс» начал тестировать быстрые ответы YandexGPT . Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
- ↑ В "Яндекс.Браузере" появилась функция пересказа видео . ТАСС (6 октября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
- ↑ Нейросеть "Яндекса" научилась кратко пересказывать видеоролики . Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 6 января 2024 года.
- ↑ tengrinews.kz Яндекс Казахстан открывает доступ к YandexGPT API для казахстанских компаний . Главные новости Казахстана - Tengrinews.kz (7 декабря 2023). Дата обращения: 10 июля 2024.
- ↑ «Яндекс» представил третье поколение нейросетей YandexGPT . РБК (28 марта 2023). Дата обращения: 30 марта 2023.
- ↑ 3DNews Daily Digital Digest. Яндекс представил третье поколение нейросетей YandexGPT (28 марта 2024). Дата обращения: 11 апреля 2024.
- ↑ «Яндекс» запустил третье поколение YandexGPT Lite . Коммерсантъ (28 мая 2024). Дата обращения: 29 мая 2023.
- ↑ «Яндекс» представил новую версию языковой модели YandexGPT 4 с рассуждениями . Коммерсантъ (24 октября 2024). Дата обращения: 28 октября 2023.
- ↑ «Яндекс» представил поисковый ИИ-сервис «Нейро» . www.sostav.ru. Дата обращения: 2 сентября 2024.
- ↑ Сидоров, Илья Яндекс представил Нейро. Это поиск с искусственным интеллектом, который сам отвечает на любые вопросы . iPhones.ru — Новости высоких технологий, обзоры смартфонов, презентации Apple (16 апреля 2024). Дата обращения: 2 сентября 2024.
- ↑ 1 2 YandexGPT в Алисе: как мы создаём языковую модель нового поколения . Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 5 января 2024 года.
- ↑ СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0 . Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России . Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
- ↑ YandexGPT научилась создавать тексты в режиме реального времени . ТАСС. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ BFM.ru Нейросеть YandexGPT смогла сдать ЕГЭ по литературе . BFM.ru - деловой портал. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе . Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
- ↑ Медведев раскритиковал «Яндекс» из-за ответов «Алисы» . Коммерсантъ (19 мая 2024). Дата обращения: 21 мая 2024.
- ↑ Музычук, Анастасия «Яндекс» отказался комментировать претензии Медведева из-за «дурки» от «Алисы» . RTVI (19 мая 2024). Дата обращения: 21 мая 2024.
- ↑ 1 2 "Дмитрия Медведева взбесило, что YandexGPT не хочет рассказывать про Бандеру Знал бы он, о чем еще умалчивают нейросети «Яндекса» и «Сбера» (иногда они даже забывают, что сам Медведев был президентом) — Meduza". Meduza. Дата обращения: 21 мая 2024.
Ссылки
[править | править код]- YandexGPT
- YandexGPT в Алисе: как мы создаём языковую модель нового поколения . Хабр (5 июня 2023). Дата обращения: 11 июня 2023.