YandexGPT — модель искусственного интеллекта, которая генерирует текст на основе запроса человека. Для пользователя это выглядит как диалог с другом в мессенджере.
Модель можно использовать, чтобы создавать контент в маркетинге, рекламе и журналистике или для личных задач. Например, придумать сказку, рецепт блюда или текст письма. Весной 2023 YandexGPT добавили в Алису. Так Яндекс стал первой компанией, которая применила подобную модель в голосовом помощнике.
YandexGPT называется так, потому что работает по аналогии с языковой моделью GPT компании Open AI. Её используют в ChatGPT — чат-боте для генерации текста и кода, который запустили в открытый доступ в декабре 2022 года. За первые два месяца работы ботом воспользовались 100 млн человек.
Чтобы YandexGPT мог поддерживать диалог с человеком, его обучали в два этапа:
1. Pretraining
На этом этапе формируется эрудиция модели. Она изучает структуру языка и факты о том, как устроен мир, на датасетах. Это массивы данных, которые собирают разработчики. Если брать все данные подряд, модель выучит в том числе и неверные факты и будет отвечать неправильно. Поэтому данные для датасета сначала собирают из открытых источников, а затем фильтруют, чтобы осталось как можно больше полезных.
2. Fine-tuning
На этом этапе YandexGPT обучали на датасете из сотен тысяч запросов (инстрактов) и ответов на них. Чтобы в набор данных попало как можно больше разнообразных инстрактов, разработчики проанализировали запросы в поиске, обращения к Алисе и собрали примеры запросов коллег внутри компании. Написать качественные ответы на такие запросы — ещё сложнее. Человеку нужно быть либо экспертом в теме, либо уметь быстро в ней разобраться. Затем важно проверить достоверность информации и грамотно сформулировать мысль. Эти навыки есть у AI-тренеров — специалистов с редакторским опытом, которые помогают готовить ответы на запросы для нейросети. AI-тренеры, сотрудники Яндекса и удалённые асессоры (проводят фактчекинг, оценивают и составляют тексты) составили несколько сотен тысяч ответов на инстракты. Около половины из них стали основой для датасета, на котором обучалась YandexGPT.
Если просто показывать модели примеры хорошего поведения, она будет пробовать его воспроизводить, но всё равно может ошибаться. ChatGPT часто фантазирует вместо того, чтобы честно отвечать, что чего-то не знает. Улучшать ответы в моделях GPT получается с помощью человека. Он указывает, какие ответы хороши, а какие — с фактическими ошибками или неуклюже сформулированы. Такая модель обучения называется обучением с подкреплением на основе отзывов (Reinforcement learning from Human Feedback). В следующих версиях YaGPT планируют добавить этот этап в обучение модели.
Использовать чат-боты с языковыми моделями GPT можно в любом направлении — от аналитики до дизайна. Например, попросить сгенерировать запрос, по которому нейросеть нарисует иллюстрацию, или придумать описание для карточки товара. Научиться использовать нейросети в своих рабочих задачах поможет наш бесплатный курс «YandexGPT для начинающих».
Источник — https://practicum.yandex.ru/blog/neyroset-yandexgpt-kak-polzovatsya/