Яндекс выложил в открытый доступ новую версию модели YandexGPT 5 Lite
Яндекс выложил в открытый доступ Instruct-версию собственной модели YandexGPT 5 Lite. Это последнее и самое мощное семейство нейросетей компании. Разработчики могут использовать ее для коммерческих и некоммерческих целей. Instruct-модель не слишком требовательна к вычислительным ресурсам, ее можно протестировать на личном компьютере без спецоборудования, говорится в сообщении Яндекса.
Модель обучалась на больших объемах данных и прошла дополнительный этап настройки – alignment. Благодаря этому она может решать конкретные задачи по промптам. Также Instruct-версия имеет базовые этические настройки, которые можно улучшить, чтобы модель соответствовала конкретным требованиям.
По результатам международных тестов и их адаптаций для русского языка (MMLU, IFEval, RuFacts и других), YandexGPT 5 Lite Instruct вплотную приблизилась к аналогу – китайской модели Qwen2.5-7B-Instruct – и превосходит ее в таких сценариях, как задачи классификации и разметки текстов, знание русской культуры и фактов, умение отвечать в заданном формате. По данным замеров Яндекса методом слепого сравнения (Side by Side, SBS), модель в 62% случаев превосходит Qwen2.5-7B-Instruct и сравнима по качеству ответов с GPT-4o Mini в решении стандартных задач сервисов Яндекса.
Одно из важных преимуществ модели – возможность использовать ее для коммерческих целей, если объем выходных токенов не превышает 10 млн в месяц. Такого числа токенов хватит для создания и поддержки чат-ботов на небольших и средних сайтах, для генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, для автоматизации ответов клиентам в сервисных центрах или для анализа отзывов пользователей на площадках с умеренным трафиком.
Версия нейросети уже доступна бесплатно на Hugging Face. Бизнес может воспользоваться моделью через API в Yandex Cloud.
Напомним, в конце февраля Яндекс выложил в открытый доступ большую языковую модель (LLM) YandexGPT 5 Lite Pretrain. Версия Pretrain, в отличие от Instruct, не проходила этап alignment и ее нужно дообучать под свои задачи.