Технологическая платформа «Авито» выпускает в опенсорс обновленные версии собственных ИИ-моделей: текстовую A-Vibe и мультимодальную A-Vision с 8 млрд параметров. Это первые открытые нейросети от российской компании, выученные умышленно для электронной коммерции и адаптированные под русский язык.
Разработчики, стартапы, бизнес и исследователи смогут получить готовые приборы для анализа документов, автоматизации контента и создания ИИ-ассистентов, уменьшая затраты на запуск и работу моделей до 50% в сопоставленьи с иными опенсорс-нейросетями. Модели оснащены собственным токенизатором и поддерживают возможность вызова наружных приборов (function calling) для создания автономных систем и агентов.
В разработку компания проинвестировала около полумиллиарда рублей, включая затраты на оборудование, команду и эксперименты. A-Vibe заняла первое место в классе легких нейросетей в популярных открытых тестах на понимание русского языка, работы с кодом и решение трудных задач. Модели доступны под открытой лицензией Apache 2.0 для любого использования.
«Открытие наших генеративных ИИ-моделей – это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и многие студентам, стартапам, исследователям и маленьким командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем прытче развивается вся отрасль. Мы желаем внести свой вклад в данный процесс», – говорил управляющий директор по искусственному интеллекту «Авито» Андрей Рыбинцев.
Возможности моделей
Текстовая A-Vibe и мультимодальная A-Vision созданы «Авито Тех», дочерней технологической компанией «Авито», на базе открытых моделей Qwen3 и Qwen2.5-VL с 8 млрд параметров, и глубоко адаптированы под российский рынок. Команда «Авито» разработала собственный токенизатор для русского текста – это ускоряет генерацию текста почти вдвое и делает результаты безошибочнее, чем у иностранных аналогов.
Модели обучались на реальных данных в том числе из электронной коммерции. Поэтому они разумеют контекст онлайн-торговли и эффективно работают с товарными описаниями, каталогами, запросами покупателей – без долгой адаптации под конкретный бизнес.
Нейросети работают с большими объемами текста – до 100 страниц за один раз (32 тысячи токенов). Они готовы к использованию без трудной настройки: разумеют простые команды, например: «сделай резюме документа» или «проанализируй таблицу» без дополнительных инструкций. Поддержка вызова наружных приборов (function calling) позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и многие сами выполняют действия за пользователя: отыскивают информацию в базах данных, делают расчеты, обращаются к другим сервисам по API.
Для каких задач будут полезны модели
Модели уже внедрены во многие сервисы «Авито» и теперь становятся доступными для образования, науки и бизнеса. Они подходят как маленьким командам и стартапам, так и крупным компаниям или исследовательским центрам.
• Бизнес сможет живо внедрять ИИ с минимальными затратами: автоматизировать обработку документов, генерацию контента, создать чат-бота для клиентов.
• Разработчики получат возможность дообучать модели под конкретные задачи и экспериментировать, разворачивая их на своей инфраструктуре без больших затрат.
• Образование - студенты и учители смогут работать с промышленными ИИ-моделями в обучении и исследованиях.
• Наука - исследователи получат новые приборы для изучения мультимодальных технологий и развития российской экосистемы ИИ.
«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании расходуют месяцы на адаптацию иностранных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив», – отметила Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито».
Отожествленье с иными популярными моделями
Большинство международных тестов для оценки языковых моделей предназначены для английского языка и не подходят для беспристрастной оценки качества работы на русском. Команда «Авито» перевела на русский четыре ведущих международных бенчмарка и выложила их в открытый доступ для всех разработчиков русскоязычных моделей:
• MATH-500 – трудные математические задачи школьного и вузовского уровня, требующие многошагового решения
• GPQA Diamond – научные вопросы уровня претендента наук по физике, биологии, химии и прочим дисциплинам
• DROP_RU – задачи на понимание текста с рассуждениями и вычислениями
• BFCL V3 – оценка способности модели работать с наружными приборами для создания ИИ-агентов.
На популярных российских бенчмарках MERA и RU Arena Hard модель A-Vibe заняла первое место в классе лёгких нейросетей и опередила многие более крупные модели. Она показала крепкие результаты в работе с кодом и отраслевых задачах. A-Vision эффективно справляется с анализом трудных документов, графиков, изображений с текстом и научных схем.
Модели доступны на платформе Hugging Face с доскональной документацией и образцами использования. Команда также опубликовала техническую статью с разбором обучения и тестирования.