Yandex B2B Tech запустила сервис для быстрого синтеза речи Brand Voice Lite. Теперь компаниям довольно загрузить 20–40 минут записи речи диктора, чтобы получить уникальный голос своего бренда. Его можно использовать для создания персонализированных голосовых ботов в контакт-центрах, а также для озвучки подкастов, образовательных материалов и прочих креативных бизнес-проектов. Сервис доступен компаниям на платформе Yandex Cloud.
Для синтеза голоса довольно озвучить текст в интерфейсе сервиса или загрузить уже готовую запись. Дикторами могут стать, например, приглашённые актёры или владельцы и амбассадоры бизнеса. Они в состоянии синтезировать голос в различных амплуа: для каждой дополнительной эмоции (например, печальной или агрессивной речи) нужно записать ещё от 20 минут. Модель синтеза станет доступна в течение семи дней после загрузки записей в сервис.
По оценке Fortune Business Insights, глобальный объём рынка разговорного ИИ в 2024 г. достиг 12,2 млрд долл. В 2025 году рынок вырастет на 21% и составит 14,8 млрд долл. Объём российского рынка диалогового ИИ в 2024 году взял на себя обязательства достигнуть 7,45 млрд руб., прогнозировали в Naumen.
«Синтезированные голоса наиболее востребованы у банков, крупных ритейлеров и телеком-операторов. При их помощи они автоматизируют первую линию помощи. Всего за счет технологий SpeechKit Brand Voice компании синтезировали уже более 50 голосов. После запуска Lite-версии сервиса мы ждём многократное увеличение количества таких проектов. В основе Brand Voice Lite - собственные ML-модели Yandex SpeechKit, которые дообучаются под каждого клиента на его датасетах. Данные для обучения хранятся в дата-центрах компании, которые отвечают самым взыскательным стандартам в области информационной и физической безопасности», - рассказал технический директор платформы Yandex Cloud Иван Пузыревский.
Фото: «Яндекс»