Сервис синтеза речи в электронной очереди Smartix

Электронная очередь Smartix предлагает собственный сервис синтеза речи для развертывания голосового помощника в дополнение к системам автоматизации клиентских потоков. Наше решение — это высокоэффективный кэширующий сервис с возможностью автоматического пополнения базы сообщений через внешние сервисы синтеза речи (Google Text-to-Speech или Yandex SpeechKit).

Преимущества сервиса синтеза речи

Низкая стоимость генерации новых файлов. Например, для базы звуковых файлов на основе Google Text-to-Speech цена составляет 16 USD за 1 млн. символов
Снижение стоимости владения сервисом за счет сегментирования сообщений. Каждый уникальный сегмент озвучивается только один раз
Собственные алгоритмы нормализации сообщений, которые позволяют еще больше снизить обращения к внешним сервисам

Google Text-to-Speech

Поддержка 120+ языков и языковых разновидностей
Точное произношение, форматирование фраз в зависимости от языковой ситуации (например, даты, номера телефонов)
Высокий уровень имитации речи, приближенный к реальной жизни
Поддержка Языка разметки синтеза речи (Speech Synthesis Markup Language), основанного на XML

Yandex SpeechKit

Сервис звукового анализа от российской компании Яндекс
Поддержка 15 языков
Преобразование текста в речь на базе скрытых марковских моделей
Интонация задается нейросетью, обученной на множестве примеров из реальной жизни

Сервис на базе предзаписанных текстовок

При необходимости наша электронная очередь может использовать сервис на базе предзаписанных текстовок.

Такой подход находит применение в компаниях, у которых полностью закрытые контуры. Актуально для банков и прочих организаций с высокими требованиями к безопасности.

Используемый в системе Электронной очереди Smartix сервис представляет простой и мощный API, который позволяет получать сформированные на основе сторонней голосовой платформы mp3 голосовые сообщения.

Голосовые сообщения передаются в режиме реального времени или формируются в виде предварительно созданного кэша из звуковых файлов. Кэш строится на основе собственных алгоритмов и внутренней базы сервиса.

Современные голосовые сервисы на сравнительно высоком уровне решают вопрос имитации произношения, приближенного к естественному — устранены проблемы по воссозданию тембра голоса, плавности звучания и интонации. Созданное нами решение использует все преимущества современных технологий по распознаванию и озвучиванию от крупнейших мировых разработчиков.

Остались вопросы?

Оставьте заявку и наши специалисты свяжутся с вами в ближайшее время

Связаться с нами