Сервис распознавания речи Яндекса научили расставлять знаки препинания
Сегодня, 20 апреля, разработчики облачной платформы Yandex Cloud сообщили о важном обновлении сервиса Yandex SpeechKit, построенного на основе машинного обучения. Данная технология предназначена для распознавания и синтеза речи, а теперь при трансформации голоса в текст облачный сервис научили в автоматическом режиме расставлять в нужных местах знаки препинания. Нововведение получило название «Пунктуатор» — оно работает как при распознавании речи пользователя в режиме реального времени (например, в сценариях с голосовыми помощниками), так и при трансформации речи в текст при обработке готовых аудиофайлов.
Для реализации «Пунктуатора» разработчикам из «Яндекса» пришлось задействовать сразу две модели машинного обучения — первая отвечает за трансформацию голоса в текст, а вторая сравнивает готовый текст с правилами и нормами русского языка, после чего расставляет соответствующие знаки препинания. Стоит отметить, что пока что речь идёт о знаках препинания исключительно для русского языка — разработчики не уточнили, когда появятся другие языки, но заявили, что «Пунктуатор» доступен всем пользователям Yandex SpeechKit. И, естественно, в будущем это даст заметные плоды.
Специалисты компании заявили, что нововведение должно улучшить опыт использования в сценариях, когда речь идёт о прямом взаимодействии с человеком. Например, голосовой помощник будет лучше воспринимать и понимать речь человека, улучшится технология автоматического транскрибирования и формирования субтитров к видеороликам.