🥇 Сравнение Нашей Системы STT с Остальными Системами на Рынке по Качеству (Обновление 2020-05-21)
Эта статья - это небольшое обновление оригинальной статьи про качество систем STT. Мы бы хотели обновить метрики по нашей системе и поправить небольшую неточность, которую мы допустили в методологии оригинальной статьи. Мы не обновляли метрики всех остальных систем, т.к. это довольно трудоемкая работа, и мы планировали скорее сделать это опубликовав небольшой публичный тулкит для этой цели в будущем.
С прошлого раза изменилась пара вещей:
- Наша система для русского языка сильно приросла по качеству;
- Как нам кажется в большинстве доменов с достаточным количеством данных мы прошли 90-95% пути;
- Мы обнаружили, что на ряде доменов мы неверно считали метрики - наша система не выдает букву ё, а в разметке некоторых доменах она присутствует. По этой причине метрики были искусственно занижены;
Как изменилось качество
По сравнению с прошлой статьей на основных доменах качество изменилось следующим образом:
Домен | Наш WER (было) | Наш WER (стало) | Улучшение |
---|---|---|---|
Чтение | 10% | 7% | 3% |
Звонки (такси) | 13% | 12% | 1% |
Публичные выступления | 15% | 13% | 2% |
Радио | 18% | 17% | 1% |
Заседания суда | 21% | 19% | 2% |
Аудио книги | 27% | 23% | 4% |
YouTube | 31% | 26% | 5% |
Звонки (e-commerce) | 32% | 31% | 1% |
Yellow pages | 33% | 33% | - |
Медицинские термины | 40% | 36% | 4% |
Звонки (пранки) | 41% | 37% | 4% |
Текущие метрики
Метрики других систем в этой итерации не обновляли.