RU

Как мы учили систему слышать тихого клиента на АЗС: двухмодальная аналитика для контроля сервиса

Распознать "здравствуйте" в записи — задача, которая уже решена. Труднее понять, кому это "здравствуйте" сказано, кто стоит у кассы в этот момент, и б…

ASRраспознавание речикомпьютерное зрениеvadobject trackingвидеоаналитикаspeech recognitioncomputer vision
Habr
RU

Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы

Полгода назад мы публиковали статью про то, как получили 3.3% WER для русского ASR с GigaAM. Замеры шли на пяти TTS-фрагментах из аудиокниг, что подтв…

распознавание речиASRWhisperGigaAMWERfaster-whisperбенчмаркfine-tuningрусский ASRоффлайн-распознавание
Habr