RU

Как я написал лучшее приложение для изучения иностранных языков с помощью SFSpeechRecognizer (нет)

Вообще‑то, я бэкендер последние лет 20, но недавно остался без работы (и AI тут не причём), решил «замутить» свой «стартап», пока ищу н…

SFSpeechRecognizerраспознавание речиаудированиеизучение языковiOS-разработкаSwiftUIсубтитрысегментация аудиочанкингSpeech Framework
Habr
RU

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3

Написал полностью офлайновый голосовой ввод на русском для Android. Никаких серверов, подписок и привязок к аккаунтам. За распознавание отвечает откры…

AndroidGigaAMголосовой вводраспознавание речиsherpa-onnxрусский языкopen sourceговорун
Habr
RU

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим

В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть как они справляются с русским айти-собесами, раз уж все три заявляют о …

WhisperSTTspeech-to-textfine-tuningLoRAASRNLPраспознавание речирусский языкcode-switching
Habr
RU

LLM как декодер в ASR: опыт адаптации SOTA архитектуры для спонтанной русскоязычной речи

Привет, Хабр! Меня зовут Коля, я разработчик машинного обучения в команде речевых технологий Контура. Мы разрабатываем собственную систему распознаван…

машинное+обучениераспознавание речиasrllm
Habr
RU

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

Голосом мы говорим в 2-3 раза быстрее, чем печатаем — это давно известно. Вопрос только в том, умеет ли голосовой ввод разбираться с русско-английской…

whisperголосовой вводтранскрибацияgigaamраспознавание речиopenwhisprcudavulkansuperwhisperнейросети