RU

Почему Хомский неудобен для AI-индустрии

О grammar constraints, валидном JSON и ошибочном понимании языка Кажется, что разговор о формальных грамматиках в LLM - это узкая инженерная тема для …

llmgrammar constrained decodingstructured outputNLPХомскийискусственный интеллектсинтаксиссемантика
Habr
RU

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим

В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть как они справляются с русским айти-собесами, раз уж все три заявляют о …

WhisperSTTspeech-to-textfine-tuningLoRAASRNLPраспознавание речирусский языкcode-switching
Habr
RU

Как мы собираем ингушский язык: словарь, корпус и ИИ в одном проекте

Ингушский язык — один из нахских языков кавказской семьи, родной для примерно 400–500 тысяч человек. На нём говорят в Ингушетии, частично в Чечне и ди…

ингушский языклингвистикасловарьмалые языкилексикографиякорпус текстовNLPоткрытые данные
Habr