RU

Работает ли Caveman? Тестируем модный скилл для экономии токенов

Недавно копайлот перешёл на новую тарификацию, из-за которой я упёрся в месячные лимиты буквально за первую рабочую неделю. В рабочих чатиках все стал…

cavemanэкономия токеновLLMClaudeAI-агентыGitHub starsнакрутка звёздCopilotбенчмаркскам
Habr
RU

MTP у Qwen3.6 в llama.cpp обещает ×2 по скорости. Я прогнал ту же модель через своего агента — и получил обратное

Привет, Хабр. Меня зовут Лазутин Алексей, я  не профессиональный разработчик . SEO, аудиты сайтов, куча рутины с CSV, curl, отчётами для программ…

локальные llmqwenmtplm studioбенчмаркагентыtool calling
Habr
RU

Калькулятор VRAM для локальных LLM: Какие модели ИИ запустятся у вас на компьютере?

Когда я начал ковыряться с локальными LLM, главная боль была не в установке моделей, а в понимании, что вообще влезет в моё железо. Документация Huggi…

LLMVRAMllama.cppлокальные моделиквантованиеKV cacheGQAбенчмаркGPU
Habr
RU

Как ускорить поиск фраз в Manticore Search

bigram_index  можно использовать для разных задач, но в этой статье мы говорим именно о производительности поиска фраз: в приведённом ниже бенчма…

ускорение поискаиндексация поискаоптимизация поискаполнотекстовый поискбенчмарк