RU

Claude дал неправильную архитектуру. Настоящая ошибка была не в Claude

Один из моих крупных бизнес-проектов-бизнесов - разработка электроники и софта для БПЛА . Дошел до момента, когда на железе после MVP надо стало разве…

LLMClaude Codeархитектура ПОдеплойпостановка задачиembedded linuxбплаdevopsprompt engineering
Habr
RU

Архиватор рождённый из теории предельного сжатия вселенной

Bounce — быстрый архиватор на чистом Rust без внешних зависимостей. Smart Routing автоматически выбирает стратегию: LZ77 для текста, Byte-Shuffle для …

архиваторсжатие данныхRustнейросетиLLMsafetensorsзолотое сечениеByte-Shuffleалгоритмы сжатияNVG
Habr
RU

Как я «переезжал» своего ИИ-агента с OpenClaw на Hermes и собрал все грабли (чтобы Вы не собирали)

Пол-года мой личный ИИ-агент “Паспарту” жил на OpenClaw. Я переехал на опенсорсный self-hosted Hermes — и собрал пятнадцать граблей, чтобы Вы их обошл…

HermesOpenClawИИ-агентself-hostedTelegram-ботмиграцияLLMDevOps
Habr
RU

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с монит…

RAGLLMFastAPIPythonOllamaOpenWebUIBM25SREранбукиOpenAI-compatible API
Habr
RU

62 бесплатных урока июня: Java, Docker, LLM, SRE, DWH и другие темы для роста в IT

Карьерный рост в IT редко упирается только в «выучить еще один инструмент». Чаще проблема в другом: понять, какие технологии уже стали рабочей практик…

DockerKubernetesLLMJavakafkadevopsмикросервисыбесплатные урокипрофессиональное развитиеSRE
Habr
RU

AI для PHP-разработчиков. Часть 7: Экосистема AI-агентов в PHP – от простых вызовов OpenAI до мультиагентных платформ

За последние два года в экосистеме PHP вокруг AI-разработки сформировалась целая индустрия. Если раньше интеграция LLM выглядела как несколько строк к…

phpии-агентыLLMOpenAIMulti-Agent SystemsPrism PHPLaravel AINeuron AIRAGStructured Output
Habr
RU

Почему RAG — это не просто «добавить поиск»: latency, качество и выбор стратегии retrieval

Когда говорят про RAG, его часто описывают как простой способ улучшить LLM‑систему: добавить поиск по внешним данным, найти релевантный…

RAGLLMretrievallatencyChromaOllamavector searchembeddingstop-kchunk size
Habr
RU

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM. Часть 4. Тестирование

Продолжаем серию про файнтюнинг и создание DevOps-агента Oni. В первой части я собирался в отпуск и хотел, чтобы локальная моделька через OpenClaw сам…

тестирование ИИagent evaluationQwen3.5файнтюнингDevOps-агентLLMбезопасность ИИprompt injectionOllamaLLM safety.
Habr
RU

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM.Часть 3.Дистилляция

Третья часть про DevOps-агента Oni. В первой статье я встретился с реальностью — локальные модели не справляются с простыми задачами. Во второй разбир…

LLMфайнтюнингfine-tuningLoRADevOps-агентOllamaобучение LLMcatastrophic forgettingUnslothAI-агент
Habr
RU

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM.Часть 2.Обучение

Продолжаем серию про файнтюнинг и создание DevOps-агента Oni. В прошлой части я встретился с реальностью — ни одна локальная модель не справилась с пр…

LLMфайнтюнингfine-tuningQwen3LoRADevOps-агентобучение LLMcatastrophic forgettingUnslothAI-агент