RU

Claude дал неправильную архитектуру. Настоящая ошибка была не в Claude

Один из моих крупных бизнес-проектов-бизнесов - разработка электроники и софта для БПЛА . Дошел до момента, когда на железе после MVP надо стало разве…

LLMClaude Codeархитектура ПОдеплойпостановка задачиembedded linuxбплаdevopsprompt engineering
Habr
RU

Почему мы спорим о памяти для AI-агентов

На днях наткнулся на статью про память для AI-агентов. Сама статья была вполне типичной: SQLite, хранение контекста, поиск по накопленным знаниям, эко…

AI AgentsAgent MemoryLLMAgentic AIKnowledge ManagementContext EngineeringLong-term MemoryProject MemoryRetrieval SystemsAI Architecture
Habr
RU

Chrome-расширение для Upwork: архитектура, метрики и опыт разработки с помощью ИИ

В свободное время я периодически захожу на Upwork, чтобы посмотреть, какие проекты там сейчас появляются и как устроен рынок изнутри. Если убрать филь…

ChromeExtensionUpworkLLMAIAssistedDevelopmentTypeScriptRustPostgreSQLEmbeddingsSystemArchitecture
Habr
RU

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с монит…

RAGLLMFastAPIPythonOllamaOpenWebUIBM25SREранбукиOpenAI-compatible API
Habr
RU

Как устроены LLM-агенты: архитектура, планирование и инструменты

Если вы хоть раз просили ChatGPT выполнить какую-то задачу и получали в ответ инструкцию "как это сделать" вместо того чтобы он взял и сделал сам - вы…

LLMагентыAI agentsprompt engineeringархитектура ИИLangGraphChatGPTязыковые модели
Habr
RU

Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»

Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And»…

LLMgamedevNLPembeddingspythondeepseekгеймдизайнискусственный интеллектrpgархитектура
Habr
RU

Как Claude убедил заказчиков, что я некомпетентен

Меня удалили из рабочего чата после того, как заказчики поверили нейросети больше, чем живому специалисту, с которым работали полгода и у которого всё…

LLMвайбкодингClaude Codeискусственный интеллектделегирование мышленияуправление контекстомархитектура ПОфрилансработа с заказчикамиAI-разработка
Habr
RU

62 бесплатных урока июня: Java, Docker, LLM, SRE, DWH и другие темы для роста в IT

Карьерный рост в IT редко упирается только в «выучить еще один инструмент». Чаще проблема в другом: понять, какие технологии уже стали рабочей практик…

DockerKubernetesLLMJavakafkadevopsмикросервисыбесплатные урокипрофессиональное развитиеSRE
Habr
RU

А что, если управлять торговой платформой голосом? За 48 часов собрали голосового ассистента и проверили

Привет, Хабр! Меня зовут Платон Малюгин, я Android Developer в Garage Eight. Мы в компании разрабатываем экосистему инвестиционных продуктов, и н…

голосовой ассистентAI AgentRealtime APIWebRTCLLMмобильный клиентинвестиционная платформахакатонархитектура ассистентаинвестиционные операции
Habr
RU

Как мы в отделе документации создали LLM агента для автоматизированного перевода с английского на другие языки

Разбираем, как в отделе документации построили LLM-агента для автоматизированного перевода Markdown-документации. Архитектура, пайплайн, валидация, ра…

LLMавтоматизация переводатехническая документацияPythonвалидацияMarkdownOpenWebUIQwenоркестрацияhostkey
Habr
RU

[Перевод] Каким должен быть язык программирования, чтобы с ним хорошо работали AI-агенты

В прошлом году я впервые задумался, как может выглядеть будущее языков программирования в эпоху агентной разработки. Сначала казалось, что гигантский …

AI-агентыязыки программированияvibe codingagentic codingLLMархитектура кодаразработка ПОбудущее программирования
Habr
RU

SciGraph: как я учил ИИ читать научные статьи не только по словам, но и по связям

SciGraph показывает, почему GraphRAG для научных статей — это не только про графы и LLM, но и про честные метрики. В&nbs…

GraphRAGRAGLLMNLPграф знанийнаучные статьиизвлечение знанийцитированияоценка качестваF1-метрика
Habr
RU

Как запихнуть килограмм LLM в телеграм-бота и не сойти с ума

Все началось с прикола, я сидел с друзьями и подумал, а вот было бы прикольно запихать разные модели нейросетей в один чат и заставить их думать, что …

LLMTelegram botPythonClaudeGeminiGPT-4oAPITelegram Mini Appsасинхронностьархитектура
Habr
RU

AI Governance по‑инженерному: что должен знать архитектор

Представьте: вы запускаете генеративную AI‑фичу в проде. Всё работает как часы. А через месяц получаете иск, потому что ваша модел…

AI Governanceуправление ИИбезопасность AI-системLLMархитектура AI-продуктаModel Risk Managementgovernance-as-codeexplainabilityguardrailsриски ИИ
Habr
RU

Мы уткнулись в потолок. Почему видеокарты перестали быстро расти — и что с этим делать

H100 стоит $30 000 и потребляет 700 Вт. RTX 5090 — $2 000 (де-факто больше) и 575 Вт. Прирост производительности между поколениями сжался с 80% до 15–…

GPUNVIDIAзакон МураHBMAI инфраструктурачиплетыархитектура GPULLMH100Blackwell
Habr
RU

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

Мой рабочий день - это код. Вечером я хочу разговаривать с кем-то по-английски, а не нажимать на пингвинчиков. Duolingo учит меня заказывать яблоки, C…

GoClean ArchitectureJWTAILLMpet-projectизучение английскогоSSEmodular monolithrefresh tokens