Claude дал неправильную архитектуру. Настоящая ошибка была не в Claude
Один из моих крупных бизнес-проектов-бизнесов - разработка электроники и софта для БПЛА . Дошел до момента, когда на железе после MVP надо стало разве…
Latest Architecture news from Tech News
Один из моих крупных бизнес-проектов-бизнесов - разработка электроники и софта для БПЛА . Дошел до момента, когда на железе после MVP надо стало разве…
На днях наткнулся на статью про память для AI-агентов. Сама статья была вполне типичной: SQLite, хранение контекста, поиск по накопленным знаниям, эко…
В свободное время я периодически захожу на Upwork, чтобы посмотреть, какие проекты там сейчас появляются и как устроен рынок изнутри. Если убрать филь…
Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с монит…
Если вы хоть раз просили ChatGPT выполнить какую-то задачу и получали в ответ инструкцию "как это сделать" вместо того чтобы он взял и сделал сам - вы…
В микросервисной архитектуре LLM быстро превращаются из удобного инструмента в отдельный источник рисков: растут счета за ток…
У инженера на промышленном объекте две машины: Контур 1 с интернетом и LLM, Контур 2 — физически изолированный, для реального кода. Между ними асиммет…
Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And»…
Меня удалили из рабочего чата после того, как заказчики поверили нейросети больше, чем живому специалисту, с которым работали полгода и у которого всё…
Карьерный рост в IT редко упирается только в «выучить еще один инструмент». Чаще проблема в другом: понять, какие технологии уже стали рабочей практик…
Привет, Хабр! Меня зовут Платон Малюгин, я Android Developer в Garage Eight. Мы в компании разрабатываем экосистему инвестиционных продуктов, и н…
Сначала всё выглядело как типичная AI-история успеха. За пару вечеров LLM помогла превратить Google Sheets для учёта финансов в настоящее приложение. …
Разбираем, как в отделе документации построили LLM-агента для автоматизированного перевода Markdown-документации. Архитектура, пайплайн, валидация, ра…
Ваш AI‑чат или автокомплит тормозит при 50 запросах в секунду? Монолит убивает GPU и латенси? В этом туториале — реальная арх…
В прошлом году я впервые задумался, как может выглядеть будущее языков программирования в эпоху агентной разработки. Сначала казалось, что гигантский …
SciGraph показывает, почему GraphRAG для научных статей — это не только про графы и LLM, но и про честные метрики. В&nbs…
Все началось с прикола, я сидел с друзьями и подумал, а вот было бы прикольно запихать разные модели нейросетей в один чат и заставить их думать, что …
Представьте: вы запускаете генеративную AI‑фичу в проде. Всё работает как часы. А через месяц получаете иск, потому что ваша модел…
Harvard Business Review опубликовал в марте 2026 исследование на 1488 сотрудников - пользователи ИИ получают острый brain fry от oversight’а. Я держу …
В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN5…
Привет, Хабр! Последние полгода стало модно создавать новые и переводить старые проекты на рельсы AI-First (или AI-Friendly) стандарта. Уже появляются…
H100 стоит $30 000 и потребляет 700 Вт. RTX 5090 — $2 000 (де-факто больше) и 575 Вт. Прирост производительности между поколениями сжался с 80% до 15–…
Мой рабочий день - это код. Вечером я хочу разговаривать с кем-то по-английски, а не нажимать на пингвинчиков. Duolingo учит меня заказывать яблоки, C…