Лечение амнезии между AI-сессиями разработки
Статья о том, как решить проблему «забывчивости» LLM между AI-сессиями разработки. Рассматривается причина деградации контекста и предлагается практич…
Latest Programming news from Tech News
Статья о том, как решить проблему «забывчивости» LLM между AI-сессиями разработки. Рассматривается причина деградации контекста и предлагается практич…
DeepSeek V4 Pro вышел 24 апреля. Огромная модель, топ AIME и SWE-bench, передовая reasoning-архитектура. Я ждал Tier S — 95+ из 100 в нашем battle tes…
Мнение. Предложение к обсуждению, а не новая догма. Story points долго были удобным способом оценивать сложность задач в разработке. Но в 2026 году вс…
Это история про открытый креативный промпт к LLM, оставленный без присмотра. Через месяц он превратил пятничную рубрику нашего блога в гимнастику пара…
Все усложняют работу с AI-агентами. А что если хватит markdown + git? Без LangChain, без VectorDB, без оркестраторов. Рассказываю что реально работает…
Если почитать комментарии на хабре по тематике языковых моделей, то наблюдалась совсем недавно тенденция от резкого перехода “языковая модель только д…
В эксперимент мы шли с уверенностью, что ChatGPT хотя бы раз из пяти промахнётся с главным диагнозом. Не промахнулся. Пять из пяти: метаболический син…
Как превратить десятки неструктурированных описаний участников сообщества в систему поиска Занимаюсь бэкендом лет 7, Go и Python, немного ML» — попроб…
Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RA…
За последний год я перепробовал всё: Cursor, Claude Code, Codex, локальные Qwen-модели для ревью, пять версий своего CLAUDE.md , Xcode MCP от Ap…
Теги: Инфраструктура, LLM, Python, Прокси-серверы, Оптимизация Когда GPU-кластер с vLLM задыхается от пиковых нагрузок, классический Rate Limiti…
Статья четвертая из серии. Были исследование , личная история , продуктовый инсайт . Здесь будет продукт. Публикую манифест до того, как написана перв…
В 2026 году дообучение локальных LLM перестало быть задачей «для тех, у кого есть кластер и бюджет». Снижение требований к VRAM, развитие QLoRA и появ…
Untenable demand has Anthropic exploring new approaches to rationing its service.
Когда AI-агент пишет код в пустом проекте, первые 30-40% токенов он тратит на ориентацию — читает README, туториалы, API-reference. Ни один формат не …
AI-агент на OpenClaw слил $441 000 за один твит. Разбор шести катастроф и архитектуры, которая меня пока спасает Один твит про «лечение столбняка для …
В 2025 году рынок корпоративного ИИ-инференса составил ~100 миллиардов долларов. Но парадокс в том, что успех автоматизации бизнес-процессов с п…
Альтман выиграл пари. Я строю фабрику, чтобы выиграть следующее Антон Саркисян, CCO GPTunneL | ex.Yandex | ex.VK | Читать далее
Два крупнейших API-провайдера одновременно сменили риторику. Anthropic ввёл usage-based billing для агентных фреймворков — плата за токены…
Одна из сложностей с LLM: как понять, какая модель способнее? Их создатели наперебой кричат «мы совершили революцию», но как пробиться сквозь хайп и и…
Ещё три года назад ИИ в ITSM представлялся как просто чат-бот на входе, который пытается угадать категорию тикета. Сегодня уже другой разговор: ведущи…
Ещё три года назад ИИ в ITSM представлялся как просто чат-бот на входе, который пытается угадать категорию тикета. Сегодня уже другой разговор: ведущи…
Привет, Хабр! Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способнос…
OpenGrall — модульный фреймворк для роботов на LLM, который решает три главные проблемы «тормознутых» проектов: 1. LLM принимает решения только высоко…
Автор: Алексей Кравцов Полтора месяца назад у меня было семь воркфлоу в n8n для новостного пайплайна. Каждый делал что-то своё. На бумаге красиво. На …
Открыл дашборд потребления токенов — и завис. Ответы Claude начинаются с «Конечно!», «Отличный вопрос!», «С радостью помогу!», потом мета-комментарий …
Вы наверняка замечали: один и тот же вопрос в ChatGPT или Claude иногда даёт отличный ответ, иногда – качество ответа не соответствует ожиданиям. Мног…
При создании ИИ-агентов разработчики часто сталкиваются с проблемой контроля. Если дать языковой модели полную свободу действий, система становится не…
ИИ не заменяет людей — люди просто больше работают. Так давайте хотя бы ночью пусть работает ИИ. Как мы сделали Авто‑Кодера, выжим…