AI & ML — Tech News

RU

Один SSE для четырёх LLM: стриминг OpenAI, Anthropic, DeepSeek и Kimi через один бэкенд

Мы делаем чат-агрегатор, где в одном окне доступны GPT, Claude, Kimi и DeepSeek. Фронтенду нужно отдавать ответ в реальном времени — токен за токеном,…

ии-агрегатор llm-модели ai

RU

Искусственный интеллект без крайностей: реальные риски и реальные возможности

Помните, как в детстве казалось, что будущее - это летающие скейтборды из «Назад в будущее 2» и роботы-помощники? Ховерборд, может, еще и не появился,…

ИИ llm luxms будущее искусственный интеллект llm-модели

RU

AI-агент для склада в Джеймикс. Часть 1

Это первая из двух статей про построение AI-агента внутри Джеймикс-приложения. Джеймикс (или Jmix , ex. CUBA ) - высокоуровневый фреймворк для разрабо…

jmix spring ai haulmont llm-модели local ai java search prompt tools demo

RU

Claude Fable 5: разработчикам важны не только бенчмарки, но и цена, лимиты и границы задач

лимиты и границы задач Сначала короткий вывод: Claude Fable 5 выглядит как одна из самых сильных универсальных моделей Anthropic на текущий момент, но…

claude llm llm-модели anthropic anthropic claude

RU

Зачем я сделал OntoIndex: ИИ-агенту нужна не только уверенность, но и карта кода

Когда я начал активно использовать ИИ-агентов для разработки, у меня быстро появилось странное ощущение - c одной стороны, это действительно впечатляе…

llm память llm-модели llm-агенты llm-архитектура

RU

Поколение «Approve»: почему я заставил команду переписать проект, который уже работал

Последние пару лет, кажется, невозможно поговорить об AI в разработке, чтобы разговор не упирался в тему производительности. Отовсюду постоянно вылеза…

искусственный интеллект llm llm-модели windsurf openspec принятие инженерных решений развитие программистов инженерная культура будущее программистов

RU

Юнит-экономика LLM в 2026: о чем молчит прайс OpenAI и почему ваш расчет устареет через полгода

В течение последнего года мы запустили несколько продуктов с LLM-решениями на борту. При этом, несмотря на различия в моделях и масштабе, у них, у все…

llm-модели rag_api

RU

Выпустили, но в наморднике: разбираем как Mythos стал Fable 5

Когда компания выпускает продукт, всё просто: построил — продал. Вышел новый айфон — он лежит на полке. Появилась нейросеть — вот вам API, пользуйтесь…

llm llm-модели claude mythos релиз разбор ии ai

RU

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сл…

mlops selectel llm-модели qwen phi-4 mistral gpt-oss deepseek ai ai-агенты

RU

Автоматический отбор few_shot примеров для обучения модели

Справочники МТР на крупных предприятиях ‒ это десятки тысяч строк вида «Кабель ВВГнг 3х2.5 кв.мм, серая изоляция, 100м» , которые нужно разложить по а…

НСИ нормализация fewshot llm-модели кластеризация

RU

Поднимаем Llama 3 в облаке: Ollama и Open WebUI

Локально запустить LLM сегодня можно за десять минут — например, с помощью LM Studio. Но как только модели нужно дать доступ команде, подключить RAG и…

llm-модели self-hosted ollama selectel ai ml llm lmstudio

RU

Горячо-холодно: как определить температуру бизнеса с помощью тепловой карты BPMSoft

Сколько не оптимизируй бизнес-процессы, в них всегда остается какое-то узкое место, которое может застопорить всю работу. Знакомая ситуация? Но самое …

bpms bpmsoft llm-модели бизнес-процессы тепловая карта анализ данных ии-агенты бизнес-анализ визуальная аналитика crm-система

RU

Как я (внезапно) стал адвокатом вайб‑кодинга в корпорации

Привет, я Максим, лидер AI-powered разработки. В 2024 году я пришёл в банк руководителем проектов, потом занимался партнёрскими интеграциями, а теперь…

вайбкодинг llm-модели кукбук методология разработки семантическая разметка ai-трансформация tiny teams enterprise vibe coding подход к разработке

RU

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 - Запуск локальных моделей ИИ Читать далее

nvidia nvidia tesla v100 видеокарты для нейросетей видеокарты нейросети llm-модели ии ии модели искуственный интеллект

RU

Speech-to-LaTeX: распознавание математических выражений и предложений в LaTeX

Представьте семинар у физиков или математиков. Идёт автоматическая запись лекции, а затем распознавание речи в аккуратный текст. В большинстве мест со…

ASR llm-модели latex speech-to-text speech-to-latex

RU

Агенты выходят на работу (часть 3)

В первой части мы говорили про оргмодель — зачем она вообще нужна и какая от нее польза. Во второй части говорили о процессах — чего не хватает в типо…

ai agent оргмодель оргструктура процессы bpm bpmn llm-модели

RU

Google убрала из Gemini Думающую модель. Обзор обновления Gemini

Google полностью обновила сайт и приложение Gemini. Появился выбор уровня мышления, новый дизайн и модель Flash Lite. Однако у пользователей забрали T…

gemini gemini 3.1 pro gemini 3 thinking google ai studio gemini flash llm llm-модели интеллект даунгрейд gemini 3.0 thinking удалили

RU

Почему в эпоху GPT, бизнесу важно конкурировать в поисковиках

Привет, дорогой читатель! Меня зовут Дмитрий, и я более 12 лет занимаюсь веб-разработкой. Так уж получилось, что за это время у меня набралась база кл…

бизнес seo поисковые системы llm-модели

RU

Pollux: LLM-as-a-judge для русского

Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания к…

llm-агент llm-модели llm llm-as-a-judge rag метрики продукта

RU

Качество кода в эпоху AI: как не утонуть в багах и уязвимостях

Это конспект вебинара. Спикер — Даниил Степанов, разработчик-исследователь Veai, преподаватель ИТМО, ранее работал в Jet…

программирование java javascript ai-агенты ai llm-модели llm-агент llm kotlin kotlin native

RU

Как собрать пайплайн с LLM агентом который фиксит нативные Android UI автотесты

Что будем делать или что может быть интересного в статье: - Пайплайн из двух независимых LLM агентов - Запуск и анализ ошибки UI автотеста (Root Cause…

llm-агент llm-агенты llm-модели android development espresso ui-тесты

RU

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

Привет, меня зовут Вячеслав. Я интересуюсь локальными LLM и тем, как они ведут себя в реальных задачах — не на синтетических …

llm llm-модели llama.cpp gemma4 qwen3.6 qwen opencode

RU

Cобрать агента для XAI и никогда больше не быть онлайн

Привет, друзья! Я, похоже, наконец пережила кризис пришествия агентов в нашу жизнь. Мне всегда безумно нравился процесс решения задач — этакий ли…

llm-агент llm-модели llm explainable ai agents agent loop

RU

Битва двух ёкодзун: почему детекторы ИИ и гуманизаторы делают тексты еще хуже

В век, когда абсолютно все площадки, включая Хабр, захлебываются под цунами сгенерированного контента, особенно ценными становятся статьи, написанные …

контент seo-оптимизация копирайтинг экспертный контент llm-модели детекторы ии нейросети nlp контент-маркетинг gptzero

RU

Выбираем и оцениваем open-source LLM для саммаризации встреч

В статье мы расскажем, как команда разработчиков Doubletapp разработала систему оценки открытых моделей для создания саммари, поделимся метриками, кот…

llm-модели llm opensourse саммаризация summary summarization открытое программное обеспечение open-source open-source llm

RU

Lemonade — локальный LLM-сервер при поддержке AMD. Зачем он нужен, если есть Ollama?

Ryzen AI 9 HX 370 - это чип с NPU на 50 TOPS и Ollama его не видит - из-за своей архитектуры. Собственно, сама Ollama работает поверх llama.cpp, llama…

llm-модели искусственный интеллект нейросети ollama amd

RU

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшен…

ai-разработка rag ai rag pipeline retrieval augmented generation llm llm-модели vector search hybrid search graphrag multimodal