RU

[Перевод] Создаём простого ИИ-агента с нуля. Часть 2

Что произойдёт, если дать языковой модели доступ к терминалу, файловой системе и интернету? Она перестанет быть болтливым ассистентом и превратится в …

программированиеai-агентискусственный интеллекткодмашинное обучение
Habr
RU

[Перевод] Создаём простого ИИ-агента с нуля. Часть 1

Часто можно услышать «ИИ-агент», но мало кто объясняет, что это такое, если разбирать на уровне кода. Спойлер: магии меньше, чем кажется — цикл, вызов…

ai-агентискусственный интеллекткодмашинное обучениепрограммирование
Habr
RU

Антивирус бессилен: только ИИ видит аномалии в промышленных сетях

По мере того как ландшафт промышленной кибербезопасности осваивает технологии искусственного интеллекта (ИИ) и машинного обучения (ML), меняются и под…

АСУ ТПICSИИAIмашинное обучениеMLкибербезопасностьобнаружение аномалийLLMпредиктивная аналитика
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 11: Градиентный бустинг

В десятой части при изучении случайного леса мы наткнулись на проблему: переход от одиночного дерева к лесу частично снизил дисперсию, но вопрос со см…

градиентный бустингxgboostlightgbmcatboostмашинное обучениеdata science
Habr
RU

Я научил небольшой Transformer генерировать цифры одной нитью

Наверняка вы видели портреты, собранные из одной нити, натянутой между сотнями гвоздей. Я решил проверить: можно ли научить нейросеть генерировать не …

Transformerмашинное обучениеMNISTstring artобработка изображенийгенеративная модельautoregressive generationsequence modelingпроцедурная генерацияPython
Habr
RU

Рождение LLM: история, которую мало кто знает

Когда люди слышат "языковая модель", у большинства сразу всплывает ChatGPT, Gemini, ну или на худой конец что-то связанное с Яндексом. Но мало кто зад…

LLMбольшие языковые моделиистория ИИмашинное обучениенейронные сетиистория машинного обученияdeep learningOpenAIGoogle Brainискусственный интеллект
Habr
RU

П維чему нейро考ети дел思ют так

Если вы хоть раз тестировали локальную модель (да и нелокальную тоже) и замечали, как она посреди нормального текста вдруг выдает иероглиф, то заголов…

нейросетимашинное обучениеэмбеддингиgrokkingгроккингllmвекторное пространствоmechanistic interpretabilityтокеныselectel
Habr
RU

Эксперимент: может ли группа LLM отбирать стартапы лучше человека?

Шума вокруг ИИ много, но где реальные результаты? Проверяем гипотезу: может ли связка независимых LLM объективнее человека отбирать перспективные стар…

LLMстартапынейросетиоценка проектовИИмашинное обучениеGLMэкспериментвенчурный анализgpt
Habr
RU

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Многие ML‑инженеры знают, что нужно использовать CrossEntropyLoss , log_softmax и logsumexp . Гораздо меньше людей могут объяснить, что имен…

численная стабильностьмашинное обучениенейронные сетиsoftmaxlogsumexpfloat32градиентыпереполнениеunderflowPyTorch
Habr
RU

Как глушить нефтяную скважину… машинным обучением. Часть 2, техническая

Продолжаю рассказывать широкой общественности об интересном ML проекте, результаты которого внедряются в реальный технологический процесс. В первой ча…

Глушение скважиннефтяные скважинынефтяная промышленностьмашинное обучениепромышленностьпромышленное программированиеcatboostxgboostместорождениеtrade-off
Habr
RU

Как я сжёг 17,4 миллиарда токенов за 25 дней. По тарифам API это 3,2 миллиона рублей. IT приходит конец

В конце цикла я прогнал скрипт по своим логам Claude Code и увидел число, в которое сам не сразу поверил. За 25 дней, с 24 апреля по 19 мая, я сжёг 17…

искусственный интеллектискусство программированиямашинное обучениеapiфинансыфинансовый учетфинансирование стартапов
Habr
RU

Компьютерное зрение на коленке: распознаем дорожные знаки и управляем роботом на ESP32 и Arduino

Каждый, кто осваивает Arduino, проходит одни и те же этапы. Сначала ты мигаешь светодиодом. Потом подключаешь датчик температуры — и вот уже температу…

Arduinoкомпьютерное железокомпьютерное зрениесделай саммашинное обучениеesp32-camSPBot
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 10: Бэггинг и случайный лес

В предыдущей части мы изучали дерево решений и, несмотря на его замечательные свойства, наткнулись на один огромный недостаток — нестабильность. Казал…

baggingrandom forestout-of-bagoobbootstrappingaggregatingдерево решениймашинное обучениеdata science
Habr
RU

Игра на основе ИИ из нулевых, которая поражала воображение

Говорят, боги не обжигают горшки. В одной странной, временами клинически глупой и одновременно гениальной игре нулевых на плечи божества — которым был…

ИИAIискусственный интеллектдизайн игригростроениеигростройgame designнаучно-популярноенаучпопмашинное обучение
Habr
RU

[Перевод] Тест Лавлейс: переосмысление

Почему один из самых требовательных тестов ИИ уже, похоже, пройден Тест Лавлейс предложили в 2001 году, чтобы закрыть слабые места более известного те…

тест Лавлейсgenerative aiкреативность ИИLLMИскусственный интеллектмашинное обучение
Habr
RU

За кулисами нейросетей: полный цикл тренировки языкового ИИ

Ты уже пользуешься языковыми моделями — спрашиваешь, генерируешь, отлаживаешь код. Но откуда берётся сама способность отвечать? Не «где хранятся данны…

LLMобучение нейросетейRLHFfine-tuningпредобучениетрансформерGPTязыковые моделимашинное обучениеИИ
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 9: Дерево решений

В восьмой части мы завершили изучение SVM и разобрались с Kernel Trick. Теперь пришло время познакомиться с деревьями решений — одним из самых популяр…

дерево решениймашинное обучениеэнтропия шеннонаджинирегрессионное деревоpre-puringpost-puring
Habr
RU

Что происходит внутри LLM, когда ты отправляешь сообщение

Каждый день миллионы людей разговаривают с системой, про которую не могут ответить на простой вопрос: а что она вообще делает, когда отвечает? Не в см…

LLMтрансформернейросетитокенизацияattentionGPTмашинное обучениеэмбеддингигенерация текстакак работает ИИ
Habr
RU

Pipeline в машинном обучении: как создавать сложные модели без боли и утечек данных

В ML‑проектах проблемы часто начинаются не с выбора алгоритма, а с предобработки: один трансформер забыли применить к те…

Pipelinesklearnмашинное обучениепайплайн данныхпредобработка данныхdata leakageкросс-валидацияColumnTransformerтрансформерыML-модель
Habr
RU

Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

Иногда одна строка датасета соответствует не одному объекту, а целому набору связанных объектов: новостям, комментариям, изображениям или&nb…

машинное обучениеискусственный интеллектэмбеддингиагрегацияMILllmfeature engineeringpoolingattentionNLP
Habr
RU

Как шахматный подход помог разобраться с фотолентой Яндекс Диска

Когда вы загружаете фотографии на Яндекс Диск, они не просто лежат в облаке: ML‑модели анализируют снимки, группируют их в альбомы…

разметка данныхмашинное обучениеmlобучение моделейразметка фотографийалгоритмы
Habr
RU

Почему WER недостаточно: Семантическая декомпозиция ошибок ASR

В продуктах, построенных поверх моделей распознавания речи (Automatic Speech Recognition models, ASR), качество распознавания речи напрямую влияет на …

werasrnernlpречевые технологиираспознавание речиwhisperмашинное обучениеОценка качества моделейречь в текст
Habr
RU

Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов?

Пока лента обсуждает LLM и агентов, а инвесторы спорят про окупаемость GenAI, «скучный» классический ML тихо зарабатывает реальные деньги. Я Senior Da…

data scienceмашинное обучениеmachine learningdata analystjuniorкарьера в itкак стать data scientistклассический MLсобеседованиесобеседование data scientist
Habr
RU

Искусственный интеллект без магии: Гигачат, нейросети, профессии и риск «дешёвого апокалипсиса» — интервью с Сергеем

Искусственный интеллект давно перестал быть темой только для исследовательских лабораторий. Он уже пишет код, редактирует изображения, помогает бизнес…

ИИискусственный интеллектГигачатChatGPTнейросетимашинное обучениеDeepSeekSberAGIинтервью
Habr
RU

От диплома до продакшена: … Часть 7: Инфра, MLOps и уроки масштабирования

3.3. Что я сделал бы иначе Закладывал бы MLOps с первого дня , а не «сначала модель, потом инфраструктура». Параллельно — дешевле. Автоматизировал бы …

MLOpsмасштабированиепродакшнмашинное обучениеискусственный интеллектмониторинг моделейдрейф данныхKubernetesMLflowCI-CD
Habr
RU

Языковые модели без лишних слов

Представляем новинку, которая уже получила высокие оценки от экспертов мирового уровня. Книга Андрея Буркова « Языковые модели без лишних слов: П…

машинное обучениенейросетиискусственный интеллектpythonPyTorchNLPLLMкнигибхвbhv
Habr
RU

Как мы контролируем сборку печатных плат: опыт внедрения ML-модели на производстве

Привет, Хабр! Это команда SmartFab YADRO . Мы решаем задачи на собственном производстве полного цикла Фаб Дубна, включающем цеха по производству много…

машинное обучениекомпьютерное зрениесистема контроляпечатная платадубнапроизводство электроники
Habr
RU

Inside AI Meetup — как это было? Делимся записями докладов, фото и атмосферой

Привет! 20 мая прошел  Inside AI Meetup от Wildberries & Russ — про практические кейсы внедрения ИИ: векторный поиск и модерация с 200+ модел…

aiииискуственный интеллектmlmachine learningмашинное обучениемитапdsdata sciencemeetup
Habr
RU

Где в IT джуны получают больше всего и куда пойти учиться

Зарплаты джунов в IT обычно невысокие. Работодатели ищут сотрудников с опытом от года даже на начальные позиции, а в вакансиях без опыта нередко предл…

образование в итобразование в itml-инженермашинное обучениеsre-инженерsreаналитика данных
Habr