RU

Когда компании пора строить свой LLM-кластер, а не пользоваться внешними API

На раннем этапе внедрения LLM в компании выглядят как быстрый выигрыш: подключается внешний API (например, ChatGPT), ускоряется работа с текстами, авт…

llmon-premise aikubernetesmlopsинференс моделейgpu-кластерыragllama 3ai-инфраструктуракорпоративный ai
Habr
RU

[Перевод] Месть дата-сайентиста: почему LLM не отменили нашу профессию

LLM упростили запуск AI-функций до нескольких вызовов API, и дата-сайентисты будто бы выпали из критического пути. На практике именно здесь начинаются…

harnessData Scienceдата-сайентистоценка моделейllmllm-as-a-judgeметрики качестваанализ ошибокразметка данныхmlops
Habr
RU

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сл…

mlopsselectelllm-моделиqwenphi-4mistralgpt-ossdeepseekaiai-агенты
Habr
RU

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

Рассказываем, как мы интегрировали CodeBERT-based модель классификации секретов в production-продукт с жёсткими ограничениями по железу, сократив врем…

appseconnxmlopsopensourceоптимизацияcodescoringml
Habr
RU

Инженерный подход к MLOps: как принципы расчётной механики ложатся в архитектуру AutoML

«Если что-то может пойти не так, это обязательно случится» . Мы не пытаемся предотвратить отказ, мы проектируем систему так, чтобы отказ одного элемен…

системаmlopsархитектура системыsolid
Habr