RU

Cколько железа нужно ИИ-агенту? Как мы считали ресурсы для on-premise LLM и почему калькуляторы ошиблись в 5 раз

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Один из самых частых вопросов от бизнеса: «Сколько и какого железа нужно, чтобы разверну…

llmaigpuon-premiseagentperformancetpsttfttokens
Habr
RU

Helix Agent Ai — российский самообучающийся AI-агент. Полное руководство по развертыванию и использованию в 2026 году

Заголовок: Helix — российский самообучающийся AI-агент с поддержкой MCP: полное руководство по развертыванию и использованию в 2026 году Читать далее

helixai-agentself-hostedollamamcplanggraphon-premiseприватностьpython
Habr
RU

Альпина GPT: 9 000 пользователей, −1 977 часов и главный барьер корпоративного ИИ

Архитектура агрегатора из 42 моделей, разбор воронки первого касания и измеренная экономия часов на маркетинге книгоиздания. Павел Путинцев, продакт-м…

корпоративный ииai agentprompt engineeringenterprise aichatgptclaudeon-premisealpina gptalpina digitalllm
Habr
RU

Закрытый контур + локальная LLM: как мы запустили AI-агента без интернета

Полтора года назад мы запустили AI-ассистента внутри «Первой Формы», чтобы он помогал сотрудникам компании выполнять рабочие процессы. Сегодня он отве…

aillmenterpriseai agentbpmавтоматизацияавтоматизация процессовon-premiselow-code
Habr
RU

Безопасное внедрение ИИ в корпорации: 3 архитектурных подхода и опыт Alpina Digital

88% компаний используют ИИ, но только 1% достиг зрелости. Главный барьер — не технология, а безопасность данных. Что мы делали два года и почему пришл…

корпоративный ИИинформационная безопасность152-ФЗLLMChatGPTClaudeAPIon-premiseAI governanceAlpinaGPT
Habr
RU

ASOC на коленке: как я навайбкодил замену DefectDojo для своих задач с обогащением из БДУ ФСТЭК

Когда я начал разбираться, чем в open source можно закрыть задачу ASOC / Vulnerability Management, выбор оказался довольно грустным. По сути единствен…

ASOCAppSecDevSecOpsDefectDojovulnerability managementБДУ ФСТЭКon-premiseair-gappedGoPostgreSQL
Habr
RU

Как мы собрали локальный AI-сервер на 4× RTX 4090 с водянкой — кейс для крупного клиента

Авантюра на 4× RTX 4090, два блока питания и водяное охлаждение - машину, которую мы собрали для крупного клиента, еле-еле подняли вдвоём. История о т…

RTX 4090vLLMon-premiseлокальный AI серверлокальный ИИ серверводяное охлаждениеLLM inferenceGPU серверречевая аналитикаself-hosted LLM