RU

Гайды Anthropic для Fable 5 и Opus 4.8 советуют противоположное, у OpenAI — третий путь. Что менять в промптах

Когда вышел Claude Fable 5, я его подключил — и он мне не понравился. Модель объективно сильнее Opus 4.8, а работать с ней было хуже: в одном ране аге…

prompt engineeringClaudeGPTLLMAnthropicOpenAIAI-агенты
Habr
RU

Что такое контекстное окно и почему модели забывают

Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила р…

контекстное окноLLMтокеныпамять ИИChatGPTязыковые моделиlost in the middleRAGGPTконтекст
Habr
RU

Может ли ИИ думать? Разбираем вопрос без философии

Этот вопрос обычно заканчивается одинаково: кто-то произносит слово «сознание», дальше начинается философский спор, и через двадцать минут все расходя…

ИИмышлениеLLMпониманиеchain-of-thoughtGPTязыковые моделикитайская комнатаcognitionискусственный интеллект
Habr
RU

Один промпт разросся в регламент: как я разделяю ответственность внутри AI-навыка

Рабочий AI-навык для разработки быстро обрастает правилами: ревью, риски, проверки, handoff, итоговый ответ. В статье рассказываю, как я перестал утяж…

AIChatGPTGPTнейросетиискусственный интеллектпромпт-инжинирингразработкаcode reviewтестированиеавтоматизация
Habr
RU

Режим thinking у ИИ: что на самом деле происходит, когда модель «думает»

Когда нажимаешь кнопку Thinking и видишь, как модель несколько секунд «размышляет» перед ответом — легко решить, что она просто старается сильнее. Раб…

thinkingchain-of-thoughtLLMязыковые моделиИИreasoningo1DeepSeekGPTрежим мышления
Habr
RU

За кулисами нейросетей: полный цикл тренировки языкового ИИ

Ты уже пользуешься языковыми моделями — спрашиваешь, генерируешь, отлаживаешь код. Но откуда берётся сама способность отвечать? Не «где хранятся данны…

LLMобучение нейросетейRLHFfine-tuningпредобучениетрансформерGPTязыковые моделимашинное обучениеИИ
Habr
RU

Что происходит внутри LLM, когда ты отправляешь сообщение

Каждый день миллионы людей разговаривают с системой, про которую не могут ответить на простой вопрос: а что она вообще делает, когда отвечает? Не в см…

LLMтрансформернейросетитокенизацияattentionGPTмашинное обучениеэмбеддингигенерация текстакак работает ИИ
Habr
RU

Как я обучил GPT с нуля на русском языке — и что из этого получилось

Всё началось с наивной мысли: зачем платить за API или тащить 7B-модель, если мне нужна маленькая модель для простых разговоров на одном языке? Логика…

GPTLLMpretrainingраспределённое обучениеGoogle ColabRoPEGQASwiGLUNLPрусский язык
Habr
RU

GPT-шорткаты: что работает, а что нет

Привет! Разобрал популярные шорткаты GPT вроде EL5, /REDTEAM, /BULLET — какие реально выручают каждый день, какие работают через раз, а какие лучше не…

ChatGPTGPTLLMprompt engineeringшорткатынейросетиискусственный интеллекткомандыпромптыгенерация текста
Habr
RU

Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей

Когда мы интегрируем LLM в продакшн, рано или поздно сталкиваемся с одной и той же проблемой: текст модели читаем, грамотен, и при этом видно, что его…

LLMGPTClaudesamplingtemperatureprompt engineeringпостобработкадетекция ИИ-текстаRLHF