RU

Почему RAG — это не просто «добавить поиск»: latency, качество и выбор стратегии retrieval

Когда говорят про RAG, его часто описывают как простой способ улучшить LLM‑систему: добавить поиск по внешним данным, найти релевантный…

RAGLLMretrievallatencyChromaOllamavector searchembeddingstop-kchunk size
Habr
RU

Probe-сеть из 10 регионов: что я не учёл про AS-разнесённость

Я делаю Valpero — uptime-мониторинг с проверками из 10 регионов мира. Когда я только собирал probe-сеть, я был уверен, что 10 географических точек это…

мониторингuptimeBGPASautonomous systemprobelatencyWebSocketинфраструктураfalse positive
Habr
RU

Девять испытаний роста нагрузки: от стартапа к приложению для 25 миллионов пользователей

Эта статья совсем не технический анализ, а увлекательный рассказ о том, как маленький, но очень перспективный стартап стал топовым приложением, а такж…

highloadмикросервисыlatencypostgresqlelasticsearchkuberneteshpaбалансировка нагрузкинагрузочное тестированиеobservability