Programming — Tech News

All topics AI agents ai api architecture automation aws beginners career claude database devchallenge devops javascript learning llm machinelearning mcp opensource performance productivity programming python react rust security showdev tutorial typescript webdev

All EN RU

async‑profiler в production: CPU, аллокации, lock contention и чтение flame graph

Профилирование Java‑приложений в production часто упирается не в отсутствие инструментов, а в их ограничения: CPU горит в&nbs…

async-profiler Java JVM профилирование flame graph производительность аллокации многопоточность lock contention latency

Почему RAG — это не просто «добавить поиск»: latency, качество и выбор стратегии retrieval

Когда говорят про RAG, его часто описывают как простой способ улучшить LLM‑систему: добавить поиск по внешним данным, найти релевантный…

RAG LLM retrieval latency Chroma Ollama vector search embeddings top-k chunk size

Девять испытаний роста нагрузки: от стартапа к приложению для 25 миллионов пользователей

Эта статья совсем не технический анализ, а увлекательный рассказ о том, как маленький, но очень перспективный стартап стал топовым приложением, а такж…

highload микросервисы latency postgresql elasticsearch kubernetes hpa балансировка нагрузки нагрузочное тестирование observability

Почему ваш Go‑сервис ломается под 1000 RPS и как найти узкое место за полчаса

Go-сервис может идеально проходить функциональные тесты и уверенно отвечать на локальных прогонах, а потом внезапно развалиться под 1000 RPS: p99 улет…

Go нагрузочное тестирование backend микросервисы p99 latency vegeta wrk2 pprof производительность