LLM бенчмарк «Испытание Дали»
Выбирая LLM для своего первого пет-проекта, я случайно создал бенчмарк для LLM "Испытание Дали" по трем параметрам: качество, скорость и стоимость. Эт…
Latest Testing & QA news from Tech News
Выбирая LLM для своего первого пет-проекта, я случайно создал бенчмарк для LLM "Испытание Дали" по трем параметрам: качество, скорость и стоимость. Эт…
LTX нейросеть — это современный инструмент для генерации видео, изображений и креативного контента на основе текстовых описаний. Платформу используют …
Интерес к генеративному видео растет очень быстро, и на этом фоне Kling все чаще обсуждают как инструмент, который помогает делать короткие ролики из …
Привет, Хабр! Я — Руслан, а это — моя статья написанная в основном по следам моего доклада про будущее ИТ, ИТ-архитектуры и работы айтишников + часть …
Большинство существующих AutoML-библиотек либо не поддерживают обучение моделей для понимания естественного языка (Natural Language Understanding, или…
Большинство существующих AutoML-библиотек либо не поддерживают обучение моделей для понимания естественного языка (Natural Language Understanding, или…
В первой статье мы протестировали 30 нейросетей на задачах российских учителей — российские модели оказались последними. На 9 месте стоит наша: дообуч…
Компаниям, выходящим на экспортные рынки, часто сложно найти менеджеров по продажам, владеющих иностранными языками. Одно из решений — привлекать инос…
Представьте сцену. Вы пишете в терминал: «разберись, почему на main падает вот этот тест, и попробуй починить». Жмёте Enter. Спиннер крутится, подписи…
Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезае…
Просто представьте на миг: вы — один из тех учёных, кто запускает финальный билд созданного сверхинтеллекта. Экран мигает. Код компилируется внутри ма…
Это саммари подкаста Ленни Рачицкого с Хамилем Хусейном и Шреей Шанкар. Ниже — главные идеи, и пошаговый процесс проведения оценки . Мы живем в эпоху,…
Маркетологи паникуют. SEO перестало работать - по ссылкам не переходят, продвижение в интернете теряет смысл, LLM завладело вниманием пользователей. Т…
В этом интервью мы поговорили с Chief AI Architect Андреем Носовым о феномене OpenClaw, который набрал популярность на GitHub быстрее, чем Linux. Мы ч…
История о том, как микроконтроллер за 500 рублей помог вырастить клубнику ранней весной, и почему важно знать «анатомию» чипа Живу в обычной квартире.…
Народ выдает массовую острую реакцию на галлюцинации нейросетей. Выкатывают разработчикам претензии: «нейронка врет и игнорирует контекст!». Инженеры …
Нейросети стали часто использоваться в творчестве и нашей повседневной жизни. Листая короткий контент, можно наткнуться на фото и видео, где в роли об…
За последние месяцы прогремел целый залп новостей вокруг игровой индустрии и применения нейросетей в создании игр. Геймеры опасаются за судьбу игропро…
В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по…
Привет Хабр! В нашем блоге кейс-пополнение. Дисклеймер: По причине соглашений о неразглашении (NDA) мы не всегда можем указать на конкретного заказчик…
У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремально…
В поддержке запрос бизнеса очень прикладной: быстрее отвечать, делать меньше ошибок, выполнять SLA, выдерживать рост обращений при расширении каналов …
Представьте: вы наняли идеального сотрудника. Он пишет код как senior, разбирается в архитектуре за минуты, работает 24/7 без выгорания. Но у него одн…