RU

Как мы строили eval и автоматизировали оптимизацию AI-агента для умного помощника

Привет! Меня зовут Алексей, я разработчик в Битрикс24.  В первой части рассказывал про retrieval-часть нашего RAG для AI-помощника Марты: как мы …

ragevalоптимизациядатасетбитрикс24база знаний
Habr
RU

Фотограмметрическая поворотка на Arduino за 2500 рублей

Ко мне на кафедре обратились двое старшекурсников. Они пишут программу для археологов: пользователь фотографирует, что нашел, программа лезет в модель…

arduino unoфотограмметрияповоротный стол28byj-48датасетcomputer visiondatasetdiy3d-печатьpyserial
Habr
RU

Трудности перевода: почему LLM не умеют писать нормальные докстринги на русском и как это исправить

Каждый, кто пробовал заставить кодинг-LLM написать вменяемый комментарий к коду на русском, знает, какая это боль. Часто модели либо срываются на англ…

датасеткомментарии к кодуdocstringsавтоматизация разработкиискусственный интеллектllmобучение моделейнаучные исследованиясинтетические данныеai
Habr
RU

Трудности перевода: почему LLM не умеют писать нормальные докстринги на русском и как это исправить

Каждый, кто пробовал заставить кодинг-LLM написать вменяемый комментарий к коду на русском, знает, какая это боль. Часто модели либо срываются на англ…

датасеткомментарии к кодуdocstringsавтоматизация разработкиискусственный интеллектllmобучение моделейнаучные исследованиясинтетические данныеai
Habr
RU

Основы парсинга сайтов: от HTML до готового датасета для NLP

Даже сильная NLP‑модель быстро упирается в банальную проблему: ей нужны данные, причём не абстрактные «готовые датасеты», а тексты…

парсинг сайтовPythonHTMLBeautifulSouprequestsPlaywrightNLPдатасеточистка данныхязыковые модели