RU

Как я собрал эталонный Data Engineering проект: ClickHouse, Kafka, Spark, dbt, Airflow и Superset за одну команду

Меня зовут Андрей, я работаю с данными. И так получается, что на реальных проектах у меня никогда не было возможности собрать идеальный, на мой взгляд…

data engineeringdata sciencedata miningbig datacryptocurrency
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 11: Градиентный бустинг

В десятой части при изучении случайного леса мы наткнулись на проблему: переход от одиночного дерева к лесу частично снизил дисперсию, но вопрос со см…

градиентный бустингxgboostlightgbmcatboostмашинное обучениеdata science
Habr
RU

Ключевые основы автоматического выбора алгоритмов кластеризации мультимодальных данных на основе мета-обучения

Задача кластеризации относится к классу «обучения без учителя» и является фундаментальным инструментом exploratory data analysis (разведочный анализ д…

Автоматическая кластеризациямета-обучениемультимодальные данныеAutoMLвыбор алгоритмовdata sciencemeta-learningAutoClusteringобучение без учителяllm
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 10: Бэггинг и случайный лес

В предыдущей части мы изучали дерево решений и, несмотря на его замечательные свойства, наткнулись на один огромный недостаток — нестабильность. Казал…

baggingrandom forestout-of-bagoobbootstrappingaggregatingдерево решениймашинное обучениеdata science
Habr
RU

Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов?

Пока лента обсуждает LLM и агентов, а инвесторы спорят про окупаемость GenAI, «скучный» классический ML тихо зарабатывает реальные деньги. Я Senior Da…

data scienceмашинное обучениеmachine learningdata analystjuniorкарьера в itкак стать data scientistклассический MLсобеседованиесобеседование data scientist
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

В шестой части мы разобрали логистическую регрессию и увидели, как линейная модель может разделять классы с помощью вероятностного подхода. В этой час…

svmклассификацияkernel tricksgdстохастический градиентный спускhinge lossdata scienceml
Habr
RU

Inside AI Meetup — как это было? Делимся записями докладов, фото и атмосферой

Привет! 20 мая прошел  Inside AI Meetup от Wildberries & Russ — про практические кейсы внедрения ИИ: векторный поиск и модерация с 200+ модел…

aiииискуственный интеллектmlmachine learningмашинное обучениемитапdsdata sciencemeetup
Habr
RU

Новинка: Прикладные API для искусственного интеллекта и Data Science

В течение последних двух лет мы проделали большую работу по изданию неустаревающих книг, связанных с проектированием и развитием API. Как известно, са…

apiкнигиdata scienceискусственный интеллектlangchainstreamlitpython
Habr
RU

Изучаем машинное обучение scikit-learn за одну статью: от понимания API до боевого пайплайна

Осваиваем scikit-learn за 20 минут 🚀 Выкатил на Хабр гайд для тех, кто хочет понять классический ML на Python без воды. Внутри: — Главный секрет библи…

pythonscikit-learnmachine learningмашинное обучениеdata scienceруководстводля начинающих