Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Рейтинг: 48.7% · 7 голосов
Machine learning и deep learning: обучение и дообучение моделей, датасеты, PyTorch, TensorFlow, эксперименты, метрики, MLOps и аналитика данных.
Ответить
Аватара пользователя
RedisNinja
Сообщения: 61
Зарегистрирован: 15 май 2026, 01:22

Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Сообщение RedisNinja »

Прошёл за месяц шесть собеседований на мидла DS: два банка, маркетплейс, телеком, две продуктовые компании. На пяти из шести гоняли по LLM — как устроен RAG, чем мерить качество генерации, что такое function calling, в одном месте попросили спроектировать пайплайн агента для саппорта. При этом сами вакансии — скоринг, отток, аплифт, то есть классика на бустинге и SQL. На текущей работе ровно так же: 90% времени — фичи в витринах и CatBoost. Ощущение, что рынок собеседует на одну профессию, а нанимает на другую. У кого как? И главный вопрос: куда вкладывать вечера — добивать глубину в классике или собирать LLM-стек, который на работе пока не нужен?
👍1 ❤️ 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — k8s2000
Рынок СНГ реально расслоился на три трека, и вилки это уже отражают. Классический DS (бустинг, A/B, аплифт) — мидл в Москве 250-350 на руки, спрос стабильный, но не растёт. LLM/ML-инженер — инференс, vLLM, файнтюн, RAG-пайплайны с нормальными евалами — 350-550, и вилка ползёт вверх, потому что людей, доведших LLM-фичу до прода, а не до ноутбука, единицы. Третий трек — AI-продуктовый инженер, гибр…
Перейти к ответу →
Аватара пользователя
tim28
Сообщения: 6
Зарегистрирован: 19 май 2026, 22:09

Re: Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Сообщение tim28 »

Собеседую сам, поясню двойственность. Бизнес массово хочет встроить LLM-фичи в продукты, и команды берут людей с запасом: сегодня ты считаешь отток, завтра тебя попросят прикрутить суммаризацию обращений. Держать отдельного LLM-инженера в каждой команде дорого, вот и спрашивают всё со всех. Но заваливать на агентах никто не будет: если кандидат уверенно тащит классику и SQL — это по-прежнему 80% ценности.
👍1 ❤️ 🔥 😄1 🤔1
Аватара пользователя
k8s2000
Сообщения: 85
Зарегистрирован: 11 май 2026, 00:27

Re: Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Сообщение k8s2000 »

✔ Лучший ответ — сформирован автоматически
Рынок СНГ реально расслоился на три трека, и вилки это уже отражают. Классический DS (бустинг, A/B, аплифт) — мидл в Москве 250-350 на руки, спрос стабильный, но не растёт. LLM/ML-инженер — инференс, vLLM, файнтюн, RAG-пайплайны с нормальными евалами — 350-550, и вилка ползёт вверх, потому что людей, доведших LLM-фичу до прода, а не до ноутбука, единицы. Третий трек — AI-продуктовый инженер, гибрид разработчика с LLM, там вообще другая лига. Мой совет по вечерам: не закапываться в архитектуру трансформеров — её спрашивают, но в работе она почти не нужна. Учить то, что между моделью и продом: как мерить качество RAG хотя бы на уровне собранного датасета вопросов и точности ответов, как держать стоимость инференса, когда хватает промпта, а когда нужен файнтюн. Это редкое сочетание, и оно конвертируется в офферы. Классику не бросать: банк завернёт за непонимание data leakage быстрее, чем за незнание модного фреймворка.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
overflown
Сообщения: 13
Зарегистрирован: 12 май 2026, 02:37

Re: Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Сообщение overflown »

Скажу непопулярное: классика доживает. TabPFN второй версии на табличках до десяти тысяч строк уже бьёт тюненый бустинг из коробки, фундаментальные модели для временных рядов закрывают прогнозы вообще без фичей. Через пару лет «DS на бустинге» повторит судьбу верстальщика: функция останется, профессия растворится.
👍 ❤️ 🔥1 😄 🤔
Аватара пользователя
depechie
Сообщения: 67
Зарегистрирован: 11 май 2026, 11:32

Re: Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Сообщение depechie »

Выше красиво, но в проде всё иначе. Десять тысяч строк — это игрушки: у нас выборки на сотни миллионов событий, и трансформерные таблички туда не лезут ни по памяти, ни по латенси — скоринг обязан отвечать за миллисекунды. Плюс регуляторика: модель надо объяснять и валидировать, ЦБ спрашивает за модельный риск, и интерпретируемый бустинг проходит этот путь в разы легче. Классика в финтехе переживёт нас обоих.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
corvet
Сообщения: 38
Зарегистрирован: 16 май 2026, 06:36

Re: Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться?

Сообщение corvet »

Практичный рецепт, сработавший у меня этой весной: пет-проект, где обе части в связке. Взял открытые данные, собрал прогноз оттока на CatBoost, а сверху LLM-слой, который по фичам и истории объясняет менеджеру причины ухода конкретного клиента. На трёх собесах из четырёх разговор уходил в этот проект и дальше катился по моим рельсам. Один проект закрывает оба вопроса интервьюера — и классику, и «а что вы делали с LLM».
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Машинное обучение и Data Science»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей