Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months, 3 weeks ago
Новые и перспективные Web3 игры с добычей токенов.
Чат: https://t.me/Crypto_Wolf_Chat
Правила чата смотрите в описании чата.
Все свои вопросы направляйте в чат или главному модератору чата: @Exudna_118
По теме сотрудничества: @Zombini
Last updated 2 months, 1 week ago
Остров Доктора Моро..
СКИДКИ, СКИДКИ, СКИДКИ!!
Мечтаешь стать крутым специалистом и с легкость тащить собесы, но не хватает фундамента? Хочешь овладеть знаниями и навыками для работы в крупной компании как Яндекс, Тинькофф или ВК?
Тогда специально для тебя в честь начала учебного Поступашки объявляют акцию до 14 сентября! Любые два курса из шести можно приобрести оптом всего за 9 тыс рублей а любые три курса из шести можно приобрести оптом всего за 14 тыс рублей:
➡️ алгоритмы старт
➡️ алгоритмы хард
➡️бэкенд разработка➡️машинное обучение➡️ аналитика➡️ инженер данных
Курсы заточены под практику, вся теория разобрана на конкретных задачах и кейсах, с которыми сталкиваются на работе и на собесах. На курсах вас ждут куча пет проектов и мини проектов, которые пойдут в портфолио, разбор реальных тестовых заданий бигтехов, разбор актуального контеста на стажировку в Яндекс и Тинькофф, список реальных технических вопрос с собесов и много других приятных боносов как разбор всех задач с алгособесов Яндекса! А после прохождения курса тебя ждет пробный собес с подробной консультацией и сопровождением, рефералкой в Яндекс или в другие топовые компании?
Каждый курс длится 6 недель, каждую неделю по 2 урока, огромное количество дополнительного контента, более 40 часов уроков с последующим доступом к записям и ДЗ с проверкой! На семинарах с каждым учеником общаются по очереди, полноценное общение как здесь. Ежедневная связь, сильное окружение, помощь по составлению анкеты, резюме, пробные собесы, контесты, персональные рекомендации, инсайды и домашнее задание с проверкой, код ревью и с разбором от преподавателя, который отвечает даже после завершения курса! Все будет еще круче, чем на всех прошлый курсах (отзывы тут). Все для того, чтобы получить топовый оффер уже осенью или мы вернем потраченные деньги!
Для записи и всех вопросов: @menshe_treh
Эти пет проекты должен сделать каждый ML специалист
Устроиться можно попасть и без проектов, но если у вас их нет, то мл кейсы будут решаться неуверенно и на финалах будете выглядеть слабее других. Никто не ждет гениального проекта с инфраструктурой— реализовать какие-то бейзлайны и понимать специфику задач уже достаточно для стажера и джуна.
Уже делали подобную подборку для аналитиков здесь, советую присмотреться.
Кредитный скоринг
Стоит ли давать кредит— довольно популярная задача и отличный выбор для новчиков, чтобы самостоятельно проделать все этапы. Сначала берем любой датасет на kaggle по запросу Credit Scoring. Проводим EDA, генерируем гипотезы, фичи, готовим данные для модели и делаем бейзлайн: логистическая регрессия. Затем уже можно попробовать случайный лес, градиентный бустинг, KNN или еще что по вкусу— сравниваем метрики. И на последок не забываем проанализировать результаты и культурно презентовать. Можно провести АВ тест на смой первой модели.
Все варианты решения и реализации можно найти в интернетах: GitHub, Хабр. Очень полезным будет посмотреть всякие выступления на конференциях по этой теме для вдохновения, да и это очень поможет на мл кейсах.
Наивный Байесовский классификатор (НБК)
Для конкретики будем классифицировать письма на спам. Опять же обработаем данные: удаляем числа, знаки препинания, стоп-слова, стемминги, лемматизацию.
Объединяем все методы предварительной обработки и создаём словарь слов и счётчик каждого слова в наборе данных для обучения:
Вычисляем прогнозируемый результат с помощью условных вероятностей.
НБК реализовать не сложно. Куда интересней погрузиться во всю теорию, которая за этим стоит, в вероятностные модели. К тому же, кейс фильтрации спама и подобного часто встречается на собесах.
MLOps
Можно наладить какой-то минимальный прод для проектов: например телеграм бот или FastAPI. Можно еще автоматизировать пайплайн с помощь AirFlow и попробовать запустить инфраструктуру не только локально, но и облаке. Конечно нужно будет поизучать Docker, Cuber, Hadoop, Spark, HDFS, Kafka. Но на самом деле ничего трудного— после нашего курса дата инженер будете делать такие вещи по щелчку пальцев.
Ранжирование и матчинг
Для начала лучше пробежаться глазами по статье и посмотреть, что пишут в интернетах. Можно выделить три подхода к задаче: поточечный, попарный, списочный. Советую начать с первого как самого простого. Для конкретики будем предсказать оценку релевантности для запросов тестового датасета. Здесь можно кстати поучиться парсить web-страниц и собирать сырые данные, размечать их с помощью какого-нибудь Яндекс-Толока. Делаем регрессию, а затем Random Forest Regressor, XGBoost, lightGBM, CatBoost.
Совсем продвинутые могут попробовать языковые модели в духе FastText, Word2Vec, DSSM и более сложные: BERT, можно даже попробовать архитектуру трансформеров.
Рекомендашки
Очень популярный кейс на собесах. Для начала лучше пробежаться глазами по этому разделу и посмотреть, что пишут в интернетах. Затем начинаем реализовывать самое простое как бейзлайн, например, content-based рекомендации, KNN. Дальше можно попробовать факторизации матрицы рейтингов по svd разложению или по более эффективной als архитектуре и функции ошибок bpr. Затем можно попробовать W2V подход, чтобы использовать последовательность взаимодействий пользователя для построения рекомендации следующего предмета.
Для знатоков DL можно попробовать DSSM, SasRec/Bert4Rec, MultVAE, Merlin или графовые нейронки: GCN-подобные архитектуры.
Также стоит попробовать обучение с подкреплением: многоруких бандитов.
Ну и конечно рекомендательные системы можно попробовать рассмотреть как задачу ранжирования.
Простите, а есть ли дмс и можно ли оформить как практику в вузе?
Моя практика на лето
Прямо сейчас, товарищи, проходит отбор на самую главную стажировку аналитиков сезона. Для участия нужно заполнить анкету до 23 апреля. Специально для вас еще раз пробежимся по всем этапам отбора.
Скрининг резюме
Как заполнять анкету смотрим обязательно здесь.
Тестовое задание
Немало простых вопросов по матеше, теор веру, мат стату, а также sql, python. Найдете в конце файла.
Видео интервью
Раньше на обычные вакансии стажера звонил HR, который просто рассказывал о себе, о процессе отбора, а также уточнял формальные моменты. Похоже для оптимизации процесса это решили проводить в "записи".
Техническое собеседование
Задачи в лайве на теор вер и мат стат, которые обсуждаются в ролике. Еще могут попасться банальные задачи на парадокс Симпсона.
Авито есть две реĸламные ĸампании в интернете: на сайте А и на сайте Б. На сайте А ĸонверсия выросла, на сайте Б тоже, могла ли совместная ĸонверсия с обоих сайтов упасть. Пример приводили здесь.
Было проведено исследование, что 90% аварий совершают трезвые водители, а 10% пьяные, может ли это значить, что трезвая езда в 9 раз опаснее пьяной езды. Пример здесь.
Потом ждет кейс: АВ тест с уходами в мат стат и продуктовое понимание. Допустим хотим ввести новые фильтры в строке поиска. Как бы вы дизайнили этот эксперимент? Расскажите про формулы mde, t-теста, что такое p-value и тд, какие методы есть чтобы снизить дисперсию, как рассчитать размер выборки и длину (продолжительность теста). Опиши кратко очень словами, как бы ты написал CUPED функцией на питоне. Если прошли курсы, то проблем точно не возникнет.
Перед этим всем конечно еще раз спросят про опыт, конкретно про опыт работы в аналитике. Кратко накинут вопросы типо: как вы справляетесь со сложными задачами? Использовал ли оконки, какие библиотеки в питоне использовали и для чего?
Собеседование на soft skills
Тот самый behaviour из ролика
Собеседование с руководителем и командой
Все просто в духе чем занимался, что умеешь и можем ли мы быть тебе интересны.
Прямо сейчас, товарищи, проходит отбор на самую главную бизнесс стажировку сезона. Для участия нужно заполнить анкету до 26 апреля. Специально для вас попросил руководителя программы рассказать обо всех лайфхаках и особенностях.
Как сказано это бизнесовая стажировка, не айтишная, поэтому тут лишь направления продакта, проджекта, маркетинга, коммерции, финансов и аналитики. Аналитика лайтовая (не разработка и DS), максимум базовый питон (Pandas, Seaborn, NumPy и тд). Самое популярное направление: продакт-менеджмент, здесь конкурс огромный и проводится доп.скрининг. А вот на Коммерцию пройти легче всего, поэтому это хороший вариант, чтобы начать карьеру, залететь в Озон и закрепиться, дальше развиваться уже в инфраструктуре будет попроще.
Скрининг резюме
Если первым приоритетом выберите продакта/проджекта (можно выбрать до 3х направлений), то готовьте резюме именно под него, так как там доп.скрининг. Пройдете на ПМ - пройдете и на всё остальное. Заявки принимаются до 26 апреля, так что ещё есть время адаптировать резюме под нужную позицию. Как заполнять анкету смотрим обязательно здесь.
Тестирование навыков
Все проходят тест на эксель (вопросы на условное форматирование, ВПР, сводные таблицы), плюс тест по выбранному направлению (типичные термины, формулы и метрики). По аналитике даются задачки на тренажёре SQL. Тут важно прочитать инструкцию внимательно и правильно скопировать данные через блокнот, чтобы не слетела база.
Бизнес-игра
Игры проходят в офисе Moscow city, разбор кейса в команде 5-10 человек за 2 часа. Тут важно внимательно прочитать главную цель кейса, чтобы не тратить время на лишние нерелевантные задачки, не перетягивать одеяло на себя и не затыкать других (оценивают командную работу в первую очередь), плюс выступать на защите кейса и не бояться отвечать на вопросы. Если прошли курсы, то проблем точно не возникнет.
Мотивационное письмо
В это году вместо HR-собеса будет анкета с вопросами про мотивацию, желаемых задачах и скиллах. Между игрой и анкетой будет какое-то время, чтобы больше почитать про компанию, поспрашивать у друзей, кто там работает, какие команды/юниты самые интересные, чтобы знать куда хотите попасть. Именно по этой анкет вам потом будут подбирать команду.
Финальное интервью с тимлидом и командой
Обычно проходит онлайн за 20-40 минут. Иногда тимлид прогоняет по хардам и спросит вопросы про метрики/инструменты, но чаще это просто типичный собес, смотрины. Если не подошла первая команда, то подбирают следующую, и так может быть до трёх попыток.
Выход на стажировку будет 15 июля
Для оформления как обычно нужен СНИЛС, ИНН, военник, справка из вуза и трудовая (электронная или бумажная). Часть из этого делается не быстро, поэтому лучше готовить доки заранее.
Более подробно обо всем этом можно посмотреть в ролике.
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months, 3 weeks ago
Новые и перспективные Web3 игры с добычей токенов.
Чат: https://t.me/Crypto_Wolf_Chat
Правила чата смотрите в описании чата.
Все свои вопросы направляйте в чат или главному модератору чата: @Exudna_118
По теме сотрудничества: @Zombini
Last updated 2 months, 1 week ago