Пристанище Дата Сайентиста

Description
Канал Рената Алимбекова (@alimbekovkz) про карьеру, применение и обучение Data Science. Веду блог https://alimbekov.com

По вопросам рекламы на канале обращаться к менеджеру: @hey_renataa
Advertising
We recommend to visit
HAYZON
HAYZON
6,595,880 @hayzonn

💼 How to create capital and increase it using cryptocurrency

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @kriptofo @mazzafam

Last updated 12 hours ago

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 2 months, 3 weeks ago

Новые и перспективные Web3 игры с добычей токенов.

Чат: https://t.me/Crypto_Wolf_Chat

Правила чата смотрите в описании чата.

Все свои вопросы направляйте в чат или главному модератору чата: @Exudna_118

По теме сотрудничества: @Zombini

Last updated 2 months, 1 week ago

2 months, 2 weeks ago

​​Почему стоит идти на Practical ML Conf 14 сентября

Если вы еще сомневаетесь, нужна ли вам вообще эта конференция, не сомневайтесь — нужна. Это мероприятие, где лучшие эксперты в своей области будут делиться опытом по синтезу речи, генерации синтетических данных, обучению LLM работать с кодом и по многим другим полезным вопросам.

Лично я для себя составил топ докладов, которые точно нельзя пропустить:

- Виктор Плошихин, руководитель ML-лаборатории в Yandex Platform Engineering — «AI-инструмент для разработчика: как мы обучали LLM работе с кодом».
- Ирина Барская, руководитель службы аналитики и исследований – «Человек и LLM. Как оценивать качество моделей и строить их метрики качества».
- Екатерина Глазкова, тимлид команды алайнмента VLM службы компьютерного зрения — «Адаптация VLM под продуктовые требования — как сервис Нейро делали мультимодальным».
- Савва Степурин, старший разработчик команды рекомендаций — «Как улучшить знакомые подходы для рекомендации незнакомого — как умная система рекомендаций помогает пользователям Яндекс Музыки открывать новые треки и артистов».
- Степан Комков, старший разработчик службы синтеза речи — «Синтез выразительной речи для аудиокниг, прошлое, настоящее и будущее — как GPT и диффузионные модели произвели революции в синтезе речи и как мы это используем».

Сходить можно офлайн в Москве или же подключиться онлайн из любой точки мира. Обязательна регистрация – вот здесь

[​​](https://telegra.ph/file/e58dcb1cc63d93456bf1b.jpg)**Почему стоит идти на Practical ML Conf 14 сентября**
2 months, 3 weeks ago

​​В предыдущем посте писал, что у меня новый карьерный этап.

С недавних пор помогаю ребятам из unimatch

Делаем AI для венчура.

Сделали system дизайн решения, проводим cust dev, уже изучили конкурентов, есть бэклог. В общем проделали много продуктовой работы.

Кстати у фаундера есть клевый телеграм канал Там он более детально рассказывает о проекте и делиться другими бизнес практиками

[​​](https://telegra.ph/file/904600b72275cb30c6678.jpg)В предыдущем посте писал, что у меня новый карьерный этап.
3 months ago

Pandas для Data Science

Я решил написать небольшой цикл статей для начинающих вкатываться в Data Sciеnce и Machine Learning.

В интернете много курсов по Data Science, я даже о них писал пост. Но в них часто мало дают практические приемы для реальной работы.

В своих статьях я хотел сделать больше акцент на практические приемы и сделать сквозной проект от основы до построения хорошей модели.

В первой статье Pandas для Data Science попытался раскрыть такие темы как:
- основы Python для Pandas
- основы работы с Pandas
- важные техники работы с Pandas, которые пригодятся в построении моделей
- Работа с плохими данными
- Исследование аномалий
- Работа с пропусками

Ссылка на статью

Персональный блог Рената Алимбекова - Data Science, ML и Analytics Engineering

Pandas для Data Science - Практические советы

Pandas для Data Science - Практические советы, работа с аномалиями, подготовка данных для обучения моделей, работа с пропусками

5 months ago

Коллеги скинули ссылку на марафон по BI от Analytic Workspace. Решил посмотреть, что за марафон такой, оказалось, знаю ребят из экспертного жюри. Заинтересовался ещё больше. 

?Теперь рассказываю вам. BI-платформа Analytic Workspace запустила бесплатный марафон «Сквозь данные к смыслам» — это 4-дневный интенсив по прокачке скилов в обработке и визуализации данных. 

☝?Программа марафона создана для аналитиков данных, бизнес-аналитиков, продакт-менеджеров, руководителей проектов, начинающих и не только. 

Из «плюшек»:
?будут обучать эксперты-практики
?в конце марафона конкурс — можно выиграть деньги 
?есть hr-партнёры, от которых можно получить оффер
? Дата-партнёр марафона – VK Cloud

Участие бесплатное, возможности хорошие, поэтому делюсь с вами ссылкой, где все подробности о марафоне, там же можно зарегистрироваться.
➡️ Ссылка

analyticworkspace.ru

BI-Марафон | Конкурсное задание в финале | Июнь 2024

4 дня для прокачки навыков обработки и визуализации данных с топовыми экспертами

Коллеги скинули ссылку на марафон по BI от Analytic Workspace. Решил посмотреть, что за марафон такой, оказалось, знаю ребят из …
6 months ago

Всем привет ?! За несколько последних дней на канале добавилось много новых подписчиков. Рад вас приветствовать на канале.

Немного расскажу о себе. Меня зовут Ренат Алимбеков, я живу и работаю в городе Алматы. С недавних пор работаю в американском стартапе Conformal Group в качестве Research Engineer, но об этом чуть позже будет пост. С остальным моим профессиональным опытом можно ознакомиться в LI (добавляйтесь)

Для всех подписчиков и особенно для тех кто к нам присоединился недавно публикую подборку старых постов. Надеюсь это поможет с навигацией и удобным поиском информации на канале.

Пишете в комментариях о чём было бы интересно почитать.?

??‍? Про курсы и обучение хэштег #course

Как освоить Data Science — личный опыт
Прокачиваемся до computer vision researcher
Как стать Machine Learning Engineer

? Production хэштег #production

Machine learning в продакшн — Flask REST API
BentoML

? Полезное хэштег #полезно

Visual Studio Code для Data Science
Тестовые задания от разных компаний, на позицию, связанную с Data Scientist
Пост в блоге про выбор логирования в Python

? Подборки

Основы Python
Статистический анализ данных
Pandas и А/Б тесты
Сбор и хранение данных

А еще я написал буклеты по подготовке к Data Science интервью:

- Data Science Interview Guide (на англ. языке) по промокоду BLOG скидка 2 $
- Руководство по подготовке к Data Science интервью (на рус. языке) о промокоду BLOG скидка 2 $

7 months, 1 week ago

Погружение в LLM часть вторая

В первой части мы разобрали практическую часть погружения в LLM.

В этой части мы поговорим про ключевые пейперы, которые помогут в понимании LLM и прохождение собеседований =) Но об этом позже.

Все начинается с первой гпт

Затем рекомендую прочитать работу про InstructGPT. Там раскрыта тема обучения с фидбеком от человека.

Дальше есть пара интересных пейперов:
- SELF-INSTRUCT
- Information Retrieval with Contrastive Learning

Затем рекомендую ознакомиться с двумя воистину знаковых пейпера: LORA и QLORA, которые решают следующие проблемы:
- скорость обучения
- вычислительные ресурсы
- эффективность памяти

Еще два не менее важных пейпера PPO и DPO. Понимание этих работ поможет в ревард моделинге.

Ну и на последок:
- Switch Transformers - как база Mixtures of experts
- Mixtral of Experts - как Open Source SOTA
- Llama 2

Всем приятного чтения

7 months, 1 week ago

​​??Реально ли специалисту в любой области получить greencard США без предложения о работе, без высшего образования, и без знания английского языка? Ответ: да! Рассказываем, как это сделать.

Виза EB-1a дала возможность более 4000 специалистам из разных областей переехать в США в 2022 году. Она выдаётся на срок до 10 лет, по ней можно работать в любой компании, фрилансить и открывать собственный бизнес. И через 5 лет жизни в США претендовать на паспорт!

Чтобы получить эту визу, не обязательно иметь высшее образование, не нужно знать язык на высоком уровне, а заявку можно подать из любой страны. И, пожалуй, самое главное – не нужно обладать каким-то исключительным талантом! Огромное количество специалистов даже не знают, что могут претендовать на эту визу. 

Подписывайтесь на наш Telegram-канал, где мы даём массу полезной информации о релокации: https://t.me/+EJMbGHprOWc4ZjMy

Пишите нам в WhatsApp: +44 7496 949122 или в Telegram: @relocode_dm. Мы проводим бесплатные консультации, на которых поможем разобрать ваш кейс и подобрать наиболее подходящий способ релокации.

[​​](https://telegra.ph/file/a4d1759476fa4e42b0b0e.jpg)***??***Реально ли специалисту в любой области получить greencard США без предложения о работе, без высшего образования, и без знания английского …
7 months, 1 week ago

​​Станьте специалистом по Data Science — с нуля, за восемь месяцев на курсе Яндекс Практикума. 

➤ Освоите Python и его библиотеки, Jupyter Notebook, CatBoost, SQL
➤ Соберёте портфолио из 15+ проектов
➤ Получите сертификат о переподготовке и помощь с трудоустройством

После выпуска вы сможете анализировать большие объёмы данных, работать с моделями машинного обучения и выявлять неочевидные и важные закономерности. Такие услуги нужны в банках, промышленности, маркетинге и коммерции, транспортной сфере. 

Начните с бесплатной вводной части курса, чтобы понять, нравится ли вам профессия

[​​](https://telegra.ph/file/b7c6a5a78c00e4e353151.jpg)Станьте специалистом по **Data Science — с нуля**, за восемь месяцев на курсе Яндекс Практикума.
8 months, 2 weeks ago

? Что читают лидеры уровня C-level и D-level в сфере управления данными?

THE CDO DIGEST — это проект в рамках закрытого сообщества экспертов в области управления корпоративными данными и их монетизации THE CDO CLUB.

Публикуем кейсы монетизации данных и последних трендов в области управления данными, аналитики и AI еженедельно в телеграм, а также отправляем ежемесячный дайджест на email.

В дайджесте вы найдете ответы на вопросы:
? Что делают крупнейшие компании сейчас в области AI-инициатив (кто инвестирует, какая AI-стратегия, кто драйверы AI-инициатив)?
? Все говорят, что данные это актив, но как посчитать их ценность и/или стоимость?
? Каким будет бюджет на инициативы по генеративному AI в 2024 (и увеличился ли он по сравнению с 2023 годом) у 2000 крупных компаний мира ?
? Как снизить среднее время получения аналитической информации (MTTI) в компании?

Держите руку на пульсе индустрии и будьте в центре развития технологий и стратегий управления данными.

? Подписывайтесь на телеграмм-канал THE CDO Digest

www.thecdo.kz

Digest

Подписаться на digest-рассылку от THE CDO CLUB

9 months, 1 week ago

Всем привет!

Владелец продукта ИТ-компании изучает потребности и пожелания пользователей BI-систем, которые представлены на рынке. 

У вас есть уникальная возможность поделиться опытом, дать рекомендации и подсветить проблемы используемых систем.

Переходите по ссылке ? https://docs.google.com/forms/d/1e6pABdGEc7tpm0x3PflnifuSlERYIhuFJiyABHd50_U/edit ? и делитесь бесценным опытом?

Google Docs

Опрос по опыту работы с данными

Меня зовут Евгений Синько - я владелец продукта в компании, которая занимается разработкой собственной экосистемы работы с данными. Благодаря многим годам работы и штату опытных разработчиков наша команда обладаем уникальными знаниями и навыками в разработке…

Всем привет!
We recommend to visit
HAYZON
HAYZON
6,595,880 @hayzonn

💼 How to create capital and increase it using cryptocurrency

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @kriptofo @mazzafam

Last updated 12 hours ago

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 2 months, 3 weeks ago

Новые и перспективные Web3 игры с добычей токенов.

Чат: https://t.me/Crypto_Wolf_Chat

Правила чата смотрите в описании чата.

Все свои вопросы направляйте в чат или главному модератору чата: @Exudna_118

По теме сотрудничества: @Zombini

Last updated 2 months, 1 week ago