DataWorkshop - AI & ML

Description
Онлайн-обучение от европейской компании DataWorkshop.

Курсы по: Статистике, SQL, Python, Data Science, Нейронным сетям, Time Series, NLP.

Корпоративное обучение.

Помогаем внедрять машинное обучение в бизнес.

Сайт:
https://dataworkshop.ru
We recommend to visit
HAYZON
HAYZON
5,686,904 @hayzonn

لا اله الا الله محمد رسول الله ☪️

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @mazzafam

Last updated 1 month, 3 weeks ago

Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.

Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support

Last updated 1 month, 2 weeks ago

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 2 months ago

2 months, 4 weeks ago
В наших странах красивая осень. Вид …

В наших странах красивая осень. Вид на океан мне очень нравится, как и теплая погода зимой. Но осень здесь крутая 😎

Пишу, чтобы обратить внимание, когда будешь идти домой :)

Что касается курса LLM, благодарю за обратную связь. Думаю тогда запустить и на русском в этом году, если группа будет. Для первого потока сделаю супер условия. Это будет практический курс. Буду рассказывать про свой опыт и то важное о чем точно хочешь знать :)

Ждешь? Ставь реакцию 🔥 , это мотивирует писать и наставлять приоритеты

3 months, 1 week ago
3 months, 1 week ago

Ребята, не хватает времени регулярно писать здесь, но расскажу последние новости. Сейчас, помимо обычных ML-проектов (с использованием классических подходов), я всё больше вовлечён в проекты, связанные с LLM. Речь идёт не просто о том, чтобы взять ChatGPT — это хайповое время, к счастью, уже проходит, и горячие головы бегут искать новую модную тему. Суеты становится меньше, и можно спокойно заниматься делом.

Сейчас я консультирую или напрямую веду три LLM-проекта. Назову их условно (названия компаний пока не могу раскрыть, так как это запрещено контрактами, особенно в условиях текущей конкурентной борьбы):
- менторство (помощник который будет помогать развиваться),
- helpdesk (телеком, куча вопросов и разных проблем которые нужно решать),
- экзамен (профилировнная тема в которой нужно сдать экзамен).

Я специально погрузился в реальные проекты, чтобы отшлифовать навыки, которые ранее спокойно развивал, экспериментируя локально. Большинство знаний, которые сейчас циркулируют в интернете, не основаны на реальном опыте, а представляют собой «обезьянничество» — копируют, что говорят другие, и делают вид, что разбираются. Например, популярная библиотека LangChain или агентов CrewAI — их сейчас обсуждают всё чаще. Сразу скажу: не рекомендую использовать их в "продакшене", иначе появится куча проблем.

Недавно записывал подкаст на эту тему, где объяснял, почему так часто говорю "нет, нет и нет". Главная мысль в том, что инструменты — это всего лишь инструменты, и даже если они популярны, они всё равно не решают проблемы. А зачастую наоборот: там, где много маркетинга, меньше "дела".

У меня уже созрел план поделиться опытом, как стоит работать с LLM. Поэтому сразу вопрос: насколько для тебя актуально погрузиться в практический мир LLM? Именно научиться создавать проекты, за которые не будет потом стыдно (а не просто изучать инструменты, которые, скорее всего, не пригодятся).

Пример. Предположим, ты хочешь найти работу в data-сфере (например, аналитиком данных или в области ML, или чем-то смежным). Что можно сделать? Например, проанализировать рынок вакансий и понять, что требуется. Я, кстати, даже собрал такие данные. Но здесь есть загвоздка: вакансии содержат много текста, где каждая компания описывает требования по-своему, и это не так просто анализировать. Тут возникает идея: что, если с помощью LLM мы приведём неструктурированные данные в структурированный вид? Это поможет легче понять и анализировать информацию. Вот так, между прочим, можно создать такого помощника. Интересно?

#llm #project

5 months ago

Про отпуск еще напишу, хочу про одну книгу рассказать, но все же тоже хочу, чтобы и про ML было. Я же и в отпуске про это думаю, это интересно. И скорее всего, как это обычно бывает, я забываю, каково это - не знать. Поэтому давай начнем с азов, вверху опросник, интересно Твое мнение. 👆

5 months ago
5 months ago

AI под собственной крышей

ChatGPT, который сейчас постоянно на слуху и часто является синонимом AI, на самом деле это один из доступных вариантов. В какой-то момент времени действительно GPT-3.5 сделала значительный рывок, в отличие от того, что можно было запустить самостоятельно. Это дало импульс, чтобы активно начинать догонять. Кстати, это вообще интересный момент с точки зрения психологии: когда кто-то достигает точки X, то в голове что-то щелкает и становится понятно, что это возможно. Поэтому резко многим удается достичь этой же точки, и это становится только вопросом времени, и обычно это происходит быстро.
Как пример, было что-то похожее с марафонами. Вспомнилась история 6 мая 1954 года, когда британский бегун Роджер Баннистер впервые в истории пробежал милю быстрее четырёх минут, установив мировой рекорд с результатом 3 минуты 59,4 секунды. До этого многие спортсмены и эксперты считали, что человеческие возможности ограничены, и никто не сможет пробежать милю быстрее, чем за 4 минуты. Это мнение базировалось на длительном отсутствии прогресса в улучшении результатов на этой дистанции. Что интересно, после того, как Роджер Баннистер преодолел этот барьер, произошло нечто удивительное: в течение следующих нескольких лет многие другие бегуны также начали пробегать милю быстрее четырёх минут. Вот так пробивается стеклянный потолок, и ML/AI здесь не исключение.

AI/ML можно использовать не только через API ChatGPT и похожие, но можно держать его у себя (например, на ноутбуке). Понятно, что большие языковые модели очень требовательны к мощностям, и не все так легко можно запустить, но есть разные способы оптимизации. Кстати, что тоже важно, речь идет не только про работу с текстом, но также с рисунками или аудио. Например, на видео это я в самолете (кстати, без доступа к интернету) продолжаю работать над курсом и делаю транскрипцию с видео, чтобы потом записать в финальной версии более улучшенного качества. Целый процесс, как сейчас можно, "беря на работу LLM", улучшать качество своих продуктов.

Интересно? Ставь реакцию! 🔥

@data_work
#llama #gpt #training #llm #ai

6 months, 4 weeks ago

- ИИ отнимет у людей работу! - сказал испуганный человек о прогрессе ИИ.
- Ну не знаю, думаю, это работает иначе, - сказал практик.

Майлс Астрей, талантливый фотограф, сделал необычное фото фламинго, которое выглядело как безголовое розовое облако на тонких ножках. Эта фотография была настолько "творческой", что легко можно было подумать, что она была сгенерирована искусственным интеллектом.

Фотография Астрея получила две награды в категории ИИ на престижном международном фотоконкурсе "1839 Awards". Однако оказалось... (упс) что она не имела ничего общего с искусственным интеллектом - она была сделана обычной фотокамерой.
Эта неожиданная правда привела к дисквалификации фотографии с конкурса, несмотря на то, что ранее она заняла третье место и получила приз зрительских симпатий в категории ИИ. Астрей намеренно подал свою фотографию в эту категорию, чтобы доказать, что искусство, созданное человеком, все еще имеет огромное воздействие в мире, где доминируют алгоритмы.

9 months, 3 weeks ago

В рунете мы еще не запускали поток, но уже был в Польше. Было круто! Результат есть, про это расскажу больше (наверное как вебинар?).

Важно отметить, что команда (именно команда!) сделала результат в течение двух недель. По факту каждый участник зарегестрировал весь путь "с чего начать, когда нужно построить модель ML для решения конкретной задачи"

Это было больше, чем просто тренировать модель - мы (именно команда!) сделали как минимум реальный MVP с бизнес-ценностью. Опыт колоссальный!

Как промежуточные метрики (ликбез):
- 6059 экспериментов (один эксперимент - это больше, чем тренировать модель);
- 49 тетрадок;
- появилось более 2k кода, который можно забрасывать на продакшн.

Все это было сделано командой, поэтому нужно было правильно настроить инструменты (GitHub и т.д.). ️Версионированние данных. кода, экспериментов!

Запуск такого симулятора - это круто, но это имеет смысл, когда есть решительно настроенные люди, которым хочется в течение 2 (или 3) недель конкретно поработать, чтобы приобрести реальный опыт ML/DS.

Ставь ??? и это будет как сигнал, что готов(а) принять участие и прокачать себя по полной в ML/DS. Результат гарантирую лично!

От тебя сейчас зависит, запускаем ли поток "команды DS" в течение месяца. Что думаешь?

9 months, 3 weeks ago

Помогу интерпретировать. Это такой фундамент, который нужно понимать и потом будет проще достигать цель.

"100x100" означает таблицу размером 100 на 100 (100 строк и 100 столбцов), далее "100k x 10k" означает 100 тысяч строк и 10 тысяч столбцов.
И далее видим время.

Для реализации 3 это занимает 19 секунд, для реализации 4 (где используется букву .T - матричный подход, "не трогаем" каждое число на уровне Python) - 199 нано секунд. Для понимания: 1 секунда это 1,000,000,000 наносекунд. Миллиард, Карл! ?

Напомню, что в 1 веке (100 лет)у нас примерно 3 млрд. секунд. Вообще, есть разница в том, считать секунду или век, не так ли? И что еще важно, писать код - это всего лишь одна строчка (не всегда так просто). В общем, с данными нужно работать на уровне таблиц, а не значений.

Для Тебя это новое? ?

9 months, 3 weeks ago
We recommend to visit
HAYZON
HAYZON
5,686,904 @hayzonn

لا اله الا الله محمد رسول الله ☪️

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @mazzafam

Last updated 1 month, 3 weeks ago

Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.

Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support

Last updated 1 month, 2 weeks ago

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 2 months ago