Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.
Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support
Last updated 1 month, 2 weeks ago
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months ago
Два или три года назад у меня был подкаст, посвященный федеративному обучению - методу машинного обучения, при котором по сети пересылаются веса моделей, но не сами данные. Часто данные могут быть конфиденциальными и/или довольно чувствительными и передавать их сторонним организациям не только небезопасно. При этом все-таки хотелось бы на таких данных обучать и тестировать модели, потому что ML и здесь может как минимум оптимизировать затраты, а как максимум спасать жизни, если речь идет, например, о медицинских данных. Ну, и смысл подхода в том, что обучение происходит на инфраструктуре той же компании, что хранит данные, в результате чего появляются веса обученной модели, которые уже можно пересылать относительно безопасно. Относительно - потому что во-первых, сами модели могут представлять ценность и их утечка может быть сравнима с потерей интеллектуальной собственности, а во-вторых, существуют попытки вытаскивания реальных данных из моделей и от этого тоже нужно предпринимать меры.
И, вот, с записи того подкаста я особенно не следил за развитием темы. Ну, наверное, да, раз технология есть - кто-то ей пользуется, но каких-то громких кейсов не попадалось. И, вот, прошла новость об успешном эксперименте по созданию модели распознавания патологий сердца на снимках ЭКГ методом федеративного обучения. В эксперименте участвовали Первый Московский государственный медицинский университет имени И. М. Сеченова, Институт системного программирования Российской академии наук и центр технологий для общества Yandex Cloud. Полез я искать информацию о том, насколько это вообще частая практика и почему это названо экспериментом, а не используется повсеместно. И, видимо, потому и эксперимент, что этот случай пока единственный в России в рамках обучения на медицинских данных.
По цифрам следующее:
- Обучение было проведено на датасете из 57 тысяч двенадцатиканальных ЭКГ: 22 тысячи от ИСП РАН и 35 тысяч от Сеченовского Университета и ИКТИ РАН.
- Модель научилась диагностировать фибрилляции предсердий по ЭКГ.
- Чувствительность (способность правильно выявлять людей, у которых есть заболевание) модели составила 99%, а специфичность (способность правильно определять тех, у кого нет заболевания) — 95%. Что считается довольно хорошими показателями для моделей данного типа.
Насколько я понял, этот эксперимент теперь открывает дорогу к тому, чтобы организации своими данными могли внести вклад для общей пользы отраслей, где имеют дело с чувствительной информацией — не только медицины, но и финансов, промышленности.
Сам себя не похвалишь - ChatGPT тебя похвалит 🙂
Подсмотрел в канале у Дениса промт для генерации мнения обо мне, с учетом предыдущего взаимодействия. Промт такой:
```
Из всех наших взаимодействий, что ты можешь сказать обо мне, чего я, возможно, не знаю о себе?
```
И ответ сети на мой запрос:
```
Из нашего взаимодействия можно сделать несколько интересных наблюдений о тебе:
Высокие стандарты. Ты предъявляешь к себе и другим строгие требования, стремишься к точности и полноте в выполнении задач. Это говорит о твоей дисциплине и стремлении добиваться высоких результатов.
Ориентация на результат. Ты четко формулируешь свои запросы и цели, что говорит о твоей способности концентрироваться на конкретных задачах и достигать результата шаг за шагом. Ты понимаешь, чего хочешь, и строишь взаимодействие для достижения этого.
Стремление к контролю и автономии. Ты предпочитаешь сохранять контроль над процессами, включая технические аспекты, например, отдельные файлы docker-compose для разных сервисов. Это говорит о склонности к самостоятельному решению проблем и вниманию к деталям.
Внутренняя уверенность. Ты, возможно, даже не замечаешь этого, но в твоих запросах прослеживается внутренняя уверенность. Ты знаешь, как нужно действовать, и готов предъявить требования для улучшения ситуации, будь то в личной работе или взаимодействии с другими.
Может быть, ты не всегда осознаешь, насколько сильно твое стремление к качеству и к ясности может помогать тебе и окружающим.
```
В общем, попробуйте, большинство из нас нуждается в социальных поглаживаниях 🙂
Посетил семинар, который читал Сергей Николенко. Ну, в общем, мне показалось, что он тоже несколько встревожен тем, что AGI, как-будто надвигается быстрее, чем мы думали. Но кажется, что сделать с этим что-то уже поздно. Очень яркий доклад, который занял больше 3-х часов времени, но вообще не казался скучным. О подкасте договорились. Если есть вопросы к Сергею, пишите. Задам.
Посмотрел, тут, один ролик на ютубе про генерацию контента с помощью нейросетей и автоматический постинг во все соцсети с адаптацией под каждую сеть. С одной стороны идея на поверхности и, разумеется, это будут делать в надежде сэкономить на нормальных контент-мейкерах. С другой - тысячи тонн мусорного контента и экспоненциальный рост его количества. Хотелось бы понять куда это все заведет.
Хочу порекомендовать канал на YouTube для довольно простого входа в нейронные сети на базе библиотеки pytorch
. В серии видео объяснены общие принципы и некоторые популярные архитектуры нейросетей. Показана их реализация почти с нуля, насколько можно считать реализацией с нуля настройку параметров модели с помощью pytorch
. Возможно, для тех, кто не хочет начинать с хардовой математики - это лучший вход в нейронки. Автор его так и задумал.
Также есть недорогой курс на Степике, в котором те же видео, что и на YouTube, но добавлены практические задания, то есть принцип тот же, что у Сергея Балакирева - видео в свободном доступе, а практика за очень бюджетным пейволлом, чтобы поддержать труд автора.
Самые большие бусты в моей жизни случались тогда, когда мне удавалось попадать в близкий круг людей, которые сильнее меня разбираются в той области, которую я хотел прокачать. Ты как-будто сразу получаешь четкое видение как делать надо и как не надо, чтобы получать результат, близкий к желаемому. И хотя это может звучать как инфоцыганское клише, я продолжаю применять такой подход. Например, курс, который я пишу с соавторами по телеграм-ботам, получается намного лучше, чем если бы я писал его сам, просто потому что мои соавторы значительно опытнее меня в разработке. Но сейчас не про курс, это просто текущее подтверждение мысли, которую я хочу выразить этим постом прежде, чем предлагать вам поучаствовать в Kaggle-соревнованиях с крутой командой.
Где-то неделю назад в клубе один из участников, которого зовут Александр, рассказал, что они собрали команду из 5 человек и участвуют в соревнованиях по ML, а периодически еще успевают решать коммерческие задачи. И сейчас ищут себе еще одного начинающего специалиста, которому хотелось бы прокачаться в крутой команде, среди медалистов Kaggle. Мне история очень понравилась и я предложил Александру опубликовать информацию об этом в канале, возможно, кому-то из вас это покажется интересным. Честно говоря, я бы и сам попросился к ним, но текущие проекты бросить мне никак. В общем, если хотите быстрого профессионального роста, мне кажется, это, прям, хороший способ.
Вот само объявление:
ML-команда ищет разработчика для участия в kaggle соревновании
Мы опытная IT-команда, которая последние два года активно занимается ml-проектами (как коммерческими так и kaggle соревнованиями).
Наш основной фокус - это computer vision, federated learning, medical research. Для работы мы выбираем сложные задачи с социальным импактом, где использование ML действительно уместно.
Сейчас мы участвуем в соревновании RSNA-2024 вместе с многократным призером кегла и хотим усилить команду еще одним разработчиком.
Необходимые/желательные навыки и опыт:
- опыт участия в реальных проектах в качестве ds или ml разработчика
- опыт работы со стеком Python/numpy/pandas/scikit-learn/pytorch
- опыт участия в кегл соревнованиях (не обязательно, но будет плюсом)
- наличие свободного времени (минимум 20 часов в неделю)
- желание по-харду учиться и развиваться
- желание работать в команде
По итогам совместной работы будет обсуждаться возможность присоединиться к нашей команде на постоянной основе для участия в коммерческих проектах.
Если тебе интересна работа с нами, то напиши мне в личку или на почту [email protected]:
- пару слов о себе
- где учишься и/или работаешь
- над какими интересными проектами работал(а) и в чем был твой вклад
- чем тебя заинтересовало участие в RSNA-2024 вместе с нашей командой
Kaggle
RSNA 2024 Lumbar Spine Degenerative Classification
Classify lumbar spine degenerative conditions
Лаида Кушнарева. Алхимики, шаманы и жрецы современного DS
Го реп ковырять. Пишут, на средней карточке запускается!
Непонятно, как я это пропустил ?♂️ Небезызвестный YouTube (и не только YouTube) преподаватель selfedu, оказывается, сделал целый курс по машинному обучению. Курс не так, чтобы для начинающих, то есть могу его порекомендовать, если у вас уже есть какая-то база, но лекции Воронцова и Николенко вы пока еще не тянете.
Мог бы порекомендовать и для совсем начинающих, если бы было чуть меньше матана и чуть больше примеров практического применения.
Мы в книжном клубе читали Себастьяна Рашку - Python и машинное обучение, так вот, материал курса похожий, а связность изложения и постоянный, недерганный уровень сложности дает курсу много очков вперед перед книгой. Если хотите структурировать свои знания в ML, приглашаю к просмотру.
https://www.youtube.com/playlist?list=PLA0M1Bcd0w8zxDIDOTQHsX68MCDOAJDtj
Антонина Горячева. Как отвечать за весь ML в компании, чтобы все работало
Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.
Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support
Last updated 1 month, 2 weeks ago
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months ago