Записки MLEшника

Description
Yet another machine learning engineer

Пишу про computer vision и инженерку вокруг сеток
Автор @egshes, T-Bank (ex. Tinkoff)
Advertising
We recommend to visit
HAYZON
HAYZON
6,053,581 @hayzonn

لا اله الا الله محمد رسول الله

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @mazzafam

Last updated 3 weeks, 1 day ago

Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.

Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support

Last updated 2 weeks, 2 days ago

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 1 month ago

2 months, 2 weeks ago

Хороший пост от ребят из яндекса, об обучении VLM в целом и том, как они затащили их к себе

Также они недавно создали канал @timeforcv с разбором статей по CV. Выглядит интересно

2 months, 3 weeks ago

Fun fact

Я совсем недавно узнал, что оказывается, для numpy массивов в тайпингах можно указать и тип значения

Всегда делал
arr: np.ndarray,
хотя можно
arr: numpy.ndarray[typing.Any, numpy.dtype[numpy.float64]] (куда понятнее, да? 🤡)

Второе выглядит страшно, поэтому пользуемся альясами из самого numpy

```
import numpy.typing as npt

def func(a: npt.ArrayLike) -> npt.NDArray[np.int32]:
return np.array(a)
```

3 months ago
5 months, 1 week ago

На одс выложили видео с CV трека Датафеста этого года

- Как мы боролись со спамом в отзывах
- Как мы считаем людей на улице с помощью YOLO
- Open Vocabulary Segmentation: Unlocking Flexible Robotic Perception
- Наш метод "HAHA" и краткий экскурс в аватаростроение
- Портретная гармонизация изображений
- Как ускорить разметку сегментации CV для сотен ассесоров?
- Генерация видео по тексту с помощью диффузионных моделей
- Оценка степени загрязнения лидара
- Обнаружение неклассифицируемых препятствий по данным лидара
- Доклад про призовое решение на Kaggle. 2 место в соревновании по распознаванию жестового языка
- Запуск автомодерации видео
- Depth Estimation in Robotics
- Генерация псевдоаномалий
- Лошадиное здоровье или action recognition в сфере животноводства
- ML в Агро: с какими данными мы работаем, с какими проблемами мы сталкиваемся
- Цвет, это, блин, фича!
- Распознавание данных по фото СТС
- Генеративные аугментации в задачах компьютерного зрения

5 months, 1 week ago

Офтоп

Приложение rectangle позволяет "приклеивать" окошки в макос, как это делается на винде или линукс

Простите, просто личная боль ?

5 months, 2 weeks ago

Сегодня отодвигаем в стороне ML и вспоминаем истоки ?

Не первый раз сталкиваюсь ловлю себя на мысли, что в разных библиотеках встречаю похожий концепт - объект, который соединяет другие в цепочку. Например, Compose из albumentations, nn.Sequential из torch, Chain из langchain. Стало интересно, а как оно называется.

Так вот, это паттерн Цепочка обязанностей (Chain of responsibility)

Когда полезен:
1. Когда программа должна обрабатывать разнообразные запросы несколькими способами, но заранее неизвестно, какие конкретно запросы будут приходить и какие обработчики для них понадобятся.
2. Когда важно, чтобы обработчики выполнялись один за другим в строгом
3. Когда набор объектов, способных обработать запрос, должен задаваться динамически

Иногда полезно посмотреть теорию за вещами, которыми давно пользуешься

P.S. тут кайфовое объяснение, но из РФ открывается только с VPN

5 months, 3 weeks ago

Наткнулся на аккаунт с пачкой интересных space-ов в huggingface

- RT-DETR (рилтайм детектор на трансформере)
- BLIP-2 (captioning и VQA)
- Сразу несколько VLM (KOSMOS-2, Fuyu-8B, LLaVA-NeXT)
- OWLv2 vs Grounding DINO
- и другие

Интересно поглядеть, чего нового есть

5 months, 3 weeks ago

? ДатаФест2024: Встречайте новые нарезанные доклады!

Друзья, начали публиковаться треки с ДатаФест2024! ? Это ваш шанс погрузиться в самые актуальные темы и получить море полезной информации. Посмотреть всё во время проведения феста просто физически было не возможно…
Поэтому сморим сейчас в спокойном режиме с попкорном или кофеёчком ))

? Уже доступны треки:

Data Governance
Career
ML in Marketplace
Data Strategy
Practical ML

? Выбирайте интересующие вас доклады и обязательно ставте реакции! Именно ваши лайки помогут определить лучшие выступления для ДатаЁлки. ?

? Остальные треки будут выкладываться постепенно в течение месяца, так что следите за обновлениями на ods.ai !

5 months, 3 weeks ago

Майки выпустили Flourence-2

Это grounding модель, которая умеет решать тучу задач на картинках. Загибаем пальцы:
- Captioning (причем с тремя степенями детализации)
- Object detection
- Dense region caption (как предыдущий, но с более подробным названием класса не car, а Volkswagen Beetle)
- Region proposal
- Phrase Grounding (приземлить куски предложения на картинку)
- Segmentation (по фразе)
- Segmentation (по ббоксу)
- OCR

При этом это seq-to-seq (текст на вход - текст на выход) модель ? Просто пишем '' и получаем описание картинки, '' - и детекшн всего, что увидела. И все это естественно, zero-shot работает на наших задачах.

Что удивляет - это относительно малый размер 0.23B и 0.77B (в сравнении c llm-подобными)

Попробовал на рабочей задачке, и реально клево понимает картинки. При этом нет галлюцинаций. Конечно, бывают ошибки, но это не бесстыжее выдумывание

Тот самый случай, когда зарешали данные. Ребята собрали огромный датасет и GO BRHAAA

Ноутбук авторов с демонстрацией

6 months, 1 week ago

Пользователям VS Code посвящается

Сколько нервов было потрачено, потому что по умолчанию VS Code позволяет менять исходники внешних библиотек (в моем случае либы python, которые я установил в env). Мб со мной что-то не так, но я то и дело случайно удалял символ или приписывал в них по паре букв.

Долго не мог найти ту самую настройку, но в конечном итоге осилил. Если бы вы знали, как теперь я кафую, вы бы расплакались ?

Итак, просто укажите в settings.json это

```

{
"files.readonlyInclude": {
"/some/path/to/your/env/lib/python3.8/site-packages/*/.py": true
}
}

```

Когда возникнет необходимость редактировать защищенные файлы - просто закомментируйте нужный путь

#tool

We recommend to visit
HAYZON
HAYZON
6,053,581 @hayzonn

لا اله الا الله محمد رسول الله

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @mazzafam

Last updated 3 weeks, 1 day ago

Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.

Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support

Last updated 2 weeks, 2 days ago

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 1 month ago