Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.
Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support
Last updated 2 weeks, 2 days ago
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 1 month ago
Хороший пост от ребят из яндекса, об обучении VLM в целом и том, как они затащили их к себе
Также они недавно создали канал @timeforcv с разбором статей по CV. Выглядит интересно
Fun fact
Я совсем недавно узнал, что оказывается, для numpy массивов в тайпингах можно указать и тип значения
Всегда делал
arr: np.ndarray
,
хотя можно
arr: numpy.ndarray[typing.Any, numpy.dtype[numpy.float64]]
(куда понятнее, да? 🤡)
Второе выглядит страшно, поэтому пользуемся альясами из самого numpy
```
import numpy.typing as npt
def func(a: npt.ArrayLike) -> npt.NDArray[np.int32]:
return np.array(a)
```
На одс выложили видео с CV трека Датафеста этого года
- Как мы боролись со спамом в отзывах
- Как мы считаем людей на улице с помощью YOLO
- Open Vocabulary Segmentation: Unlocking Flexible Robotic Perception
- Наш метод "HAHA" и краткий экскурс в аватаростроение
- Портретная гармонизация изображений
- Как ускорить разметку сегментации CV для сотен ассесоров?
- Генерация видео по тексту с помощью диффузионных моделей
- Оценка степени загрязнения лидара
- Обнаружение неклассифицируемых препятствий по данным лидара
- Доклад про призовое решение на Kaggle. 2 место в соревновании по распознаванию жестового языка
- Запуск автомодерации видео
- Depth Estimation in Robotics
- Генерация псевдоаномалий
- Лошадиное здоровье или action recognition в сфере животноводства
- ML в Агро: с какими данными мы работаем, с какими проблемами мы сталкиваемся
- Цвет, это, блин, фича!
- Распознавание данных по фото СТС
- Генеративные аугментации в задачах компьютерного зрения
Офтоп
Приложение rectangle позволяет "приклеивать" окошки в макос, как это делается на винде или линукс
Простите, просто личная боль ?
Сегодня отодвигаем в стороне ML и вспоминаем истоки ?
Не первый раз сталкиваюсь ловлю себя на мысли, что в разных библиотеках встречаю похожий концепт - объект, который соединяет другие в цепочку. Например, Compose из albumentations, nn.Sequential из torch, Chain из langchain. Стало интересно, а как оно называется.
Так вот, это паттерн Цепочка обязанностей (Chain of responsibility)
Когда полезен:
1. Когда программа должна обрабатывать разнообразные запросы несколькими способами, но заранее неизвестно, какие конкретно запросы будут приходить и какие обработчики для них понадобятся.
2. Когда важно, чтобы обработчики выполнялись один за другим в строгом
3. Когда набор объектов, способных обработать запрос, должен задаваться динамически
Иногда полезно посмотреть теорию за вещами, которыми давно пользуешься
P.S. тут кайфовое объяснение, но из РФ открывается только с VPN
Наткнулся на аккаунт с пачкой интересных space-ов в huggingface
- RT-DETR (рилтайм детектор на трансформере)
- BLIP-2 (captioning и VQA)
- Сразу несколько VLM (KOSMOS-2, Fuyu-8B, LLaVA-NeXT)
- OWLv2 vs Grounding DINO
- и другие
Интересно поглядеть, чего нового есть
? ДатаФест2024: Встречайте новые нарезанные доклады!
Друзья, начали публиковаться треки с ДатаФест2024! ?✨ Это ваш шанс погрузиться в самые актуальные темы и получить море полезной информации. Посмотреть всё во время проведения феста просто физически было не возможно…
Поэтому сморим сейчас в спокойном режиме с попкорном или кофеёчком ))
? Уже доступны треки:
Data Governance
Career
ML in Marketplace
Data Strategy
Practical ML
? Выбирайте интересующие вас доклады и обязательно ставте реакции! Именно ваши лайки помогут определить лучшие выступления для ДатаЁлки. ?
? Остальные треки будут выкладываться постепенно в течение месяца, так что следите за обновлениями на ods.ai !
Майки выпустили Flourence-2
Это grounding модель, которая умеет решать тучу задач на картинках. Загибаем пальцы:
- Captioning (причем с тремя степенями детализации)
- Object detection
- Dense region caption (как предыдущий, но с более подробным названием класса не car, а Volkswagen Beetle)
- Region proposal
- Phrase Grounding (приземлить куски предложения на картинку)
- Segmentation (по фразе)
- Segmentation (по ббоксу)
- OCR
При этом это seq-to-seq (текст на вход - текст на выход) модель ? Просто пишем '' и получаем описание картинки, '' - и детекшн всего, что увидела. И все это естественно, zero-shot работает на наших задачах.
Что удивляет - это относительно малый размер 0.23B и 0.77B (в сравнении c llm-подобными)
Попробовал на рабочей задачке, и реально клево понимает картинки. При этом нет галлюцинаций. Конечно, бывают ошибки, но это не бесстыжее выдумывание
Тот самый случай, когда зарешали данные. Ребята собрали огромный датасет и GO BRHAAA
Ноутбук авторов с демонстрацией
Пользователям VS Code посвящается
Сколько нервов было потрачено, потому что по умолчанию VS Code позволяет менять исходники внешних библиотек (в моем случае либы python, которые я установил в env). Мб со мной что-то не так, но я то и дело случайно удалял символ или приписывал в них по паре букв.
Долго не мог найти ту самую настройку, но в конечном итоге осилил. Если бы вы знали, как теперь я кафую, вы бы расплакались ?
Итак, просто укажите в settings.json
это
```
{
"files.readonlyInclude": {
"/some/path/to/your/env/lib/python3.8/site-packages/*/.py": true
}
}
```
Когда возникнет необходимость редактировать защищенные файлы - просто закомментируйте нужный путь
Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.
Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support
Last updated 2 weeks, 2 days ago
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 1 month ago