RnD CV Team / Beauty / Telegram Index

Open in telegram

☆☆☆☆☆

⚑ Report channel

2,417 @rndcv_team

Description

Канал команды RND CV.
Repo: https://gitlab.aicloud.sbercloud.ru/rndcv

Тут будем делиться нашими результатами и факапами, мыслями и идеями в Computer Vision и не только.

Advertising

We recommend to visit

HAYZON

5,835,362 @hayzonn

لا اله الا الله محمد رسول الله

👤 𝐅𝐨𝐮𝐧𝐝𝐞𝐫: @Tg_Syprion
🗓 ᴀᴅᴠᴇʀᴛɪsɪɴɢ: @SEO_Fam
Мои каналы: @mazzafam

Last updated 1 month, 1 week ago

Architec.ton #inTonWeTrust

4,439,684 @architecton_tech

Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.

Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support

Last updated 1 month ago

WeWantYou

4,373,433 @wewantyoutodothejob

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 1 month, 2 weeks ago

2 months, 3 weeks ago

Алфавит РЖЯ! 🔠

Всем привет! Сегодня мы представляем Bukva — открытый датасет для задачи распознавания русского дактильного алфавита. Читайте нашу статью, в которой мы расскажем, как собирали датасет и обучали на нём легковесные модели, способные распознавать дактиль в режиме реального времени.

Особенности:
👾 3757 HD+ видео,
💯 в среднем по 100 видео на класс,
👩‍💼 155 экспертов РЖЯ,
💪 самый разнородный по субъектам,
👥 высокое качество разметки,
🌿 легковесный и быстрый бейзлайн.

📖 Статья 💻 Код 👉 Habr

756 #

3 months ago

🌿 Наши коллеги из Layer CV выбивают очередную SotA! *🌿***

На прошлой неделе ребята опубликовали работу: "Saliency-Guided DETR for Moment Retrieval and Highlight Detection". В ней авторы предлагают новый способ поиска ключевых моментов в видео релевантных текстовым запросам пользователей.

Модель SG-DETR демонстрирует SOTA-метрики на всех ключевых бенчмарках: Charades-STA, TACoS, TVSUM и YouTube Highlights. Особо впечатляющим стал результат на главном бенчмарке QVHighlights, где модель опередила предыдущее решение с невероятным гэпом в 7.44 п.п. 🌿

Препринт версия работы доступна на arXiv и PwC. И уже совсем скоро будет опубликован код, веса модели и наш датасет. Будем рады вашим отзывам и комментариям! 📚

А ещё Марина Бессмертная на RnD Day рассказала в своем докладе "Тихо! Сейчас будет та самая сцена" об автоматизированном пайплайне для анализа видеоконтента. 📹

3,900 #

3 months ago

*🤖 Фреймворк для агрегации разметки в CV*

Привет! У нас хорошие новости!
Мы выложили в открытый доступ AggMe — фреймворк, основанный на методах агрегации разметки с перекрытием. 1️⃣2️⃣3️⃣

Он позволяет усреднять разметку трех типов: bounding boxes, сегментационные маски и временные интервалы (для видео и аудио). А для наиболее эффективной работы поддерживаются 3 метода агрегации: Hard, Drop и Soft, которые по-разному влияют на финальный результат. Важно отметить, что агрегировать можно разметку из любых источников: будь то разметка человеком с крауда, сетками или полученная классическими алгоритмами.

Мы активно используем aggme в своей работе и даже интегрировали его в наши платформы разметки, а теперь решили поделиться им с вами.

Почитать об идее создания фреймворка и о проблемах, которые он решает, можно в нашем посте.
Ждем ваши контрибьюты и багрепорты! Хорошего дня!

🖥 GitHub

4,600 #

5 months, 3 weeks ago

Ищем CV-инженера (Middle/Middle+) в нашу команду! ?****

Задачи:
Направление мультимодальности, в частности работа с Large Vision Models (LVMs):
– постановка гипотез и проведение экспериментов, поиск новых архитектур
– подготовка данных для SFT и претрейна, поддержка пайплайнов для данных и экспериментов
– расчет статистик, построение метрик и валидация на открытых и собственных бенчмарках
– доведение результатов до прототипов и продукта
– написание научных статей

Ожидания:
– хороший уровень Python 3 ?
– bash, git, Docker, dvc, OpenCV, pytorch
– отличное понимание ML и CV (компьютерного зрения) ?
– опыт работы с большими датасетами и мультимодальными архитектурами ?

Будет плюсом:
– знание классических алгоритмов Computer Vision ?
– опыт публикаций, выступления на конференциях и написания научных статей ?

От нас:
? атмосфера стартапа внутри большой компании
➕ отсутствие проблем с вычислительными мощностями
? конференции и обучение
? современный и удобный Agile-офис
? ДМС, сниженные ставки по кредитам, программы лояльности для сотрудников
⚙️ бесплатный фитнес-зал, парковка на территории офиса, снеки, чай, кофе
? конкурентная зарплата!

По всем вопросам @m_ovsepyan

#job #вакансия

978 #

7 months ago

*? Фреймворк для обработки и фильтрации мультимодальных данных*

Коллеги выложили в открытый доступ DPF (Data Processing Framework) — фреймворк для обработки больших датасетов. Наши ребята тоже принимали участие в его создании. С помощью DPF фильтровались данные для обучения таких моделей как Kandinsky и Kandinsky Video, а также сейчас он используется для разметки и фильтрации данных для обучения мультимодальных моделей.

Функционал DPF содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. Подробее читайте на хабре по ссылке ниже.

По всем вопросам можно обращаться к автору фреймворка — Игорю Павлову @bom_bo0m

? GitHub | ? Хабр

1,600 #