Data Science | Machinelearning [ru]

Description
Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence)

По сотрудничеству - @g_abashkin
Advertising
We recommend to visit

?Телеграмдаги Энг сўнгги хит тароналар факат бизда

?? - УЗ
?? - РУ
?? - ТР
?? - Ус
?? - АЗ
?? - ТЖ
?? - КЗ
?? - КР

Creator : @kiinyaz

Last updated 1 year ago

Бесплатные игры и программы для Android

❗️Сотрудничество (ads), DMCA, пожелания: t.me/EasyAPKBot

💵Реклама: https://telega.in/c/EasyAPK

🔴 Чат: @ChatEasyAPK

Все публикуется в ознакомительных целях. Вы скачиваете программы на свой страх и риск

Last updated 10 months ago

Главное про технологии, интернет-культуру, тренды и нейросети.

По рекламе: @Alivian

Биржа: https://telega.in/c/technomotel

Last updated 3 days, 23 hours ago

1 month, 4 weeks ago

?Шифруй то, шифруй это, или LLM под замком

В этой статье мы поговорим о безопасном обращении с коммерческим контентом, шифровании данных, моделях и подходах к безопасному обращению и встраиванию коммерческих данных в модель.

Читать...

***?*****Шифруй то, шифруй это, или LLM под замком**
1 month, 4 weeks ago

?От промптов к дообучению: четыре уровня адаптации open-source моделей

В этой статье расскажу, как мы разделяем разные уровни адаптации, что делаем на каждом из них и когда переходим на следующий.

Читать...

***?*****От промптов к дообучению: четыре уровня адаптации open-source моделей**
2 months ago

? Как мы генерируем GPT-нейросетями миллиарды объявлений на малом количестве GPU

В этой статье автор рассказывает о соединении тяжёлых процессингов и GPU‑вычислений. Как реализовали высоконагруженный процессинг, который обрабатывает миллиарды товаров и превращает их в объявления, используя тяжёлые модели, такие как YandexGPT, DSSM, CatBoost и другие. Оказывается, связать тяжёлый процессинг и инференс моделей вполне реально, даже когда нагрузка в процессинге превышает возможности вашего сервиса.

Читать…

***?*** **Как мы генерируем GPT-нейросетями миллиарды объявлений на малом количестве GPU**
4 months, 3 weeks ago

​​?CriticGPT — модель на основе GPT-4, которая помогает увидеть ошибки в ответах ChatGPT

CriticGPT, модель на основе GPT-4, пишет критические замечания по ответам ChatGPT, чтобы помочь тренерам-людям заметить ошибки во время RLHF.

Ключевой частью RLHF является сбор сравнений, в которых люди, называемые тренерами ИИ, оценивают различные ответы ChatGPT по отношению друг к другу.

?Блог-пост OpenAI
?Статья

@Devsp Подписаться

[​​](https://telegra.ph/file/cd74718b03416d93e500e.jpg)***?*****CriticGPT — модель на основе GPT-4, которая помогает увидеть ошибки в ответах ChatGPT**
4 months, 3 weeks ago

? На пороге AGI: эксперты прогнозируют появление ИИ, способного выполнять любую интеллектуальную задачу, с которой справится человек

И это будет game-changer!

Сегодня нейросети это:
▪️ $13 триллионов к глобальному ВВП к 2030 году
▪️ Убийца творческих профессий (услуги SMM сократились на 13%)
▪️Прорыв в медицине (ИИ редактирует ген человека)
▪️ Бизнес ассистент
▪️ Инструмент манипуляции общественным мнением (читающий Кровосток дипфейк Барака Обамы)
▪️ Управление силой мысли (гейминг без применения конечностей)
▪️ Интимный партнер (да-да)
▪️ Кандидат в парламент (ИИ прирнимает участие в выборах)
▪️ Спасатель

Список можно продолжать до бесконечности! За последние несколько лет ИИ уже успел перевернуть правила игры во многих отраслях нашей жизни. Но с приходом AGI все это покажется нам цветочками.
Биг Дата рассказывает о том, как технологии меняют окружающий мир, и осмысливает роль человека в его взаимоотношениях с машиной. Мы уверены, что наше взаимодействие с ИИ станет определяющим фактором дальнейшего развития общества!

?? Подписывайтесь и качайте нейроскилы с Биг Дата!

4 months, 3 weeks ago

​​*? MARS 5 TTS: новая модель от компанииCamb AI длягенерации голоса и преобразования текста в речь с открытым исходным кодом*

Модель следует двухэтапному конвейеру AR-NAR с принципиально новым компонентом NAR.

Всего с 5 секундами аудио и фрагментом текста MARS5 может генерировать речь даже для сложных и разнообразных просодических сценариев, таких как спортивные комментарии, аниме и многое другое.

Идентификация говорящего определяется с помощью файла аудиоссылки длительностью от 2 до 12 секунд, при этом длина около 6 секунд дает оптимальные результаты.

▪️Github: https://github.com/Camb-ai/MARS5-TTS
▪️Demo: https://www.camb.ai/
▪️HF: https://huggingface.co/CAMB-AI/MARS5-TTS
▪️Colab: https://colab.research.google.com/github/Camb-ai/mars5-tts/blob/master/mars5_demo.ipynb

@Devsp Подписаться

6 months, 4 weeks ago

​​*? OpenVoice V2 - a Text-to-Speech model that can clone any voice and speak in any language*

OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.

Github: https://github.com/myshell-ai/OpenVoice/tree/main
Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md

@Devsp Подписаться

7 months ago

​​?Efficient Large-Scale Audio Tagging

Трансформеры доминируют в области по работе с адуио и заменили CNN в качестве современной нейросетевой архитектуры.

Трансформеры отлично справляются с огромными аудио датасетами и подходят для создания мощных предварительно обученных моделей.

В данной модели используются динамические CNN, которые достигают лучшей производительности на задачах разметки аудио данных и хорошо масштабируются, достигая производительности трансформеров и даже превосходя их.

?Github: https://github.com/fschmid56/efficientat

?Paper: https://arxiv.org/abs/2310.15648v1

Demo: https://21527a47f03813481c.gradio.live/

@Devsp Подписаться

[​​](https://telegra.ph/file/9f8fc1eb12fd28a3abd79.jpg)***?*****Efficient Large-Scale Audio Tagging**
7 months ago
**Телеграм-канал для ML-специалистов от Яндекса**

Телеграм-канал для ML-специалистов от Яндекса

Yandex for ML — канал для ML-инженеров от Яндекса. Рассказываем, как мы обучаем наши модели и интегрируем их в продукты, как делаем сервисы с архитектурой сразу из нескольких нейросетей, как обучаем модели для специфичных задач и многое другое.

Подписывайтесь ? @Yandex4ML

9 months ago

​​?Magic-Me: Identity-Specific Video Customized Diffusion

Создание контента для конкретной личности (ID) продемонстрировало значительный интерес в области генеративных моделей. В области генерации текста в изображение (T2I) генерация тематического контента достигла большого прогресса благодаря управляемому идентификатору в изображениях. Однако прямое распространение его на генерацию видео недостаточно изучено.

*Github*: https://github.com/Zhen-Dong/Magic-Me

*Colab:* https://colab.research.google.com/drive/1gMialn4nkGeDZ72yx1Wob1E1QBgrqeGa

*Project*: https://magic-me-webpage.github.io

Paper: arxiv.org/abs/2402.09368

@Devsp Подписаться

[​​](https://telegra.ph/file/7713cb01d1eb1043bf1d1.png)***?*****Magic-Me: Identity-Specific Video Customized Diffusion**
We recommend to visit

?Телеграмдаги Энг сўнгги хит тароналар факат бизда

?? - УЗ
?? - РУ
?? - ТР
?? - Ус
?? - АЗ
?? - ТЖ
?? - КЗ
?? - КР

Creator : @kiinyaz

Last updated 1 year ago

Бесплатные игры и программы для Android

❗️Сотрудничество (ads), DMCA, пожелания: t.me/EasyAPKBot

💵Реклама: https://telega.in/c/EasyAPK

🔴 Чат: @ChatEasyAPK

Все публикуется в ознакомительных целях. Вы скачиваете программы на свой страх и риск

Last updated 10 months ago

Главное про технологии, интернет-культуру, тренды и нейросети.

По рекламе: @Alivian

Биржа: https://telega.in/c/technomotel

Last updated 3 days, 23 hours ago