Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months, 1 week ago
Особенности фонетики якутского языка для синтеза речи
Недавно мы закончили проект по синтезу якутского языка.
Хотя мы не можем выложить модели в общий доступ, соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.
? Под ~~котом~~ катом вы узнаете:
- Как звучит синтез на якутском языке;
- Чем отличается якутский алфавит от русского и какие "дополнительные" звуки там есть;
- Как работать с ударениями на якутском языке;
- Как якутский синтез речи говорит на русском с якутским акцентом;
Поэма «Облако на кухне» придумана человеком, написана, озвучена и нарисована машиной. Использованы отечественные нейросети.
Раз наш VAD, будучи полезной тулзой (судя даже по цитатам в пейперах), дошёл наконец-то до версии близкой к ультимативной, то мы аж запулили его в PIP:
- https://pypi.org/project/silero-vad/5.1/
Забавно, что имя silero\-vad
там уже было занято, но люди по доброте душевной отдали его нам "обратно".
Как использовать через pip
:
- https://github.com/snakers4/silero-vad?tab=readme-ov-file#fast-start
PyPI
silero-vad
Voice Activity Detector (VAD) by Silero
Всё, Телеграм теперь уподобился «плохим» корпорациям?
https://habr.com/ru/articles/816423/
Хабр
Всё, Телеграм теперь уподобился «плохим» корпорациям?
На какой стул сам сядешь, анон? Вопреки ценностям, которыми бравировал Павел Дуров во время своего интервью Такеру Карлсону, некоторые администраторы крупных телеграм-ботов (~сотни тысяч DAU)...
⬆️ Фармим классы на Хабре https://habr.com/ru/articles/806857/ ⬆️
Хабр
Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках
Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection). Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных...
https://news.mail.ru/incident/59854293
ВФокусе Mail
Дайте слово: кто уговаривает россиян сдать образцы голоса
Преступники научились использовать синтезированную речь. В интернете появились предложения предоставить запись своего голоса якобы для коммерческого использования. Авторы объявлений обещают пристроить речь в рекламные проекты, а взамен сулят...
*⚡️2 вакансии, Junior и Middle, Speech, ML от Силеро*
*? Выжимка*
Основное место работы
Выпускники или студенты последнего курса (для Junior)
ssh, встречаемся 1 раз в неделю оффлайн (Москва)
Не рассматриваем сочетание с лабой / другой работой и т.п.
Финальное собеседование очное с командой в Москве
*? Что реально надо делать*
Разработка на питоне
Работа с данными, сбор и очистка данных
Обучение нейросетей и разработка ML алгоритмов
В первую очередь синтез речи и вспомогательные задачи
Разработка и поддержка продуктовых сервисов (для Middle)
*? Идеальный кандидат*
Python + PyTorch
Есть понятные пет-проекты или опыт (не платные курсы)
Прошарен(а) в экосистеме Linux, работешь в консоли
Прочитал(а) seminal papers (CV, NLP, ASR, TTS)
Имеешь свое аргументированное мнение на эту тему (для Middle)
Оконченное (или последний курс) высшее в тех. и естественно-научных дисциплинах
Участие в запуске продакшен-продукта (для Middle)
Цифровая обработка сигналов это плюс
*? Ссылки*
Подробное описание вакансии - ссылка
Наши публикации на Хабре - ссылка
Полный список публикаций - ссылка
Бот с нашим синтезом в Телеграме - ссылка
❤️? Спасибо Синодову за упоминание!
https://t.me/thinkaboutism/4230
Telegram
Логи внутренних диалогов
Поигрался со сберовским SaluteSpeech синтезом и распознаванием Распознавание, более-менее как у всех (пример не приведу, он для меня: но чуда не случилось, всё ещё надо редактировать и огрехи распознавания, и саму устную речь в принципе), синтез тоже можно…
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months, 1 week ago