Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated hace 1 mes, 3 semanas
Закрываем глаза, делаем несколько глубоких вдохов и… продуктивно работаем между майскими ?
Дается тяжело, не спорим, а потому попросили порцию мотивашек у Jay Copilot.
И почему она не сказала, что еще чуть-чуть и ИИ подарит нам 4х-дневную рабочую неделю? ?
Что посмотреть на длинных выходных? Свежий TED Talk с Мустафой Сулейманом, Microsoft AI CEO ?
20 минут интересных размышлений о роли ИИ в современном мире.
Из запоминающегося — Мустафа сказал, что люди обманывают сами себя, говоря, что ИИ — это математика или код ? «Это все равно, что сказать, жизнь — это просто вода и органические молекулы». Глава Microsoft AI считает, что следующее десятилетие станет самым продуктивным в истории человечества, благодаря ИИ.
? «Мы нашли нефть, но мы загрязнили планету. Сегодня мы все еще разрабатываем ИИ, и у нас есть возможность сделать все правильно, минимизируя все риски и негативные последствия».
На сайте TED есть расшифровка всей беседы, но лучше проникнуться всеми метафорами Мустафы Сулеймана в режиме live!
Ted
What is an AI anyway?
When it comes to artificial intelligence, what are we actually creating? Even those closest to its development are struggling to describe exactly where things are headed, says Microsoft AI CEO Mustafa Suleyman, one of the primary architects of the AI models…
⛔️ «Разработчики LLM сталкиваются с дефицитом текстов на языках народов СНГ для обучения моделей»,– заявил директор по развитию технологий ИИ «Яндекса» Александр Крайнов.
Алексей Борщов, Product owner Just AI, ответил на несколько вопросов в контексте этой проблемы. Делимся главным!
На что влияет дефицит текстов?
? Недостаток данных напрямую влияет на качество и точность ответов языковой модели. Впоследствии это может отразиться в количестве пользователей, которые используют AI-продукты – ведь выбор LLM носителем языка будет напрямую связан с тем, насколько хорошо сеть умеет работать с языком.
Как решать эту проблему дефицита данных?
? Важно сотрудничать с языковыми сообществами, носителями редких языков – в России достаточно много региональных программ по поддержке национальных языков, в которых LLM могут действительно помочь сохранять малые языки и делать их более популярными за счет качественных переводов на них все большего количества материалов.
? Также существует метод «обратного перевода». При этом подходе предложения на одном языке переводятся на другой язык автоматически, даже если модель еще недообучена. Полученные «плохие» переводы используются в качестве обучающих данных для улучшения качества перевода. Затем модель обучается переводить такие слегка искаженные тексты обратно на исходный язык. Эта техника помогает улучшить качество перевода даже на языках с ограниченным количеством данных.
Какие тексты нужны для обучения?
? Для обучения ML-моделей необходимы тексты разных форматов на различных языках, включая новости, статьи, соцсети, разговорную речь, исторические документы и другие типы текстов, чтобы обеспечить модели достаточным разнообразием данных для обучения и развития. Главное, чтобы все эти данные были качественными.
Ведомости
Нейросетям «Яндекса» не хватает текстов на языках народов СНГ
Это ухудшает качество работы ИИ, но русские и английские модели это не затронет
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated hace 1 mes, 3 semanas