Last updated 4 days, 4 hours ago
Last updated 1 week, 1 day ago
Сябры! Абнавілася наша праверка арфаграфіі анлайн - https://bnkorpus.info/spell.html, для дадатку LanguageTool (калі ён у вас ужо ўсталяваны, то абнаўленне адбылося аўтаматычна), LibreOffice - https://www.libreoffice.org/download/download/.
Для тых, хто карыстаецца нашай праверкай у Microsoft Office і Windows, зноў раім абнавіць Belarusian Proofing Tools ад МТГ «RэZэрвацыЯ» - https://spell.by-reservation.com/.
Сябры! Пасля перапынку корпус тэкстаў Беларускага N-корпуса аднаўляе сваю працу. Прабачце за нязручнасці. Мы вельмі ўдзячныя за вашыя хваляванні і словы падтрымкі, якія атрымалі.
Спадарства! У нас добрая навіна! Мы даўно шукалі магчымасць зрабіць больш-менш прыстойны сінтэз беларускага маўлення, даступны для ўсіх.
І вось маем першыя вынікі, якімі вы можаце скарыстацца на інтэрнэт-рэсурсе Беларускага N-корпуса. Дзякуй усім, хто даваў грунтоўныя парады, і асабліва спадару Мікіту.
Наш сінтэзатар зроблены па слядах ягонага https://huggingface.co/spaces/jhlfrfufyfn/bel-tts, і выкарыстоўвае тыя самыя запісы для навучання (сабраныя праектам donar.by), таму гучыць падобна.
Цяпер мы маем досвед у навучанні сінтэзу маўлення і гатовыя працягваць працу далей. Для гэтага нам трэба давесці да ладу фанетычны канвертар, запісаць у добрай якасці дыктараў з добрымі галасамі і правільнай фанетыкай, падрыхтаваць гэтыя запісы для навучання сінтэзатару маўлення. Сінтэзатар будзе распаўсюджвацца вольна. Далучайцеся, хто гатовы да супрацоўніцтва.
∽∴∼ Спасылка ∽∴∼
∽∴∼ Дэманстрацыя ∽∴∼
Змены ў праекце:
*- абноўлены інтэрфейс пошуку (цяпер можна шукаць з варыянтамі напісання, знакамі прыпынку, пры дапамозе рэгулярных выразаў);
- дададзены тэксты 1920-1930х гадоў (~1,5 млн. слоў);
- дададзены дыялектныя тэксты (~500 тыс. слоў);
- часова прыбраны неразабраныя тэксты*.
Прэзентацыя “Беларускі N-корпус 2023: новае ў праекце і планы на будучыню”
∽∴∼ Спасылка ∽∴∼
YouTube
Беларускі N-корпус 2023: новае ў праекце і планы на будучыню
22 лютага а 19.00
сардэчна запрашаем на прэзентацыю “Беларускі N-корпус 2023: новае ў праекце і планы на будучыню”, якая адбудзецца ў Zoom.
Ідэнтыфікатар канферэнцыі: 889 1617 6627.
Код доступу: 396039.
Беларускі N-корпус – першы публічны збор тэкстаў беларускай мовы з пашыранай магчымасцю пошуку. Праект складаецца з некалькіх частак: уласна корпуса тэкстаў (XVI–XXI стст.), корпуса перакладаў Бібліі на беларускую мову, граматычнай базы беларускай мовы (265 тыс. слоў), беларускай праверкі арфаграфіі і інш. Корпус мае шэраг падкорпусаў: выданні Францыска Скарыны, тэксты ХІХ ст., тэксты 1945–2023 гг. і інш. Аб’ём корпуса – ~1,07 млрд слоў. Граматычная база змяшчае каля 265 тыс. cлоў і ~ 4.5 млн словаформаў. Калі выдаць яе на паперы, то атрымаецца 50–60 тамоў (37 тыс. старонак) такога фармату, як “Тлумачальны слоўнік беларускай мовы” (у 5 тамах). Для ўсіх, хто карыстаецца беларускай мовай, будзе карысны і анлайнавы Сэрвіс праверкі арфаграфіі, які дапаможа пазбавіцца ад памылак у тэксце, напісаным па-беларуску афіцыйным правапісам. Таксама на старонцы сэрвісу вы можаце спампаваць праграму праверкі арфаграфіі для розных браўзераў аперацыйнай сістэмы Windows (уключна з Skype, Microsoft office і г.д.), тэкставага рэдактара LibreOffice/OpenOffice, паштовага кліента Mozilla Firefox/Thunderbird і інш.
∽∴∼ Спасылка ∽∴∼
Усіх нашых карыстальнікаў віншуем з Калядамі і Новым годам!
Дадалі руска-беларускі паралельны корпус. Пакуль ён змяшчае толькі пераклады кодэксаў Рэспублікі Беларусь, але будзе пашырацца.
Паралельны корпус - надзвычай зручны інструмент не толькі для перакладчыкаў, але і для ўсіх прыхільнікаў беларускай мовы. Вельмі часта паралельны корпус можа даць больш цікавую альтэрнатыву для перакладу, чым перакладныя слоўнікі. Вельмі раім карыстацца нашым рэсурсам і яшчэ паралельным руска-беларуска-рускім корпусам на сайце Нацыянальнага корпуса рускай мовы.
Last updated 4 days, 4 hours ago
Last updated 1 week, 1 day ago