Репост из: Беларусізацыя
Абноўлены Беларускі N-корпус.
Дадалося ~5000 тэкстаў аб'ёмам ~12 млн. словаўжыванняў. Таксама перапрацавана пашпартызацыя большай часткі тэкстаў і выпраўлены асобныя тэхнічныя моманты. У абнаўленне ўвайшлі тэксты класікаў беларускай літаратуры: Брыля, Быкава, Бядулі, Глебкі, Дубоўкі, Дударава, Зарэцкага, Караткевіча, Коласа, Купалы, Маўра, Мележа, Панчанкі, Пушчы, Сіпакова, Чорнага, Чыгрынава, Янішчыц і многіх іншых. Агульны аб'ём Асноўнага корпусу складае ~ 163 млн. словаўжыванняў. Аб'ём усяго корпусу (разам з неразабранымі тэкстамі) - ~337 млн. словаўжыванняў.
https://bnkorpus.info/
Дадалося ~5000 тэкстаў аб'ёмам ~12 млн. словаўжыванняў. Таксама перапрацавана пашпартызацыя большай часткі тэкстаў і выпраўлены асобныя тэхнічныя моманты. У абнаўленне ўвайшлі тэксты класікаў беларускай літаратуры: Брыля, Быкава, Бядулі, Глебкі, Дубоўкі, Дударава, Зарэцкага, Караткевіча, Коласа, Купалы, Маўра, Мележа, Панчанкі, Пушчы, Сіпакова, Чорнага, Чыгрынава, Янішчыц і многіх іншых. Агульны аб'ём Асноўнага корпусу складае ~ 163 млн. словаўжыванняў. Аб'ём усяго корпусу (разам з неразабранымі тэкстамі) - ~337 млн. словаўжыванняў.
https://bnkorpus.info/