--- license: cc-by-sa-4.0 datasets: - srwac - jerteh/SrpWiki - jerteh/SrpELTeC - jerteh/cc100-sr-jerteh language: - sr tags: - srpski - Serbian - RoBERTa - BERT - MaskedLM --- Najveći enkoderski model za srpski jezik. Pored navedenih, model je obučavan i na ostalim korpusima Društva za jezičke resurse i tehnologije, uključujući korpuse savremenog srpskog jezika: SrpKor2013 i SrpKor2021, kao i korpus [PDRS 1.0](https://www.clarin.si/repository/xmlui/handle/11356/1752) razvijen od strane Instituta za Srpski jezik SANU. Autor: Mihailo Škorić ([procesaur](https://huggingface.co./procesaur))