Jerteh-355 / README.md
procesaur's picture
Update README.md
e8b2940 verified
|
raw
history blame
No virus
602 Bytes
metadata
license: cc-by-sa-4.0
datasets:
  - srwac
  - jerteh/SrpWiki
  - jerteh/SrpELTeC
  - jerteh/cc100-sr-jerteh
language:
  - sr
tags:
  - srpski
  - Serbian
  - RoBERTa
  - BERT
  - MaskedLM

Najveći enkoderski model za srpski jezik.

Pored navedenih, model je obučavan i na ostalim korpusima Društva za jezičke resurse i tehnologije, uključujući korpuse savremenog srpskog jezika: SrpKor2013 i SrpKor2021, kao i korpus PDRS 1.0 razvijen od strane Instituta za Srpski jezik SANU.

Autor: Mihailo Škorić (procesaur)