Spring navigation over
Forside/Nyheder og arrangementer/Det Centrale Ordregister – vitaminer til dansk sprogteknologi
7.6.2022

Det Centrale Ordregister – vitaminer til dansk sprogteknologi

Foreløbig lancering af det Centrale Ordregister

Mandag d. 30. maj 2022 afholdt Dansk Sprognævn i samarbejde med Det Danske Sprog- og Litteraturselskab, Center for Sprogteknologi og Digitaliseringsstyrelsen foreløbig lancering af en ny sprogteknologisk resurse: det Centrale Ordregister.

Det Centrale Ordregister (COR) er en (maskinlæsbar) ordbog der dækker hele det centrale danske ordforråd. COR indeholder de ca. 65.000 lemmaer (opslagsord) som har en officiel staveform. Hver ordform har et unikt ID (kaldet et COR-indeks), som vil blive fastholdt i fremtiden. Hvis den officielle stavenorm ændres, bliver ændringerne gjort centralt tilgængelige således at sprogteknologiske produkter automatisk kan holdes ajour (fx stavetjekkere, automatisk tekstgenerering, undervisningsmaterialer, talegenkendelse og talesyntese). COR-indekseringen vil også gøre det langt nemmere at lave søgninger på tværs af samfundets store sprogresurser (fx tekstsamlinger, fag- og emneordbøger, talekorpora, termbaser).

Ved lanceringen præsenterede vi for første gang det Centrale Ordregister for interesserede parter, og der blev udvekslet forslag til hvordan registret kan bruges som en nyttig resurse indenfor blandt andet sprogteknologi. COR vil i løbet af sommeren blive afprøvet ved en række brugertests før den endelige lancering for offentligheden til efteråret.