Spring navigation over
Forside/Store tekstsamlinger/Underkorpusser med sociale medier og fagsprog

Underkorpusser med sociale medier, fagsprog og reality-tv

Sprognævnet har mulighed for at søge i statusopdateringer fra Twitter, i udvalgte fagblade og i et korpus af nedskrevet dialog fra reality-tv-serien Ex on the beach.
undraw_Social_media_re_w12q(1)

Tekster fra sociale medier

Et af vores underkorpusser består af tweets, dvs. statusopdateringer fra Twitter. Denne tekstgruppe består af knap 40 millioner ord. Der er tale om tweets fra en uge i september hvert år fra 2008 til 2016.

Desuden har vi en lille samling blogtekster på knap 2 millioner ord.

Fagsproglige artikler

Vi har også et lille udvalg af fagblade repræsenteret i vores korpus, herunder Erhvervsbladet, Ingeniøren og Ugeskrift for Læger.

Denne tekstgruppe bestod i starten af 2018 af ca. 26 millioner ord og indeholder tekster tilbage til 2004, dog hovedsageligt fra slutningen af 2009 og frem.

Transskriberet dialog fra Ex on the beach

Vores nyeste underkorpus består af dialog fra reality-tv-serien Ex on the Beach som er blevet transskriberet. Der er tale om de tre første sæsoner af serien. I hver sæson er der 24 afsnit af ca. 45 minutter varighed, dvs. ca. 54 times tv. De tre sæsoner er blevet sendt på Discovery+/Dplay i 2018-2019 og generøst stillet til rådighed som lyd- og videofiler af produktionsselskabet Metronome, så vi har adgang til lyd- og billedsiden. Desuden har vores studentermedhjælpere transskriberet alle tre sæsoner af Ex on the beach, hvilket er blevet til et skriftligt korpus på ca. 530.000 ord.