Spring navigation over
Forside/Nyt fra Sprognævnet/Oktober 2023/Stavefejl i aviserne i 1999 og 2019

Stavefejl i aviserne i 1999 og 2019

Journalister beskyldes med jævne mellemrum for at lave mange og til tider graverende sproglige fejl. I denne artikel vil vi undersøge om der er kommet flere stavefejl i aviserne. Det gør vi ved at kode, optælle og sammenligne stavefejl i avistekster fra 1999 og 2019, dvs. med 20 års mellemrum. 

”Journalister er alt for dårlige til at skrive og tale korrekt”. Sådan lyder overskriften på et læserbrev i Fyens Stiftstidende fra 2021 (Hansen 2021). I læserbrevet kritiseres journalisterne blandt andet for ikke at kunne bøje selv simple verber i nutid, og det hævdes ”at de sproglige fejl får lov til at blive gentaget så ofte, at mange ikke længere er i stand til at bruge sproget rigtigt” (Hansen 2021).

Skribenten bag læserbrevet står ikke alene med sine holdninger om at journalisternes sprog bør være korrekt. I en større undersøgelse af danske læseres holdninger til journalisters stavefejl mente 98 % af deltagerne at det var vigtigt eller meget vigtigt at journalister staver korrekt (Blom & Ejstrup 2019b: 125 f.). Begrundelserne var blandt andet at sprogfejl påvirker journalisternes troværdighed, at fejlene forstyrrer og gør artiklerne svære at læse, og at de er udtryk for sjusk, inkompetence og lav intelligens. Deltagerne i undersøgelsen mente desuden at journalister bør være sproglige rollemodeller, og at sprogfejl i medierne risikerer at smitte af på befolkningen. Andre undersøgelser har netop vist at læsere opfatter velredigerede og korrekturlæste journalistiske tekster som bedre og mere professionelle (Vultee 2015), og at læsere samtidig reagerer negativt hvis artiklerne indeholder en vis mængde stavefejl (Appelman & Schmierbach 2018). Også på journalistuddannelserne og blandt medieaktører findes der en holdning om at det skader mediernes troværdighed med sproglige fejl (Blom & Ejstrup 2019b: 114 f.).

Rundtomkring finder man desuden en antagelse om at sproget i medierne med tiden er blevet ringere og fejlene flere. For at efterprøve denne antagelse har vi stillet følgende spørgsmål i facebookgruppen Sprogbøffer og sprogjuveler, hvor brugerne diskuterer sproglige spørgsmål: ”Forventer du at der er flere sproglige fejl eller færre sproglige fejl i aviserne i dag end der var for 20 år siden?”. Af de 321 stemmer som vores lille meningsmåling fik, svarede 86 % at de forventede ”Flere fejl i dag”.1

Antagelsen blandt brugerne bakkes op af en tidligere undersøgelse af avisernes sprogfejl (Kristensen et al. 2007). Resultaterne fra undersøgelsen indikerede en generel stigning i antallet af avisernes sprogfejl fra 5,2 fejl per 1.000 ord i 1996 til 6,9 fejl per 1.000 ord i 2007. Medlemsbladet for Dansk Journalistforbund bragte på baggrund af undersøgelsen en artikel med overskriften ”Flere sprogfejl i aviser – Berlingske værst”, men dog med det ekspliciterede forbehold i underrubrikken at undersøgelsen var ”ikke-videnskabelig”. Undersøgelsens egne forfattere påpeger da også selv en række problemer i den anvendte optællingsmetode, bl.a. at optællingen i 1996, der blev foretaget af sprogforskeren Søren Brandt, på en række punkter afveg fra forfatternes egen måde at optælle fejl på i 2007. Man må af samme grund regne undersøgelsens resultater for delvist upålidelige.

Modsat undersøgelsen i Kristensen et al. (2007) fandt Diderichsen & Schack (Nyt fra Sprognævnet 2015/3) i deres arbejde med et stort aviskorpus2 fra perioden 2004-2014 at antallet af stavefejl var ”faldende over tid” (Diderichsen & Schack 2015: 7). Fejloptællingen i denne undersøgelse er baseret på automatiseret søgning efter en særlig type fejlformer, nemlig såkaldte ikke-ord, dvs. former som ikke svarer til en autoriseret stave- eller ordform, og som derfor principielt er en fejl i en hvilken som helst nutidig dansk kontekst, fx “lærene” for lærerne og “hierakisk” for hierarkisk. Undersøgelsen omfatter således ikke former som er forkerte i nogle kontekster, men rigtige i andre, fx lære i konteksten det lære vi aldrig. Der er derfor fortsat en vis usikkerhed om hvorvidt antallet af sprogfejl i aviserne har været faldende gennem årene.

I denne artikel vil vi derfor på en mere systematisk måde undersøge om der er kommet flere stavefejl i aviserne. Det gør vi ved at kode, optælle og sammenligne stavefejl i avistekster fra 1999 og 2019, dvs. med 20 års mellemrum. I og med at undersøgelsen kun indeholder to nedslagspunkter, kan vi ikke sige noget sikkert om den generelle udvikling over tid.

Det skal bemærkes at selvom aviserne primært indeholder tekster af journalister, så bidrager også borgerne til den offentlige debat og meningsdannelse i pressen, blandt andet i kronikker og læserbreve. Anmeldere og andre typer professionelle skribenter skriver også artikler i aviserne. Sprogfejl i aviserne stammer derfor ikke udelukkende fra journalister. Samtidig har avisens artikler typisk været igennem et korrekturfilter, der består af en automatiseret stavekontrol, en redaktionel gennemlæsning og i nogle tilfælde også en professionel korrekturlæsning. Det er derfor ikke til at vide om skribenten bag artiklen, fx en journalist, har lavet en række sprogfejl der er blevet rettet efterfølgende. Antallet af stavefejl i aviserne kan derfor ikke bruges som et mål for journalisternes kompetence til at skrive korrekt. Til gengæld kan det bruges som et mål for hvor mange sprogfejl læserne kan støde på når de læser avisen.

Avisteksterne

Vi påbegyndte vores undersøgelse i 2020, men valgte ikke at bruge tekster fra dette år pga. coronapandemien, der kunne betyde at teksterne fra dette år var anderledes end i andre år. I stedet udarbejdede vi to korpusser, dvs. tekstsamlinger, bestående af nutidige avisartikler fra 2019 og ældre avisartikler fra 1999. Et tidsspand på 20 år gav en passende historisk afstand. Men det betød samtidig at vi var nødt til at fravælge digitale medier, dvs. internettekster, eftersom disse i 1999 ikke var repræsenteret i samme omfang som de er i dag. Vi har derfor valgt udelukkende at fokusere på trykte avistekster i de to nævnte år.

Vores to aviskorpusser består af tekster fra medieovervågnings- og analysevirksomheden Infomedia. Dansk Sprognævn fik gennem Infomedia tilladelse fra mediehusene til at danne et tekstkorpus til forskningsbrug med medietekster fra 1999. Korpusset består af tekster fra de følgende aviser: B.T., Berlingske, Ekstra Bladet, Information, Jyllands-Posten, Politiken og Weekendavisen. En af Sprognævnets it-medarbejdere har lavet et udtræk på ca. 100.000 løbende ord af tilfældigt valgte avistekster fra disse 7 aviser. De to korpusser er sammensat sådan at de mest læste aviser bidrager med flest tekstprøver (jf. Index Danmark/Gallups læsertalsopgørelser). Der er udtaget ca. 250 ord pr. artikel (der er ikke stoppet midt i en sætning) for at sikre repræsentativiteten. Da Sprognævnet allerede gennem Infomedia havde modtaget medietekster til forskningsbrug fra de nævnte aviser for 2019, er den samme proces fulgt for at indsamle det nye korpus. Vi har altså et 1999-aviskorpus og et 2019-aviskorpus, og der er helt præcis 101.047 ord i 1999-tekstsamlingen og 100.704 ord i 2019-tekstsamlingen.

Fejlfinding og -kategorisering

Aviskorpusserne fra 1999 og 2019 er tjekket for stavefejl. Stavefejl bruges her i meget bred forstand. Således inkluderer vi egentlige ortografiske fejl (fx agressiv for aggressiv), morfologiske fejl (bl.a. morfosyntaktiske fejl (herunder adverbielt -t, fx en enorm stor panda for en enormt stor panda)) og syntaktiske fejl (ledstillingsfejl, fx historien de om for historien om de). Dertil kommer en diverse-kategori (herunder manglende ord, fx han kommer til løbe for han kommer til at løbe). Det skal understreges at vi i undersøgelsen ikke har medtaget tegnsætningsfejl, herunder kommafejl.

Tre af artiklens forfattere har foretaget fejlfindingen manuelt ved at notere fejlene under læsningen af avisteksterne. 1999-korpusset er tjekket op imod Retskrivningsordbogen fra 1996, og 2019-korpusset op imod Retskrivningsordbogen fra 2012. Da alle tre fejlfindere havde været korpusserne igennem, blev fejlene og tvivlstilfældene diskuteret. Udover manuel fejlfinding er der foretaget automatisk fejlfinding vha. stave- og grammatikkontrolprogrammet DanProof/RetMig 3 (Bick 2015 og 2006). De automatisk fundne fejl blev oplistet ligesom de manuelt fundne, og forskellene og tvivlstilfælde blev drøftet. Metoden med at drøfte rettelserne kan ses som et værn mod oversete fejl og DanProofs falsk positive markeringer, dvs. automatisk fundne fejl som ikke var fejl. Således var det samlede antal fejl væsentligt højere end i hver af de fire fejllister for sig (de tre manuelle og den ene automatiske). Dette dækker dels over at nogle fejl var blevet overset af én eller flere af fejlfinderne eller af DanProof, dels at det automatiske system fandt nogle fejl som ingen af fejlfinderne havde opdaget.4

Et lille antal ord indeholder mere end én fejl, fx CD spiller, som har forkerte store bogstaver i CD (hvilket var i strid med retskrivningsreglerne i 1999, hvor eksemplet er fra) og desuden mangler en bindestreg. Vi har i disse få tilfælde kun talt én fejl pr. ord og har valgt at kategorisere sådanne fejl efter den hyppigst forekommende fejltype i vores materiale, her fejltypen ”Store og små bogstaver”.

Vi har opdaget visse afvigelser mellem den trykte avistekst og den digitale version i Infomedia. Vi gætter på at denne uoverensstemmelse skyldes at avisteksterne er OCR-scannet eller har været udsat for andre former for digital efterbehandling, men under alle omstændigheder har det resulteret i fejl, som fx systematisk forkert mellemrum i forkortelsen bl. a. (for bl.a.), der ikke er stavefejl i den originale tekst. Vi har derfor kontroltjekket scanningerne af artiklerne i tilfælde hvor fejlen kunne skyldes OCR-scanningen/den digitale efterbehandling. Da der var en vis systematik i denne type af fejl, antager vi at vi har opdaget dem der var, men vi gør opmærksom på at det er en potentiel fejlkilde.

De stavefejl vi har fundet i korpusserne, er blevet kategoriseret ud fra en fejltypologi lavet af Jørgen Schack5 og senere modificeret af Line Burholt Kristensen og Katrine Falcon Søby. Typologien bygger hovedsagelig på Retskrivningsordbogens regler og er dermed funderet på et fast regelsæt uafhængigt af et konkret datasæt (dvs. at det ikke er datasættet der har defineret kategorierne), hvilket gør at kategorierne er anvendelige på mange forskellige typer af data. Dertil kommer at flere stavefejlsundersøgelser er baseret på denne typologi (fx Rathje 2019, Holsting et al. 2021), og man kan derfor sammenligne disse undersøgelsers resultater med hinanden. De stavefejlstypekategorier som findes i typologien, beskrives nærmere nedenfor i afsnittet om stavefejlstyper.

Hvor mange stavefejl er der i aviserne?

Vi har i alt fundet 794 stavefejl i aviskorpusserne. Fejlene fordeler sig på hhv. 556 fejl i 1999-teksterne og 238 fejl i 2019-teksterne. Der er altså betragteligt færre stavefejl i aviserne i 2019 end i aviserne fra 1999 – mindre end halvt så mange – og forskellen er i høj grad statistisk signifikant6. Resultatet er altså stik imod hvad mange ville forvente, men bekræfter fundene i Diderichsen & Schack (2015).

Vores undersøgelse kan ikke uden videre sige noget om årsagerne til at antallet af stavefejl i aviskorpusserne er reduceret. En mulig forklaring kan dog for det første være at journalisterne og avisernes øvrige bidragsydere simpelthen er blevet bedre til at stave. Mod dette taler flere undersøgelser der viser at unge i uddannelsessystemet i dag, herunder også journaliststuderende, klarer sig forholdsvis dårligt når det gælder sproglig korrekthed (jf. Blom et al. 2017, Holsting et al. 2021 og til dels Jervelund & Schack 2016).

For det andet kan et fald i antallet af stavefejl skyldes at der i den undersøgte periode fra 1999-2019 kan være sket en øget brug af stavekontroller, og at stavekontrollerne sandsynligvis er blevet mere træfsikre. Til trods for den formodede øgede brug af stavekontroller i 2019 vs. 1999 ser vi dog stadig i 2019-korpusset fejl som en stavekontrol burde have fanget, fx en stavefejl som diskoterer (for diskuterer) og en slåfejl som Nøajagtig (for Nøjagtig).

En tredje mulig årsag til at vores undersøgelsesresultat viser et faldende antal stavefejl, er at der i perioden 1999 til 2019 er udkommet to retskrivningsordbøger (i 2001 og 2012). 2012-ordbogen indeholder en række retskrivningsændringer som medfører at nogle staveformer der talte som fejl i 1999, ikke talte som fejl i 2019. Dette uddybes i afsnittet ”Stavefejlstyper” nedenfor.

Der er 5,5 fejl pr. 1000 ord i 1999-korpusset mod 2,4 fejl pr. 1000 ord i 2019-korpusset. Sammenligner vi antallet af fejl i avisteksterne med andre genrer såsom tekster fra uddannelsesgenren, er der i en undersøgelse af stavefejl i studentereksamensstile fra 1992 7,5 fejl pr. 1000 ord (Andersen 1992, refereret i Brandt 1996), dvs. flere end i vores undersøgelse af avistekster7. I undersøgelsen af 1.-års dansk- og journaliststuderendes opgaver på universitetet (Blom et al. 2017) er stavefejlsantallet pr. 1000 ord betydeligt højere end i aviserne, nemlig 15,7. Så i uddannelsestekster er der efter alt at dømme flere fejl end i avistekster.

Går vi til de sociale medier, har Rathje (2013: 340) fundet 18,5 stavefejl pr. 1000 ord i en undersøgelse af stavefejl i kommentarfelterne på ekstrabladet.dk (også kendt som Nationen). Også i denne genre er der altså flere fejl end i avisteksterne.

Hverken i 1999-korpusset eller i 2019-korpusset er stavefejlsmængden altså særlig stor når man sammenligner med undersøgelser af andre genrer (se den grafiske oversigt i figur 1).

Figur 1: Antal stavefejl pr. 1000 ord i 1999-korpusset og 2019-korpusset sammenlignet med andre stavefejlsundersøgelser.

Stavefejlstyper

Når vi kigger på de typer af stavefejl der laves i aviskorpusserne i 1999 og 2019, ser fordelingen ud som i tabel 1:

De mest hyppige fejltyper

I tabel 1 kan man se de hyppigste fejltyper i de to aviskorpusser. Af tabellen fremgår det også at der er forskel på fordelingen af fejl i 1999 og 2019. Vi vil i dette afsnit præsentere de 3 hyppigste fejltyper for hvert af de to korpusser og i det næste afsnit fokusere på forskellene mellem 1999 og 2019.

”Et eller flere ord” er den hyppigste fejltype i 1999, og den er på en femteplads i 2019. Kategorien indeholder sær- og sammenskrivningsfejl, fx atom ulykke og indenfor kort tid. Netop særskrivningsfejl er sammen med nutids-r-fejl og fejl i ligge/lægge de fejl der irriterer læsere mest, mens slåfejl irriterer mindst ifølge Blom & Ejstrup (2019a: 29 f.). Det er ingen overraskelse at ”Et eller flere ord” er en af de hyppigste stavefejl, eftersom den nævnes i alle de stavefejlsundersøgelser der er lavet, fx i andre avisundersøgelser (Brandt 1996, Kristensen et al. 2007, Diderichsen, Schack & Christensen 2017) og i stavefejlsundersøgelser af andre genrer, fx sociale medier (Rathje 2013) og universitetsopgaver (Rathje 2019).

Fejltypen ”Ortografiske fejl som ikke er omfattet af retskrivningsreglerne” er den næsthyppigste stavefejlstype i både 1999 og i 2019. Fejltypen dækker over fejl som nok er omfattet af retskrivningsnormen, dvs. det er en fejl fordi et ord er stavet forkert, men fejlen er bare ikke beskrevet i retskrivningsreglernes paragraffer, som typologien som nævnt er baseret på. I denne kategori finder vi fejl i vokaler og konsonanter (fx jægerfly for jagerfly og rybejagt for rypejagt) og stavelsesreduktioner og -udvidelser (fx hovedartie for hovedarterie og åndemagerere for åndemagere). Fejltypen ”Ortografiske fejl som ikke er omfattet af retskrivningsreglerne” nævnes i Rathje (2019) som den hyppigste stavefejl med næsten 40 % af fejlene blandt 1.-års dansk- og journaliststuderende på universitetet, og det er en fejltype man også finder i tidligere undersøgelser af stavefejl hos folkeskole- og gymnasieelever (fx Noesgaard 1945, Undervisningsministeriet 2002 og Prien 1979). Også i tidligere avisundersøgelser nævnes det der i undersøgelserne kaldes ”deciderede stavefejl”, og som må svare til ”ortografiske fejl”, men de viser sig ikke som særligt hyppige (Brandt 1996, Kristensen et al. 2007).

Stavefejlstypen ”Store og små bogstaver” ligger på en tredjeplads både i 1999 og 2019. Kategorien indeholder fejl som manglende stort bogstav efter punktum, forkert stort eller lille bogstav efter kolon, forkert tolkning af om noget er et proprium (Bispebjerg kirkegård for Bispebjerg Kirkegård og Sjællændernes for sjællændernes), forkert lille bogstav i tiltale (i for I) og forkert stort/lille bogstav i forkortelser (TV-program for tv-program8 og t-shirts for T-shirts).

Typen ”Store og små bogstaver” er også en hyppig fejl i den nævnte stavefejlsundersøgelse blandt universitetsstuderende (Rathje 2019), nemlig den næsthyppigste, men den nævnes ikke eksplicit i de tidligere kendte avisundersøgelser. I det hele taget nævnes fejltypen ”Store og små bogstaver” ikke i tidligere stavefejlsundersøgelser efter Noesgaards i 1945, hvor fejl i store og små bogstaver var et stort problem eftersom substantiver dengang skulle skrives med stort begyndelsesbogstav, noget som voldte mange problemer, ikke mindst skoleelever. Rathje (2019: 432) konkluderer da også at stavefejlstypen er ”ny” i den forstand at den ikke er behandlet som en særlig problemtype i tidligere stavefejlsundersøgelser (siden de store bogstaver i substantiver blev afskaffet i 1948). Jervelund & Schack (2016: 38) konstaterer i deres undersøgelse af diktater i folkeskolen ”at der er en del elever der skriver lille begyndelsesbogstav efter punktum og kolon [hvor der følger en helsætning bagefter]”, og der spekuleres i at der kan være tale om ”afsmitning fra skriftsproget i de sociale medier, hvor mange helt bevidst vælger at bruge små begyndelsesbogstaver efter punktum og kolon og i proprier” (ibid.). Af Rathje (2013) fremgår det at netop fejl der gælder store og små bogstaver, er forholdsvis hyppige i en undersøgelse af sprogbrugen på et online debatforum (Ekstra Bladets Nationen).

Den fjerde og sidste stavefejlstype der figurerer på top-3 over de hyppigste stavefejlstyper i vores to aviskorpusser, er fejltypen ”Morfologi”. Det er den hyppigste fejltype overhovedet i 2019, mens den ligger på en fjerdeplads i 1999. I kategorien finder vi de følgende fejl:

  • forveksling mellem præsens og infinitiv (fx at se dem ændrer for at se dem ændre (dvs. den såkaldte nutids-r-fejl) og at kommer til for at komme til)
  • fejl ifm. sammensatte tider (fx fik lynhurtigt rystede for fik lynhurtigt rystet)
  • fejl i bestemthed (fx ordets oprindelig betydning for ordets oprindelige betydning)
  • fejl i numerus (fx walkie-talkies for walkie-talkier og sin forældre for sine forældre)
  • fejl i genus (fx det globale solar plexus for den globale solar plexus og et seksualforbryder for en seksualforbryder)
  • fejl i refleksive pronominer (fx sat hendes og Philips firma over styr for sat sit og Philips firma over styr)
  • manglende kongruens ved adjektiv (fx mens det nye fænomen endnu var hotte for mens det nye fænomen endnu var hot)
  • t-fejl ved adverbier (fx relativ svær for relativt svær og en, der virkeligt har for en, der virkelig har).

Som det fremgår af det ovenstående, er de fleste fejl under kategorien ”Morfologi” egentlig morfosyntaktiske fejl, men af hensyn til sammenligneligheden med tidligere undersøgelser (bl.a. Rathje 2019, Holsting et al. 2021) har vi valgt at bevare betegnelsen ”Morfologi”. I nogle tidligere undersøgelser af stavefejl i aviserne nævnes de ovenstående morfologiske fejl som ”formmæssige fejl”, og disse fremstår ikke som voldsomt hyppige (Brandt 1996, Kristensen et al. 2007). I undersøgelser af uddannelsestekster har særligt forveksling mellem præsens og infinitiv i form af r-fejl i verber derimod fået en del opmærksomhed, og det er en af de hyppigste fejl i bl.a. Jervelund & Schack (2016) og Rathje (2019), og altså en af de fejl der irriterer læserne mest (Blom & Ejstrup 2019a: 29 f.). Men i vores korpusser af avistekster er der kun én enkelt nutids-r-fejl, så disse er altså ikke udbredte i aviserne i hverken 1999 eller 2019.

Ændringer i fejltyper fra 1999 til 2019

Som det allerede ses af tabel 1, er der forskel på hyppigheden af fejltyperne i 1999-korpusset og 2019-korpusset. I tabel 2 er forskellene på de to korpusser oplistet i procentpoint og antal fejl. Tabellen skal læses på den måde at man fx ud for den øverste fejltype, ”Et eller flere ord”, i den anden kolonne kan se at der er sket et fald på 10,3 procentpoint (minus 10,3), og i den tredje kolonne ses at der er sket et fald på 92 fejl (minus 92) i perioden.

Tabel 2: Ændring i procentpoint og antal fejl i de to aviskorpusser fra 1999 til 2019.

Der er tre signifikante ændringer9 fra 1999 til 2019 (markeret med * i tabel 2):

  • Der er signifikant færre fejl af typen ”Et eller flere ord” i 2019 ift. 1999.
  • Der er signifikant flere fejl af typen ”Morfologi” i 2019 ift. 1999.
  • Der er signifikant flere fejl af typen ”Ordvalg” i 2019 ift. 1999.

Resten af forskellene er ikke signifikante og kan derfor skyldes tilfældig variation.

En forklaring på at der er sket et signifikant fald i kategorien ”Et eller flere ord” fra 1999 til 2019, kan være at Sprognævnet i 2012 ændrede retskrivningsreglerne så det fra da af blev valgfrit om en række forbindelser som inden for/indenfor skulle sær- eller sammenskrives. Før 2012 skulle man skrive fx indenfor i ét ord når det var et adverbium, fx Han blev siddende indenfor, mens det skulle skrives i to ord hvis ordene tilsammen blev brugt som en præposition, fx inden for kort tid (Jacobsen & Jørgensen 2020: 157 ff.). Fra 2012 har man valgfrit kunnet skrive ord af typen indenfor/inden for i et eller to ord når de bruges som præposition. En ordforbindelse som indenfor kort tid har vi derfor optalt som fejl i 1999-korpusset, mens den ikke er optalt som en fejl i 2019-korpusset. Denne retskrivningsændring fører til en hel del færre fejl i 2019. Samtidig er særskrivningsfejl af typen atom ulykke også faldet markant i den undersøgte periode. Hvad det sidste skyldes, kan vi ikke sige noget sikkert om, men et bud kunne være at den automatiske stavekontrol i højere grad fanger særskrivningsfejl i dag end tidligere. Diderichsen, Schack & Christensen (2017: 83) konstaterer i øvrigt også at særskrevne sammensætninger generelt har været faldende i et aviskorpus fra 2009-2015.

Det er vanskeligt at komme med et bud på hvad den signifikante stigning fra 1999 til 2019 i fejltypen ”Morfologi” kan skyldes.

Endelig er der fejlen ”Ordvalg”, som der også er kommet signifikant flere af i 2019. Fejltypen dækker over brugen af forkerte ord, fx drengen og 10 og pigen er 12 for drengen er 10 og pigen er 12. Der er altså tale om fejl som kunne være undgået ved grundigere korrekturlæsning. I de senere år har der netop været fyringer af korrekturlæsere på avisredaktionerne, bl.a. hos Berlingske, der i 2021 fyrede deres korrekturlæsere og erstattede dem med retskrivningsprogrammet Tansa (Christensen & Jørgensen 2021).10 En årsag til stigningen i fejltypen ”Ordvalg” kan altså være manglende korrektur og muligvis et højere redigeringstempo.

Konklusion

Med denne undersøgelse af stavefejl i to aviskorpusser fra 1999 og 2019 har vi vist at der på 20 år er færre – ca. halvt så mange – fejl i aviserne. I og med at undersøgelsen kun indeholder to nedslagspunkter, kan vi som nævnt ikke sige noget med sikkerhed om den generelle udvikling over tid. Vi kan kun konkludere at der var signifikant færre stavefejl i 2019 end i 1999. Vi kan dog støtte os til den tidligere nævnte undersøgelse af Diderichsen & Schack (2015) hvad angår fejltypen ”ikke-ord” i aviserne. Her finder de et faldende antal fejl i perioden 2004-2014, men de har også de mellemliggende år med, der netop viser at der er tale om en jævn udvikling, se figur 2:

Figur 2: Fejlprocenter for fejltypen ”ikke-ord” fra 2004-2014 i Diderichsen & Schack (2015).

Desuden konstaterer Diderichsen, Schack & Christensen (2017: 83) som tidligere nævnt at særskrevne sammensætninger generelt har været faldende i et aviskorpus fra 2009-2015. Meget tyder altså på at den konstaterede forskel i antallet af stavefejl i aviser fra henholdsvis 1999 og 2019 afspejler en generel udvikling og ikke blot skyldes tilfældig variation.

Vi har også kunnet vise at antallet af stavefejl i aviserne ikke er særlig højt sammenlignet med stavefejl i andre genrer som opgaver i uddannelsessystemet og på sociale medier.

Årsagerne til at stavefejlene er mere end halveret i aviserne, kan vores undersøgelse ikke oplyse om, men vi har nogle bud på hvad det kan skyldes. Vi kan ikke udelukke at journalisterne og avisens øvrige skribenter i den undersøgte periode er blevet bedre til at stave. Vi finder det dog mere sandsynligt at de automatiske stavekontroller er blevet bedre. Desuden er en medvirkende årsag til det reducerede antal stavefejl at nogle af reglerne i Retskrivningsordbogen er blevet ændret i den undersøgte periode således at det der var stavefejl i 1999, ikke længere var fejl i 2019.

Når vi ser på de hyppigste fejltyper, er fejlkategorien ”Et eller flere ord” og ”Ortografiske fejl” gamle kendinge, mens fejl i ”Store og små bogstaver” er en nyere kategori i stavefejlsundersøgelser, og ”Morfologi” er ikke så omtalt en kategori som de andre fejltyper.

Tre fejlkategorier har ændret sig signifikant i den undersøgte periode: Der er kommet signifikant færre fejl af typen ”Et eller flere ord”, hvilket kan skyldes ændringer i retskrivningsreglerne, mens der er kommet signifikant flere morfologiske fejl og ordvalgsfejl. Det sidste kan skyldes manglende korrekturlæsning.

Der er altså ikke kommet flere fejl i aviserne de sidste 20 år selvom det synes at være en udbredt formodning i offentligheden. Og de fejl der irriterer læserne mest ifølge Blom & Ejstrup (2019a: 29 f.), nemlig fejl i ligge/lægge, nutids-r-fejl og særskrivningsfejl, er i vores korpusser henholdsvis ikkeeksisterende, repræsenteret med én forekomst og signifikant på retur. Aviserne har derfor de senere årtier formået at styrke den sproglige kvalitet når det gælder korrekthed. Det må betragtes som en god nyhed for læserne.

Referencer

Andersen, Torben (1992). Stavefejl. En undersøgelse af stavefejlsmønstre i gymnasiet. Undervisningsministeriet.

Appelman, Alyssa & Mike Schmierbach (2018). Make no mistake? Exploring cognitive and perceptual effects of grammatical errors in news articles. Journalism & Mass Communication Quarterly 95(4). 930-947.

Bick, Eckhard (2006). A constraint grammar based spellchecker for Danish with a special focus on dyslexics. I: Mickael Suominen et al. (red.): A man of measure: Festschrift in honour of Fred Karlsson on his 60th Birthday. Special Supplement to SKY Journal of Linguistics, Vol. 19. 387-396. Turku: The Linguistic Association of Finland

Bick, Eckhard (2015). DanProof: Pedagogical spell and grammar checking for Danish. I: Galia Angelova, Kalina Bontcheva & Ruslan Mitkov: Proceedings of RANLP 2015 (Hissar, Bulgaria, 7-9 Sept. 2015). 55-62.

Blom, Jonas Nygaard & Michael Ejstrup (2019a). BRÆJKING NEWS: En eksperimentel undersøgelse af fejlobservante læseres holdninger til ukorrekte og korrekte stavemåder opfattet som stavefejl i nyhedsrubrikker på nettet. NyS 57. 10-46.

Blom, Jonas Nygaard & Michael Ejstrup (2019b). Læsernes holdninger til journalisters stavefejl i de digitale medier. I: Yonatan Goldshtein, Inger Schonderbeek Hansen & Tina Thode Hougaard (red.). 17. Møde om Udforskningen af Dansk Sprog. Århus: Aarhus Universitet. 113-132.

Blom, Jonas Nygaard, Marianne Rathje, Bjarne le Fevre Jakobsen, Alexandra Holsting, Kenneth Reinecke Hansen, Jesper Tinggaard Svendsen & Anna Vibeke Lindø (2017). Linguistic deviations in the written academic register of Danish university students. Oslo Studies in Language 9 (3). 169-190.

Brandt, Søren (1996). Stavefejl i aviserne. Mål & Mæle 19(4). 16-19.

Christensen, Esben & Anna Sol Jørgensen (2021). Berlingske fyrer alle korrekturlæserne. Journalisten, 24. juni 2021. https://journalisten.dk/berlingske-fyrer-alle-korrekturlaeserne/

Diderichsen, Philip & Jørgen Schack (2015). Jagten på den gode og sikre sprogbruger. Nyt fra Sprognævnet 2015/3. 1-8.

Diderichsen, Philip, Jørgen Schack & Sune Just Christensen (2017). Særskrivningsfejl forudsiger yderligere sproglige problemer i avistekst. I: Inger Schoonderbeek Hansen, Tina Thode Hougaard & Kathrine Thisted Petersen (red.): 16. Møde om Udforskningen af Dansk Sprog. Århus: Aarhus Universitet. 75-90.

Goos, Sebastian (2023). Medarbejdere frygter, at Berlingske vil erstatte journalister med robotter. Journalisten, 13. juni 2023. https://journalisten.dk/berlingske-vil-erstatte-journalister-med-robotter/

Hansen, Niels Jørgen (2021). Journalister er alt for dårlige til at skrive og tale korrekt – se nu at få det lært, Fyens.dk, 9. maj 2021. https://fyens.dk/erhverv/erhvervsklumme-journalister-er-alt-for-daarlige-til-at-skrive-og-tale-korrekt-se-nu-at-faa-det-laert-opfordrer-erhvervsmand (lokaliseret 17. juli 2023).

Holsting, Alexandra, Marianne Rathje, Jesper Tinggaard Svendsen & Anna Vibeke Lindø (2021). Hvad retter de? Nyindskrevne studerendes revision af universitetsopgaver. NyS 59. 157-186.

Jacobsen, Henrik Galberg & Peter Stray Jørgensen (2020). Håndbog i Nudansk, 6. udgave, 4. oplag. Ordbogen A/S.

Jervelund, Anita Ågerup & Jørgen Schack (2016). Den der skriver d i gjort. Staveproblemer i folkeskolens ældste klasser. Frederiksberg: Dansk Sprognævn. Dansk Sprognævns skrifter 48.

Kristensen, Line Burholt, Tina Borgen Ibholt & Anette Pultera Nielsen (2007). Avisernes fejl er en gammel nyhed. Mål & Mæle 30(3). 7–11.

Noesgaard, Aksel (1945). Fejltyper i dansk Retskrivning. København: Fr. Bagges kgl. Hofbogtrykkeri.

Prien, Børge (1979). Retstavning – nogle første analyser af folkeskolens afgangsprøve i 1978 IV. København: Danmarks Pædagogiske Institut.

Rathje, Marianne (2013). ”sku allgvel ha købt penis forlænger creme :- )”. Afvigelser fra retskrivningsnormen i kommentarfeltet på ekstrabladet.dk. I: Inger Schoonderbeek Hansen, Tina Thode Hougaard & Peter Widell (red.): 14. Møde om Udforskningen af Dansk Sprog. Århus: Aarhus Universitet. 333-354.

Rathje, Marianne (2019). Afvigelser fra retskrivningsnormen i universitetsopgaver. I: Yonatan Goldshtein, Inger Schoonderbeek Hansen & Tina Thode Hougaard (red.). 17. Møde om Udforskningen af Dansk Sprog. Århus: Aarhus Universitet. 415-437.

Undervisningsministeriet (2002). Hvordan staver studenterne? – en undersøgelse af stavefejl i studentereksamensstilene 1998. København: Undervisningsministeriets Forlag.

Vultee, Fred (2015). Audience perceptions of editing quality: Assessing traditional news routines in the digital age. Digital Journalism 3. 832–849.

Noter

1 Meningsmålingen var aktiv den 18. og 19. juli 2023. 7 % svarede ”Samme antal i dag”, 3 % svarede ”Jeg ved det ikke” (selvgenereret svar), 3 % svarede ”Alt for mange er ligeglade med det danske sprog” (selvgenereret svar), og 1 % svarede ”Færre fejl i dag”.

2 200 mio. løbende ord fordelt på ca. 370.000 tekster fra 7 landsdækkende aviser.

3 En interaktiv version af programmet er tilgængelig på www.retmig.dk.

4 For konkrete procenttal og en mere detaljeret gennemgang henvises til forfatternes fremtidige publikation.

5 Typologien er nærmere beskrevet i Rathje (2019: 419 ff.).

6 P<0.001. Der er anvendt en Z-test.

7 Opfattelsen af hvad der (ikke) er stavefejl, varierer dog lidt mellem de undersøgelser der er sammenlignet med kvantitativt i dette afsnit, eftersom ingen af de her nævnte øvrige undersøgelser bygger på den schackske typologi.

8 I 1999 skulle forkortelsen tv skrives med små bogstaver; dette blev ændret i Retskrivningsordbogen i 2012 så både tv og TV var korrekte.

9 Alle tre signifikante ændringer er meget signifikante med et niveau på p<0,001.

10 Med AI-teknologien og ChatGPT’s fremkomst er det nok noget man vil se endnu mere til i fremtiden, jf. denne udtalelse fra chefredaktør Tom Jensen om at Berlingske ”når teknologien og kvaliteten er god nok til det, vil … indføre en automatisering af korrekturlæsningen” (Goos 2023).