ordforråd - skemman
TRANSCRIPT
1
Háskóli Íslands
Hugvísindasvið
Danska
Ordforråd
En undersøgelse af islanske gymnasieelevers ordforråd på
dansk
Ritgerð til M.A.-prófs í dönsku
Trine Holm Houmøller
Kt.: 030877-2259
Leiðbeinandi: Þórhildur Oddsdóttir
Janúar 2020
2
Indholdsfortegnelse Abstract ............................................................................................................................. 5
Útdráttur ........................................................................................................................... 6
Indledning ......................................................................................................................... 7
Problemformulering ..................................................................................................... 8
Motivation .................................................................................................................... 8
Danskfaget i det islandske skolesystem .................................................................. 10
Islandske studerende i Norden ............................................................................... 12
Teori ................................................................................................................................ 13
Begrebsafklaring ......................................................................................................... 13
Ord .............................................................................................................................. 15
Lemma versus ordfamilier ...................................................................................... 15
At kende et ord ....................................................................................................... 17
Tilegnelse af nye ord ............................................................................................... 18
Hvor mange ord man skal kunne ............................................................................ 19
Ordlister ...................................................................................................................... 20
Frekvenslister .......................................................................................................... 20
Akademiske ordlister .............................................................................................. 21
Dækningsgrad ......................................................................................................... 22
Testtyper ..................................................................................................................... 26
Vocabulary Levels Test ............................................................................................ 28
Vocabulary Size Test ................................................................................................ 30
Vocabulary Knowledge Scale .................................................................................. 32
Empiri .............................................................................................................................. 37
Udvikling af ordforrådstesten ..................................................................................... 37
Valg af testmetode .................................................................................................. 38
Grundlag for valg af testord .................................................................................... 39
Analyse af ordforrådet i Ekko og Glimt ................................................................... 41
Analyse af ordklasser .............................................................................................. 45
Udvælgelsen af 50 testord ...................................................................................... 46
Afkortning til 30 testord ......................................................................................... 48
Testens praktiske udformning ................................................................................. 50
Resultater .................................................................................................................... 52
Receptivt kendskab til de 30 testord ...................................................................... 54
De enkelte testdeltageres score ............................................................................. 58
Relative score på 1000 ordniveauerne ................................................................... 61
3
Scoring i 1000 ordniveauerne ................................................................................. 63
Produktivt ordforråd ............................................................................................... 65
Opsummering af testresultater .................................................................................. 72
Diskussion ....................................................................................................................... 76
Perspektivering ............................................................................................................... 78
Konklusion ...................................................................................................................... 80
Litteraturliste .................................................................................................................. 81
Bilag ................................................................................................................................ 83
4
Oversigt over tabeller Tabel 1 Dækningsgrad 95/98 pct. af forskellige tekstmaterialer .................................... 22
Tabel 2 Dækningsgrad for hvert 1000 ordniveau ........................................................... 24
Tabel 3 Dækningsgraden for høj-, mellem- og lavfrekvens ordforråd ............................ 26
Tabel 4 Pointskala til VKS ................................................................................................ 33
Tabel 5 Resultater af tekstanalyse af Ekko og Glimt ....................................................... 43
Tabel 6 Ordniveau 1000 til 5000 analyseret efter ordklasser ......................................... 45
Tabel 7 De 30 testord fordelt på ordklasser og 1000 ordniveauer ................................. 49
Tabel 8 De 30 testord ...................................................................................................... 50
Tabel 9 De 50 testord ...................................................................................................... 84
Tabel 10 Testdeltagernes receptive kendskab til de enkelte testord .............................. 85
Tabel 11 Testdeltagernes samlede score i testen ........................................................... 86
Tabel 12 Testdeltagernes samlede score i testen opdelt efter køn ................................ 87
Tabel 13 Testdeltagernes relative score på 1000 til 5000 ordniveauerne ...................... 88
Tabel 14 Testdeltagernes kendskab til 1000 ordniveauerne .......................................... 88
Tabel 15 Testdeltagernes dybdekendskab til testordet; sammen .................................. 88
Tabel 16 Testdeltagernes dybdekendskab til testordet; snakke ..................................... 88
Tabel 17 Testdeltagernes dybdekendskab til testordet; hyggelig ................................... 88
Tabel 18 Testdeltagernes dybdekendskab til testordet; søskende ................................. 88
Tabel 19 Testdeltagernes dybdekendskab til testordet; lektie ....................................... 89
5
Abstract
Dette speciale omhandler en undersøgelse af, hvor stort et ordforråd eleverne har på
dansk, når de er i gang med den obligatoriske danskundervisning i den islandske
gymnasieskole.
Formålet med undersøgelsen er at give undervisere i gymnasiet indsigt i hvor stort
elevernes ordforråd er, for at underviseren på den baggrund kan tage stilling til hvilken
type ordforråd det er mest relevant at beskæftige sig med i undervisningen. Viden om
størrelsen af elevernes ordforråd kan også give underviseren et indblik i, hvilke
teksttyper eleverne har forudsætninger for at læse på baggrund af størrelsen af deres
ordforråd.
Til undersøgelsen af størrelsen af elevernes ordforråd blev der udarbejdet en test med
30 testord, der byggede på Vocabulary Knowledge Scale (VKS). Kriterierne for
udvælgelsen af testordene var, at der var seks ord fra hver af de første fem 1000
ordniveauer og samtidig skulle ordene være repræsenteret mindst fem gange på en
ordfrekvensliste udarbejdet på baggrund af analyse af undervisningsmateriale fra både
grundskolen og gymnasiet.
Testen blev forelagt fem forskellige danskhold på tre forskellige gymnasier. Testen viste
bl.a. at eleverne i gennemsnit havde receptivt kendskab til 19 af de 30 testord. Testen
viste ligeledes, at ca. 40 pct. af eleverne ikke har tilstrækkeligt kendskab til de 1000
hyppigst forekomne ord på dansk. At 20 pct. af eleverne udelukkende havde kendskab
til de 1000 hyppigst forekomne ord på dansk. At 14 pct. af eleverne har kendskab til
første, andet og tredje 1000 ordniveau og 7 pct. af eleverne har kendskab til både
første, andet, tredje, fjerde og femte 1000 ordniveau. Resultatet af undersøgelsen
indikerer, at en stor del af elevgruppen har et meget begrænset ordforråd på dansk.
6
Útdráttur
Þessi meistararitgerð fjallar um rannsókn á orðaforða nemenda sem eru í skyldunámi í
dönsku á framhaldsskólastigi á Íslandi.
Tilgangur rannsóknarinnar er að veita kennurum í framhaldsskólum innsýn í hversu
mikinn orðaforða nemendur hafa til þess að kennari geti metið hverskonar orðaforða er
gagnlegast að vinna með í kennslunni. Þekking á orðaforða nemenda getur einnig gefið
kennara innsýn í hverskonar lesefni nemendur hafa forsendur til að lesa með tilliti til
umfangs orðaforða þeirra.
Til að rannsaka umfang orðaforða nemanda var útbúin könnun með 30 orðum sem
byggja á Vocabulary Knowledge Scale (VKS). Val á þeim orðum sem notuð voru í
könnunni byggja á þeim viðmiðum að þar skyldu vera sex orð úr hverjum af fimm
algengustu tíðniflokkunum og samtímis þurftu orðin að koma fyrir að minnsti kosti
fimm sinnum á orðtíðnilista sem var unnin út frá námsefni nemenda bæði á
grunnskóla- og framhaldsskólastigi.
Könnunin var lögð fyrir fimm mismunandi hópa nemenda í dönskunámi í þremur
framhaldsskólum. Niðurstöður könnunarinnar leiddu í ljós að nemendur þekktu að
meðaltali 19 af þeim 30 orðum sem voru könnuð. Auk þess kom fram í niðurstöðunum
að u.þ.b. 40 prósent nemenda höfðu ekki nægjanlega þekkingu á 1000 algengustu
orðunum í dönsku. Að 20 prósent nemenda hafði eingöngu þekkingu á 1000
algengustu orðum í dönsku. Að 14 prósent nemenda höfðu þekkingu á fyrsta, öðrum og
þriðja 1000 tíðniflokkunum og 7 prósent nemenda höfðu þekkingu á fyrsta, öðru,
þriðja, fjórða og fimmta tíðniflokkunum. Niðurstaða rannsóknarinnar gefur til kynna að
stór hluti nemendahópsins hafi mjög takmarkaðan orðaforða í dönsku.
7
Indledning
Ideen til denne opgave udsprang af et foredrag, jeg var til i foråret 2018. Foredraget var
arrangeret af STÍL, foreningen for sprogundervisere i Island [Samtök Tungumálakennara
á Íslandi] og var egentligt primært målrettet mod undervisere i engelsk. Foredraget
blev afholdt af engelsklærerne på et gymnasium, der hedder Menntaskólinn við
Hamrahlíð, og omhandlede undervisning i akademisk ordforråd på engelsk, og hvordan
dette helt konkret gribes an på Menntaskólinn við Hamrahlíð. Foredraget åbnede mine
øjne for den omfattende forskning og viden der er om det engelske sprog og dets
ordforråd i relation til undervisning. Det var et felt, som jeg ikke tidligere havde haft
kendskab til. Jeg gik derfra med et indblik i en for mig hidtil ukendt verden, som jeg var
ivrigt efter at lære mere om, men jeg var tvivlende overfor, om den viden der findes om
det engelske sprog i samme grad findes om det danske sprog. I Island kan det ikke
undgås, at både elever og lærere til en vis grad sammenligner de to fremmedsprog
dansk og engelsk, som har samme målsætning ved grundskolens afslutning. Min tanke
var, at hvis undervisning i akademisk engelsk er en del af engelskundervisningen i den
islandske gymnasieskole, ville det være interessant at undersøge hvor danskfaget står i
den sammenhæng.
Samme forår havde jeg hørt om en omfattende undersøgelse, der hedder Language
development across the life span: the impact of English on education and work in
Iceland. Undersøgelsen omhandler det engelske sprogs rolle i det islandske samfund,
og den viste bl.a. at der er en generel tendens i Island til, at folk overvurderer egne
engelskkundskaber. Det lå fint i tråd med en tendens, som min kollega fra grundskolen
havde fortalt mig om. Hun fik som engelsklærer jævnligt klager fra både elever og
deres forældre, der mente, at deres børn skulle have højere karakterer i engelsk end
hvad deres opgaver og prøveresultater indikerede. I min tid som dansklærer i
grundskolen oplevede jeg det omvendte problem. Jeg mødte ofte elever, som gav
udtryk for, at de ikke mente de kunne ret meget i dansk, selvom de i virkeligheden efter
min opfattelse kunne temmelig meget. Dette gav mig blod på tanden i forhold til at
undersøge, hvor stor forskellen er på elevernes ordforråd på henholdsvis engelsk og
dansk ved grundskolens afslutning.
8
Foråret 2019 tog jeg som resultat af min nyvundne interesse for
ordforrådsundervisning, som en del af min MA i dansk ved Islands Universitet, et
kursus i ordforrådstilegnelse. Jeg lærte på kurset om forskning i ordforråd og i
særdeleshed om forskning i ordforråd i undervisningsmæssige sammenhænge. Kurset
lå i forlængelse af det, jeg havde stiftet bekendtskab med på foredraget på
Menntaskólinn við Hamrahlíð, og jeg blev bekræftet i, at ordforråd er et både stort og
relevant emne i sprogundervisningen.
I forbindelse med kurset i ordforrådstilegnelse lavede jeg en pilotundersøgelse af 10.
klasses elever i den islandske grundskoles kendskab til de 2000 hyppigst forekomne ord
på henholdsvis engelsk og dansk. Pilotundersøgelsen lærte mig bl.a., at det er
problematisk at sammenligne størrelse af ordforråd på engelsk og dansk, fordi
hovedparten af forskningen i ordforråd på engelsk er baseret på, at ordene er opdelt i
ordfamilier, hvorimod vi på dansk og i en nordisk kontekst fortrinsvis opererer med ord
opdelt i lemmaer. Et andet problem, som jeg stødte på undervejs, var at der ikke findes
danske udgaver af de mest brugte engelske ordforrådstests VST og VLT. Eller det vil sige,
måske findes der danske udgaver af de to testtyper, men ikke versificerede udgaver,
som jeg havde mulighed for at komme i besiddelse af.
Som resultat af de erfaringer jeg gjorde mig i pilotundersøgelsen, besluttede jeg, at
specialet ikke skulle indeholde en sammenligning af ordforråd på henholdsvis engelsk
og dansk, men derimod udelukkende fokusere på størrelsen af elevernes ordforråd på
dansk, når de påbegynder den obligatoriske danskundervisning i gymnasiet. Det ledte
mig frem til problemformuleringen for dette speciale.
Problemformulering
Jeg vil undersøge, hvor stort et ordforråd har eleverne på dansk, når de er i gang med
den obligatoriske danskundervisning i gymnasiet.
Motivation
Min motivation for at undersøge hvor stort et ordforråd eleverne har, når de
9
påbegynder den obligatoriske danskundervisning i gymnasiet udsprang, som tidligere
nævnt, af indsigten i den omfattende viden der findes om ordforråd og
ordforrådsundervisning i relation til det engelske sprog. Jeg vil gerne vide, hvor
danskfaget står sammenlignet med engelskfaget. Dvs. har eleverne et tilstrækkelig stort
ordforråd på dansk, når de starter på den obligatoriske danskundervisning i gymnasiet,
til at det giver mening at arbejde med fx akademisk ordforråd i danskfaget. Og hvis
ikke, hvilket ordforråd er det så mest gavnligt, at man som danskunderviser i den
islandske gymnasieskole fokuserer på i undervisningen.
Et andet argument for at undersøge elevernes ordforråd kan være, at man kan
afdække, om eleverne evt. har nogle mangler eller huller i det ordforråd, man som
underviser forventer de har, som spænder ben for, at de kan klare de opgaver man
stiller dem overfor. Flere forskere bl.a. Henriksen (2009) har peget på, at
ordforrådstilegnelse i sprogundervisningen generelt får for lidt og i nogle tilfælde
måske forkert behandling i sprogundervisningen;
Men fare for at generalisere alt for bredt vil jeg våge den påstand, at der foregår for lidt planlagt og
systematisk undervisning i ordforråd. Grundlæggende tror vi som sproglærere på, at når eleverne
først er nået ud over begynderniveauet, udvikler de primært deres ordforråd ved at læse meget. Og
det er uden tvivl rigtigt. Men at læse er næppe nok (Henriksen, 2009, p. 72).
Der er flere gode grunde til at undersøge og interessere sig for elevernes ordforråd. Et
argument kan være at undersøge, om elevernes ordforråd har en størrelse, der gør
dem i stand til at løse de opgaver man som underviser stiller dem overfor. Dvs. har
eleverne en reel chance for at forstå og få udbytte af de materialer fx en film eller en
tekstsamling, man som underviser vælger at bruge i sin undervisning. Det er
frustrerende for eleverne, og i sidste ende også for underviseren, hvis eleverne ikke har
tilstrækkeligt ordforråd til at kunne få tilstrækkeligt udbytte af undervisningsmaterialet.
Man kan som underviser selvfølgelig løse en del af problemet med utilstrækkeligt
ordforråd hos eleverne ved stilladsering. Stilladsering kan afløse problemet med
utilstrækkeligt ordforråd, fx hvis det drejer sig om en film, som man ser sammen i
klassen, men det nytter ikke at sende eleverne hjem og læse en tekst selvstændigt, som
de ikke har forudsætninger for at læse hvad angår ordforrådet, fordi eleverne for det
10
første vil blive frustrerede, men heller ikke vil få noget nævneværdig udbytte af at læse
teksten, hvad angår tilegnelse af ordforråd.
Uanset hvordan vi vender og drejer det, spiller ordforråd en vigtig rolle i
sprogundervisning, da ordforrådet er fundament for alt, hvad vi gør med sproget. Med
intet eller meget begrænset ordforråd er det svært at forstå noget og endnu sværere at
udtrykke sig. Som Wilkins så klogt sagde: ”Uden grammatik kan vi kun udtrykke meget
lidt, men uden ordforråd kan vi intet udtrykke” (Wilkins, 1972, p. 111).1
Danskfaget i det islandske skolesystem
Der undervises i dansk som et obligatorisk fremmedsprog både i grundskolen og på
ungdomsuddannelserne i Island. Frem til 1999 var dansk det første fremmedsprog i
grundskolen. Der blev undervist i dansk i fem år i grundskolen, fra eleverne gik i 6. til
10. klasse, hvilket svarer til 5. til 9. klasse i Danmark. I 1999 trådte en ny
bekendtgørelse i kraft, hvilket gjorde, at engelsk blev det første fremmedsprog
eleverne blev undervist i i grundskolen (Auður Hauksdóttir, 2012).
På nuværende tidspunkt er det således, at engelsk fortsat er det første fremmedsprog
eleverne undervises i. Fremmedsprogene engelsk og dansk har en samlet mængde
undervisningstimer i grundskolen, og det er op til den enkelte skole at beslutte,
hvordan man fordeler timerne mellem de to fag. Det er ligeledes op til den enkelte
skole at beslutte på hvilket klassetrin eleverne påbegynder undervisningen i
henholdsvis engelsk og dansk, dog skal engelskundervisningen påbegyndes senest i 5.
klasse og danskundervisningen påbegyndes senest i 7. klasse. Ved afslutningen af
grundskolen stilles der samme krav til elevernes kundskaber i de to fag engelsk og
dansk (Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013).
I det følgende vil jeg opridse nogle få punkter fra den nationale læreplan for
grundskolen [Aðalnámskrá grunnskóla], som jeg mener er relevante, for at kaste lys
over, hvilke forventninger der stilles til elevernes danskkundskaber, når de forlader
grundskolen. Her er det værd at bemærke, at de nedenstående punkter ikke bare
1 „The fact is that while without grammar very little can be conveyed, without vocabulary nothing can be conveyed” (Wilkins, 1972). (Wilkins, 1972, p. 111)
11
præciserer, hvilke danskkundskaber det forventes eleverne har, når de forlader
grundskolen, men samtidig også afdækker de danskkundskaber, man må forvente, at
eleverne har med sig, når de påbegynder en ungdomsuddannelse, som fx gymnasiet,
som denne opgave primært beskæftiger sig med.
Ved afslutningen af grundskolen forventes det bl.a., at eleven [min oversættelse, se
original tekst på islandsk i fodnoten]
• med henblik på at erhverve sig viden kan læse autentiske tekster fx fra aviser, magasiner og
internetressourcer, der omhandler emner der er relevante i forhold til elevens eget liv eller
egne forhold eller miljø, reagere på stoffet, genfortælle stoffet eller på anden måde bearbejde
det (Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013, p. 126).2
• uden problemer kan følge med i tilgængeligt stof fra medierne af lyst, og at de kan genfortælle
stoffet og forarbejde det (Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013,
p. 125).3
Hvad angår hvilke krav der stilles til elevernes danskkundskaber ved afslutningen af den
obligatoriske danskundervisning i gymnasiet forventes det bl.a., at eleven [min
oversættelse, se original tekst på islandsk i fodnoten]
• skal have tilegnet sig et ordforråd, der gør ham i stand til på tilstrækkelig vis at kunne tilegne sig
læsestof i forbindelse med videregående uddannelse eller i jobsammenhænge.4
• Kan anvende det skriftlige sprog til forskellige formål, videnskabelige og personlige, og med
stiltræk og sprogbrug som passer ind i sammenhæng (…) (Aðalnámskrá Framhaldsskóla 2011 -
almennur hluti, 2012, p. 102)5
Begge de to ovennævnte punkter peger i retning af, at eleverne ved afslutningen af den
obligatoriske danskundervisning i gymnasiet skal have danskkundskaber på et niveau,
der vil gøre dem i stand til at kunne tage en videregående uddannelse på dansk.
2 - lesið sér til fróðleiks rauntexta, t.d. úr dagblöðum, tímaritum og netmiðlum sem fjalla um efni er varðar líf hans, aðstæður eða umhverfi, brugðist við efni þeirra, sagt frá eða unnið úr á annan hátt, (Aðalnámskrá grunnskóla, 2013, s. 126) 3 : - án vandkvæða fylgst með aðgengilegu efni í fjöl- og myndmiðlum sér til gagns og ánægju, sagt frá og unnið úr, (Aðalnámskrá grunnskóla, 2013, s. 125) 4 - orðaforða sem gerir honum kleift að tileinka sér með góðu móti lesefni í áframhaldandi námi eða starfi (Aðalnámskrá Framhaldsskóla 2011 - almennur hluti, 2012, p. 102) 5 - að beita ritmálinu í mismunandi tilgangi, fræðilegum og persónulegum, með stílbrigðum og málsniði sem við á (...) (Aðalnámskrá Framhaldsskóla 2011 - almennur hluti, 2012, p. 102)
12
Islandske studerende i Norden
I Island er der en stærk tradition for at rejse til udlandet for at studere. I den
sammenhæng spiller de nordiske lande og i særdeleshed Danmark en stor rolle. I Island
har man ikke som i Danmark mulighed for at få SU (Statens Uddannelsesstøtte), men
man har til gengæld mulighed for, som studerende på en anerkendt uddannelse, at
optage et studielån. I studieåret 2009-2010 var der ifølge Auður Hauksdóttir (2012)
2414 islandske studerende, der modtog lån til at studere udenlands. Af dem var der
1290, dvs. 53 pct. der modtog lån til at studere i et andet nordisk land. Og af den
samlede gruppe islandske studerende der modtog lån til at studere i udlandet, var der
1069, der modtog lån til at studere i Danmark. Dvs. at af den samlede gruppe af
islandske studerende, der valgte at studere i udlandet i studieåret 2009-2010 rejste 44
pct. til Danmark for at studere. Og af den gruppe af studerende der valgte at studere i
et andet nordisk land valgte 83 pct. at rejse til Danmark for at studere. Ovennævnte tal
er fra studieåret 2009-2010 og medtaget her for at vise hvor almindeligt det er, at
islændinge tager til Danmark eller et andet nordisk land for at studere. Det er
efterfølgende blevet muligt for islandske studerende i Danmark at få SU under
forudsætning af, at de opfylder visse krav.
Brink (2016) undersøgte unge nordboers kommunikation på tværs af landegrænser og
deres syn på internordisk kommunikation, dvs. det at skulle kommunikere med andre
nordboer på et skandinavisk sprog, der ikke var deres modersmål. Brinks undersøgelse
er interessant i forhold til islandske studerende, der vælger at studere i et andet
nordisk land end Island. Undersøgelsen viste, at der var en tendens til, at de unge
islændinge havde en negativ opfattelse af det at de skulle lære dansk i skolen.
Hovedårsagen til at de islandske unge ikke havde været motiverede for at lære dansk i
skolen var, at de ikke havde kunnet se formålet med det. De kunne ikke forestille sig, at
de nogensinde ville få brug for at kunne sproget. Det ærgerlige er, at de islandske unge
for de flestes vedkommende senere fortrød ikke at have lært mere dansk, da chancen
bød sig i deres skoletid. Det positive er, at de fleste islandske unge rapporterede om, at
det dansk de trods alt havde lært i skolen, havde været en hjælp for dem, da de senere
skulle kommunikere i praksis enten på dansk eller på et andet skandinavisk sprog.
13
Teori
Begrebsafklaring
Jeg vil i dette afsnit kort forklare forskellige begreber, som jeg kommer ind på i
opgaven. For nogle begrebers vedkommende giver det mere mening at forklare dem i
sammenhæng, hvor de første gang optræder i teksten.
Målsproget, er det sprog man underviser i. Dvs. at for elever i danskundervisningen, er
dansk målsproget.
1000 ordniveauer, er den inddeling af ordene man oftest laver, når man undersøger og
omtaler hvor ofte ordene forekommer i sproget. Det første 1000 ordniveau består
således af de oftest forekomne 1000 ord i et sprog, dvs. fra nummer et til nummer
1000. Ord nummer et i det første 1000 ordniveau er det ord, der oftest forekommer i
sproget. Ord nummer to er det ord der næst oftest forekommer i sproget osv. Det
andet 1000 ordniveau består af de næst oftest 1000 forekomne ord i sproget, dvs. fra
nummer 1001 til nummer 2000. Det tredje 1000 ordniveau består af de dernæst oftest
forekomne 1000 ord i sproget, dvs. fra nummer 2001 til nummer 3000.
Højfrekvens ordforråd, er den samling af ord, der oftest forekommer i sproget. I de
fleste sammenhænge henviser begrebet højfrekvens ordforråd, til de hyppigst
forekomne 2000 ord i sproget. I. S. P. Nation (2013) definerer højfrekvens ordforråd
som værende de hyppigst forekomne 2000 ord. Schmitt and Schmitt (2012) derimod
foreslår, at man definerer de hyppigst forekomne 3000 ord som højfrekvens ordforråd.
Når jeg i denne opgave omtaler højfrekvens ordforråd, henviser jeg til de hyppigst
forekomne 2000 ord.
Mellemfrekvens ordforråd, er ifølge I. S. P. Nation (2013) defineret som de ord der
kommer fra det tredje til det niende 1000 ordniveau. Dvs. hvis man ville sortere ordene
efter hvor ofte de forekommer i sproget, så er det ord nummer; 2001 til ord nummer
9000. Mellemfrekvens ordforrådet er således en gruppe på 7000 ord.
Lavfrekvens ordforråd, er ifølge I. S. P. Nation (2013) defineret som alt hvad der ligger
14
over det mellemfrekvente ordforråd. Dvs. at det er ord fra nummer 9001 og opefter.
Akademisk ordforråd, er ordforråd som er hyppigt anvendt i akademiske tekster på
tværs af fagområder. På engelsk findes der forskellige lister over akademisk ordforråd.
Den mest kendte er Academic Word List (Coxhead, 2000), som består af 570 ord.
Akademisk ordforråd er vigtigt at lære, for dem der har planer om akademiske studier
på det pågældende sprog (I. S. P. Nation, 2013).
Dækningsgrad, fortæller noget om hvor stor en procentdel af ordforrådet i en given
tekst læseren har kendskab til. Hvis man fx kender de hyppigst forekomne 1000
ordfamilier på engelsk har man en dækningsgrad på ca. 78 pct. af en hvilken som helst
tekst. For de næste 2000 hyppigst forekomne ordfamilier på engelsk er
dækningsgraden 8 pct., dvs. at man ”tjener” en dækningsgrad på yderligere 8 pct. ved
at lære ordene i det andet 1000 ordniveau på engelsk. Alt i alt betyder det, at hvis man
har kendskab til både det første og det andet 1000 ordniveau i engelsk, også omtalt
som de hyppigst forekomne 2000 ord, opnår man en dækningsgrad på 86 pct. (I. S. P.
Nation, 2013).
Tokens, antallet af tokens er det samlede antal ord der forekommer i en tekst. På
engelsk også nogle gange betegnet som ”runnig words” (I. S. P. Nation, 2013). Selvom
det samme ord forekommer i samme form mere end én gang i samme tekst tælles det
med hver gang det forekommer (Read, 2000). Sætningen ”Jeg ved ikke, om jeg vil vide
det” indeholder 8 tokens.
Types, er det samlede antal forskellige ordformer der optræder i en tekst, dvs. at hvis
det samme ord forekommer mere end en gang, tæller det alligevel kun med én gang
(Read, 2000). Sætningen ”Jeg ved ikke, om jeg vil vide det” indeholder 7 types, fordi
ordet jeg kun tæller med én gang, selvom det forekommer to gange.
Lemma, er et begreb man ofte opererer med i ordforrådsstudier. Lemma er den
kollektive betegnelse for ordets grundform samt ordets bøjningsformer (Read, 2000).
Sætningen ”Jeg ved ikke, om jeg vil vide det”, indeholder 6 lemmaer, fordi de to gange
jeg tæller som ét lemma på samme måde som vide og ved tælles som ét lemma, da
15
begge tilhører lemmaet vide.
Ordfamilier, består af et ords grundform samt ordets bøjningsformer og de afledte
former af ordet, som har den samme betydning. Fænomenet ordfamilier er imidlertid
en kompleks størrelse, da en del ord er afledt af den samme grundform, men alligevel
har vidt forskellige betydning. Det giver anledning til, at ordets grundform, så at sige,
kan være ”moder” til mere end én ordfamilie. Hvordan man adskiller den samme
grundforms ordfamilier kan have stor betydning for hvilket resultat man får, når man fx
undersøger størrelsen på ordforråd hos modersmålstalende, for hvis hver ordfamilie
indeholder mange medlemmer, får man et resultat der viser et større ordforråd hos
testpersonerne end hvis hver ordfamilie indeholder færre ord (Read, 2000). Som I. S. P.
Nation (2013) anfører, er det største problem ved at bruge ordfamilier som tælleenhed
at afgøre, hvad der skal tælles med i ordfamilien og hvad der ikke skal tælles med.
Ord
For at kunne undersøge størrelsen af elevernes ordforråd i forbindelse med den
obligatoriske danskundervisning i gymnasiet er det relevant at komme ind på, hvad et
ord egentlig er, eller sagt på en anden måde, definere hvad der tæller som et ord i
hvilke sammenhænge. Der er som i begrebsafklaringen nævnt forskellige tælleenheder
for ord. I nedenstående afsnit vil jeg redegøre for, hvilken tælleenhed der i denne
opgave primært gør sig gældende for ord.
Lemma versus ordfamilier
Der er en generel tendens til, at man i de nordiske sprog beskæftiger sig med lemmaer,
hvorimod man på engelsk oftest beskæftiger sig med ordfamilier. Jakobsen, Coxhead,
and Henriksen (2018) beskæftigede sig med højfrekvens ordforråd og akademisk
ordforråd på dansk og brugte i den sammenhæng tælleenheden lemma af to grunde.
For det først mente de ikke, at konceptet ordfamilier i relation til det danske sprog er
blevet undersøgt i tilstrækkelig grad til, at de kunne forsvare at bruge det i deres
undersøgelse. For det andet var deres valg af lemmaer som tælleenhed praktisk
betinget, da det kildemateriale, som de brugte i deres undersøgelse, var
16
lemmabaseret.
P. Nation (2012) argumenterer for sin brug af ordfamilier frem for fx lemma eller
ordtyper ved at anføre at forskning har vist, at ordfamilier er, om man så må
sige, ”psykologisk rigtige eller ægte”. For det andet argumenterer han for brugen af
ordfamilier som tælleenhed ved at sige, at hvis man læser et hidtil ukendt medlem af
ordfamilien og i forvejen kender ét medlem af samme ordfamilie, og også kender de
mest basale almindelige og regelmæssige ordbygningsprocesser, vil det gøre det muligt
for én at gætte betydningen af det nye ord. Ordfamilier er ifølge Nation (2012) den
bedste tælleenhed, når det drejer sig om testning af receptivt ordforråd, hvorimod han
i forbindelse med testning af produktivt ordforråd finder brugen af lemmaer eller types
mere hensigtsmæssig.
Hvor mange ord en ordfamilie består af, afhænger som tidligere nævnt af kriterierne
for, hvordan man definerer en ordfamilie, dvs. hvor mange ord man tæller med til hver
familie. Et eksempel på hvor mange ord en ordfamilie kan bestå af, finder vi hos Nation
(2012). Han angiver, at det første 1000 ordniveau i alt består af 6857 ord, hvilket
betyder, at hver ordfamilie i gennemsnit består af knap syv ord. Antallet af medlemmer
i hver ordfamilie falder efterhånden som man kommer op i frekvensniveauerne, dvs. at
det andet 1000 ordniveau gennemsnitligt har færre medlemmer end det første, det
tredje har færre end det andet osv.
Accepten af brugen af ordfamilier som tælleenhed er omdiskuteret. Bl.a. Ward and
Chuenjundaeng (2009) advarer om, at vi må være påpasselige med at antage, at elever
kender familiemedlemmerne i en ordfamilie. Også Kremmel (2016) kritiserer brugen af
ordfamilier i forbindelse med ordforrådstestning. Kremmel angiver, at nyere forskning
viser, at den tidligere antagelse, om at hvis en person kender ét medlem af en
ordfamilie, kan han/hun slutte sig til betydningen af de øvrige ord i ordfamilien, ikke
holder stik. Kremmel foreslår tælleenheden lemma som den mest optimale.
Som Nation (2012) angiver, har valget af tælleenhed for ord stor betydning for hvor
mange ord man anslår et givent sprog har. Hvor mange ord der findes på henholdsvis
dansk eller engelsk har imidlertid ikke afgørende betydning for omdrejningspunktet i
17
denne opgave. Det eneste tilfælde hvor tælleenheden har betydning, er hvis man gerne
vil anvende den ordforrådsforskning som fx I. S. P. Nation (2013) har lavet om engelsk,
hvor man tæller i ordfamilier, og overføre den viden til dansk, hvor man tæller i
lemmaer. Det Nation bl.a. har undersøgt er, hvor mange ordfamilier der skal til, for at
man fx kan læse og forstå en avis uden brug af hjælpemidler. Eller hvor mange
højfrekvens ordfamilier man skal have lært, før man går i gang med at arbejde med det
akademiske ordforråd. Det kan være problematisk umiddelbart at overføre eller
sammenføre den viden, vi har om ordforråd i det engelske sprog, med den viden vi har
om ordforråd i det danske sprog, hvor fx Jakobsen et al. (2018) undersøgelse opererer
med lemmaer i stedet for ordfamilier.
Denne opgave omhandler primært ordforråd i relation til det danske sprog, og da det
danske sprog primært er optalt i tælleenheden lemma, vil lemmaer spille hovedrollen
som tælleenhed i denne opgave. Det er et praktisk valg i lighed med det Jakobsen et al.
(2018) tog i deres forskningsprojekt. Som nævnt i ovenstående afsnit er meget af den
forskning, der har fundet sted på engelsk, lavet på baggrund af tælleenheden
ordfamilier, hvorfor jeg ikke helt kan undgå at omtale tælleenheden ordfamilier i visse
sammenhænge. Når jeg omtaler ordfamilier i opgaven, er jeg helt klar over, at de ikke
umiddelbart kan sammenlignes med lemmaer.
At kende et ord
Hvornår man kender et ord, er svært at svare på, for hvad vil det egentlig sige at kunne
ord. Er det nok, at man kan forstå ordet, eller skal man også kunne udtale og skrive det
korrekt? Er det også nødvendigt, at man ved hvordan ordet bøjes, og behøver man at
vide noget om i hvilke sammenhænge man bruger ordet, og evt. hvornår man bestemt
ikke skal bruge ordet? Der er som sagt flere aspekter af at kende et ord og i forbindelse
med testning af elevers ordforråd, som denne opgave omhandler, er det i særdeleshed
vigtigt at gøre sig klart, hvilket aspekt af elevernes ordforrådsviden man interesserer sig
for, da de forskellige typer af ordforrådstests, tester forskellige aspekter.
Iflg. Henriksen (2009) tales der oftest om tre dimensioner af ordforrådsviden:
– hvor mange ord sprogbrugeren kender, dvs. kvantitet
18
– hvor godt sprogbrugeren kender det enkelte ord, dvs. kvalitet
– hvor godt sprogbrugeren kan bruge ordene i kommunikation, dvs. kontrol
Der bruges af forskellige forskere forskellige betegnelser for de tre ovennævnte
dimensioner af ordforrådskendskab. Hvor mange ord sprogbrugeren kender, dvs.
ordforrådets størrelse eller kvantiteten, omtales bl.a. hos Stæhr (2013) som
ordforrådets bredde. Og hvor godt sprogbrugeren kender ordene i ordforrådet, dvs.
kvaliteten, omtaler Stæhr som ordforrådets dybde. Den tredje dimension er udtryk for
elevens grad af kontrol over ordet i forbindelse med kommunikation, dvs. i hvilken grad
ordet er receptivt og produktivt tilgængeligt for eleven. At et ord er receptivt
tilgængeligt, vil sige, at eleven kan bruge ordet i læse- og lyttesammenhænge, dvs. kan
forstå ordet, når han læser det eller hører det. Det omtales også sommetider som
elevens passive ordforråd. At et ord er produktivt tilgængeligt, vil sige, at eleven selv
kan bruge ordet i skrive- eller talesammenhænge, dvs. kan bruge ordet, når han/hun
taler eller skriver. Det omtales i nogle sammenhænge som elevens aktive ordforråd.
Tilegnelse af nye ord
I forbindelse med ordforråd er det også interessant at se på, hvordan sprogeleven
bedst tilegner sig nye ord. Der er to yderpunkter i ordforrådstilegnelsen, hvoraf den
ene er den tilfældige, også betegnet som den indirekte metode. Her finder
ordforrådstilegnelsen sted ved læsning, og foregår ligesom ”tilfældigt”. Den anden er
den planlagte, også betegnet som den direkte metode. Imellem de to yderpunkter er
en kombination af begge metoder, dvs. en kombination af planlagt og tilfældig
ordforrådstilegnelse.
Der er blevet lavet forskellige undersøgelser af direkte ordforrådstilegnelse versus
indirekte ordforrådstilegnelse. Stæhr (2013) henviser til Parabakht og Wesche (1996),
der sammenlignede ordforrådstilegnelse hos elever der udelukkende læste, med elever
der både læste og blev udsat for ordforrådsøvelser. Undersøgelsen viste, at de elever
der både læste og blev udsat for ordforrådsøvelser var dem der tilegnede sig flest ord.
Hill and Laufur (2003) har på baggrund af forskningsresultater indenfor området regnet
19
sig frem til, at fremmedsprogselever skal læse over otte millioner ord, hvilket svarer til
omkring 420 romaner, for at udvide deres receptive ordforråd med 2000 ord. At læse
420 romaner er for langt de fleste fremmedsprogselever et helt uoverskueligt projekt,
hvilket peger i retning af, at den indirekte ordforrådstilegnelse ikke kan stå alene, hvis
eleverne skal udvikle et ordforråd, som skal gøre dem til kompetente sprogbrugere.
Også Henriksen (2018) omtaler den udbredte misforståelse, at hvis bare eleverne læser
en masse udvider de automatisk deres ordforråd. Henriksen kommer i den forbindelse
ind på undervisningen i tysk og fransk i Danmark, som efter min mening kan sidestilles
med undervisningen i dansk i Island, da tysk og fransk i Danmark har rollen som andet
eller evt. tredje fremmedsprog, ligesom dansk har i Island. Henriksen henviser til, at i
forbindelse med undervisning i tysk og fransk i Danmark er det særligt vigtigt at
arbejde målrettet med udvidelse af elevernes ordforråd fx ved hjælp af forskellige
typer af ordforrådsopgaver, da eleverne i de to sprog ikke i særlig vid udstrækning
eksponeres for sprogene i deres fritid i modsætning til den store eksponering de
udsættes for fra den engelske sprog, som finder sted hele tiden. Den observation som
Henriksen her påpeger, svarer til hvordan det forholder sig for de islandske elevers
manglede eksponering for dansk udenfor klasseværelset.
Hvor mange ord man skal kunne
Hvor mange ord skal man kunne? Det er et godt spørgsmål. Hvor mange ord man skal
kunne afhænger af, hvilke opgaver man skal kunne udføre. For sproglæreren er
spørgsmålet om, hvor mange ord eleverne skal kunne særligt interessant. Hvis
sproglæreren ikke ved hvor mange ord eleverne skal kunne fx efter afslutning af
grundskolen eller efter afslutningen af den obligatoriske danskundervisning i
gymnasiet, har han/hun ikke noget mål at arbejde hen imod. Dem der har kendskab til
den nationale læseplan i Island [Aðalnámskrá grundskóla, 2013] ved imidlertid godt, at
man ikke kan slå op på side sytten, eller noget andet sted, og finde et tal, for hvor stort
et ordforråd det forventes, at eleverne har ved afslutningen af den obligatoriske
danskundervisning i grundskolen eller gymnasiet. I dette afsnit beskæftiger jeg mig
med, hvor stort et ordforråd der skal til, for at man som fremmedsprogselev kan udføre
forskellige opgaver på målsproget. En ting er hvor mange ord man skal kunne, en anden
20
ting er, at det ikke er alle ord, der har lige stor værdi for eleven at kunne. Her kommer
frekvensniveauerne ind billedet.
Ordlister
Der findes forskellige lister over ord i sproget. De to typer jeg her vil komme ind på er
frekvenslister og lister over akademisk ordforråd.
Frekvenslister
Når man kigger på, hvilke ord der er de mest brugte i sproget, afhænger resultatet af
hvilke sproglige materialer, man undersøger. Man kan undersøge både talt sprog og
skriftligt sprog. Det er imidlertid lettest at undersøge skrevet sprog, hvorfor de
frekvenslister der findes over sprog, i vid udstrækning er frekvenslister over det
skrevne sprog. Når man kigger på forskellige frekvenslister over det skrevne sprog, er
der afvigelser mellem listerne afhængigt af, hvilke typer skriftligt materiale listerne er
baseret på. På dansk findes der forskellige frekvenslister af varierende alder. På
www.sproget.dk omtales der fire forskellige danske frekvenslister, der bygger på
ordmateriale af vidt forskellige størrelse.
Den første liste er fra bogen Hyppige Ord i Danske Aviser, Ugeblade og Fagblade og
lavet på grundlag af 250.000 ord. Ordene stammer fra tekstuddrag fra udvalgte
fagblade fra 1970-74. Den anden liste er fra bogen Hyppige Ord i Danske Romaner og
er ligeledes lavet på grundlag af et materiale på 250.000 ord. Ordene stammer fra
tekstuddrag fra udvalgte børnebøger fra 1970-74. Den tredje stammer fra bogen Dansk
Frekvensordbog, som bygger på et grundlag på 4.070.419 ord, hvor ordene stammede
fra tekstuddrag fra udvalgte romaner og noveller, aviser og ugeblade fra 1987-90. Den
fjerde liste, som er den jeg har valgt at bruge i denne her opgave, er en liste som Det
Danske Sprog- og Litteraturselskab har lavet. Listen er lavet ud fra et tekstmateriale
bestående af cirka 880 millioner ords tekst, hvilket er en helt, helt anden skala end de
øvrige frekvenslister. Det skyldes, at denne liste er blevet udarbejdet efter det blev
muligt at bruge computere til at analysere tekstmaterialet. Teksterne som lå til
grundlag for listen fra Det Danske Sprog- og Litteraturselskab bestod primært af
nyhedsstof fra 2006-2016. Listen består af lemmaer. Ifølge den liste er de ti hyppigste
21
ord på dansk: i, være, og, en, den, på, til, det, at, af (www.sproget.dk), men der er ikke
de store afvigelser i de ti hyppigste ord imellem de fire lister. Det skyldes, at de mest
højfrekvente ord er funktionsord, der får sproget til at hænge sammen, og det at
sproget skal hænge sammen ændrer sig ikke over tid på samme måde som
indholdsordene, som i højere grad afspejler tidsånden, om man så må sige. I
forbindelse med frekvenslister over det danske sprog er det også værd at nævne, at
Ruus (1995) udarbejdede en liste med 1117 kerneord i dansk, som betegnes som
værende dele af den basale ordviden hos alle dansklæsende og dansktalende.
Akademiske ordlister
Den gruppe af ord som betegnes som akademiske ord er kendetegnet ved, at de
hyppigt bruges i forskellige akademiske tekster på tværs af fagområder. Den ifølge
Nation (2013) mest kendte liste over akademiske ord er The Academic Word List
(Coxhead, 2000). The Academic Word List består af 570 ordfamilier og er udarbejdet på
baggrund af et korpus af akademisk engelsk bestående af 3,5 mio. tokens på tværs af
de fire akademiske felter; humaniora, naturvidenskab, jura og handel (I. S. P. Nation,
2013). Ifølge Nation (2013) er det at lære det akademiske ordforråd et mål af høj
prioritet for elever, som har planer om akademiske studier på engelsk, så snart
eleverne har lært de 2000 hyppigste ord i engelsk. Når eleverne har lært de 2000
hyppigst forkomne ord, har de fået en dækning på 90 pct. af ordforrådet i en
akademisk tekst. Nation argumenterer for, at selv hvis man regner med, at det
akademiske ordforråd kun giver 6 pct. dækning, som Hyland and Tse (2007) kom frem
til indenfor naturvidenskab, er det en højere dækning end eleverne ville kunne opnå
ved at lære ordene fra det tredje 1000 ordniveau.
Der findes som sagt akademiske ordlister på engelsk, men på dansk er sagen en lidt
anden. Ifølge Jakobsen et al. (2018) er status i en skandinavisk kontekst, at der på
nuværende tidspunkt er udviklet akademiske ordlister på både svensk og norsk. Den
svenske liste indeholder 655 lemmaer, og den norske liste indeholder 750 lemmaer. De
to lister har det til fælles, at generelt højfrekvens ordforråd til en vis grad er
ekskluderet fra listerne ved hjælp af en eller anden form for stop-liste. På dansk er den
akademiske ordliste ifølge Jakobsen et al. (2018) fortsat under udarbejdelse. Man har
22
ifølge Jakobsen (2017) etableret et korpus, som benævnes AcaDan, på tværs af
discipliner, som skal danne grundlag for udarbejdelsen af en akademisk ordliste på
dansk. Listen er lavet, men den kræver nærmere undersøgelse, før den kan anvendes i
praksis.
Dækningsgrad
I fastsættelsen af hvor stort et ordforråd eleverne har brug for tales der ofte om to
grænseværdier; 95 procentgrænsen og 98 procentgrænsen. Ved 95 procentgrænsen
kender eleven 95 procent af de ord, der forekommer i en tekst. De øvrige fem procent
af ordene er for eleven ukendte. På samme måde gør det sig gældende for 98
procentgrænsen, hvor eleven kender 98 procent af ordene, og to procent af ordene er
ukendte. I praksis betyder 95 procentgrænsen, at når eleven læser en tekst er fem ud
af hundrede ord ukendte, eller sagt på en anden måde hvert tyvende ord er ukendt. 98
procentgrænsen betyder i praksis, at to ud af hver 100 ord er ukendte eller hvert 50.
ord er ukendt. Forskellen på de to grænseværdier 95 procentgrænsen og 98
procentgrænsen er, at forskning har vist, at en lille gruppe elever er i stand til at læse
og forstå en tekst med et ordforrådskendskab på 95 procent, men langt den største del
af eleverne har brug for et kendskab på 98 procent (I. S. P. Nation, 2013).
Forskellige opgavetyper kræver som tidligere nævnt forskellig mængder ordforråd. I
nedenstående tabel ses hvor stort et ordforråd man ifølge I. S. P. Nation (2013) skal
have for at kunne opnå henholdsvis 95 procent og 98 procent dækning af forskellige
teksttyper. Det man i denne sammenhæng skal være opmærksom på, er at antal ord i
nedenstående tabel er opgivet i ordfamilier, hvorimod jeg i denne opgave, og vi i
Danmark og Norden generelt, oftest opererer med lemmaer.
Tekstmateriale 95% dækning 98% dækning egennavne
romaner 4000 ordfamilier 9000 ordfamilier 1-2%
aviser 4000 ordfamilier 8000 ordfamilier 5-6%
børnefilm 4000 ordfamilier 6000 ordfamilier 1,5%
talt engelsk 3000 ordfamilier 7000 ordfamilier 1,3%
Tabel 1 Dækningsgrad 95/98 pct. af forskellige tekstmaterialer
23
(I. S. P. Nation, 2013, p. 16)
Tallene i tabel 1 er særligt interessante, når vi sammenholder dem med kravene fra den
nationale læseplan for grundskolen [Aðalnámskrá grundskóla, 2013], der bl.a.
udtrykker forventninger om, at eleverne ved grundskolens afslutning skal være i stand
til at ”læse autentiske tekster fx fra aviser, magasiner og internetressourcer”
(Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013, p. 126). Dette
udsagn indikerer sammenholdt med tallene fra ovenstående tabel, at man har en
forventning om, at eleverne har kendskab mindst 4000 ordfamilier, når de forlader
grundskolen. Og det tal er endda meget lavt sat, da et kendskab til 4000 ordfamilier
kun giver en dækningsgrad på 95 pct., som for de fleste elevers vedkommende er i
underkanten.
Man kan også vende talmaterialet om og kigge på, hvor stor en dækning, dvs. hvor stor
en procentdel af en given tekst, man kan forstå, hvis man fx har kendskab til de
hyppigst forkomne 1000 ord. Dvs. hvor mange procent af en given tekst kan eleven
forstå, hvis han/hun har kendskab til de hyppigste 1000 ord i målsproget. Og hvor
mange procent kan han/hun forstå, hvis han/hun har kendskab til de hyppigst
forkomne 2000 ord osv. På den måde kan man se hvor stor en ”fortjeneste” i form af
forståelse af ordforråd, eleven ”tjener” på hvert 1000 ordniveau, som han/hun tilegner
sig. Det første 1000 ordniveau giver mest, dvs. den største fortjeneste, og dernæst
falder mængden drastisk for hvert 1000 ordniveau (I. S. P. Nation, 2013).
1000 ordniveau Dækning af tokens i pct. Opsummeret dækning af tokens i pct. inkl. egennavne, grænseord og gennemskuelige sammensatte ord
1. 1000 77,96 81,14
2. 1000 8,10 89,24
3. 1000 4,36 93,60
4. 1000 1,77 95,37
5. 1000 1,04 96,41
6. 1000 0,67 97,08
24
7. 1000 0,45 97,53
8. 1000 0,33 97,86
9. 1000 0,22 98,08
10. 1000 0,28 98,23
11. 1000 0,15 98,38
12. 1000 0,11 98,49
13. 1000 0,09 98,58
14. 1000 0,07 98,65
15. 1000 0,06 98,71
16. 1000 0,04 98,75
17. 1000 0,04 98,79
18. 1000 0,03 98,83
19. 1000 0,02 98,85
20. 1000 0,01 98,86
Egennavne 2,57
Grænseord 0,31
Sammensatte ord 0,30
Off list 1,02 99,08
Tabel 2 Dækningsgrad for hvert 1000 ordniveau
(I. S. P. Nation, 2013, p. 21)
Det der er mest bemærkelsesværdigt ved tabellen er for det første, hvor enorm stor en
dækning man får ved at have kendskab til de hyppigst forkomne 1000 ord i engelsk.
Ved at kende dem, får man knap 78 procents dækning. Og man får 81 procent
dækning, hvis man tæller egennavne, grænseord og gennemskuelige sammensatte ord
med. Frekvensniveau to for de 1000 næst hyppigste ord i engelsk er også interessant,
fordi det niveau alene giver godt otte procent, som ikke lyder af meget i forhold til 78
procent i det første 1000 ordniveau, men alligevel er et højt tal, når man sammenligner
med hvor lidt man ”tjener” i procentpoint ved at lære ordene i de efterfølgende
frekvensniveauer.
Jakobsen et al. (2018) undersøgte dækningsniveauet for det første 1000 ordniveau på
dansk i forskellige tekstformer; generelle teksttyper, akademiske tekster og
fagspecifikke teksttyper, og i alle tre tilfælde havde det første 1000 ordniveau højest
dækning, efterfulgt af det andet 1000 ordniveau osv. Det mønster for udvikling i
25
dækningsgrad, hvor dækningen er højest i det første 1000 ordniveau, mindre i det
andet 1000 ordniveau osv. ligner det dækningsmønster man ser på engelsk. Jakobsen
et al. (2018) anfører, at udviklingen i dækningsgraden på dansk følger udviklingen i
dækningsgraden på engelsk, hvilket er vigtigt, da man dermed mere eller mindre, kan
overføre tallene fra det engelske sprog til det danske sprog, dog med det in mente, at vi
på dansk tæller i lemmaer, ikke i ordfamilier.
Hvis vi igen ser på tabel 2, er særligt 4000 ordniveauet interessant, fordi eleven, ifølge
tabellen, ved det frekvensniveau opnår 95 procent dækning, som er den grænseværdi,
hvor man mener, at en lille del af eleverne vil være i stand til at læse teksten uden
hjælpemidler. 9000 ordniveauet er også interessant, fordi eleven ifølge tabellen ved det
frekvensniveau opnår 98 procent dækning, som Nation (2006) ifølge Stæhr (2009)
bruger som grænseværdi for hvilken ordforrådsstørrelse, der skal til for, at eleven kan
opnå tilstrækkelig forståelse for skrevne og talte tekster. Stæhr (2009) henviser også til
Hu and Nation (2000) der angiver, at en forståelse af 98 procent af ordforrådet er en
forudsætning for at få en rimelig læseforståelse.
Hvor vigtige tallene i de ovenstående tabeller er, afhænger af hvad det er for en
elevgruppe man underviser. Med andre ord giver det måske begrænset mening at tale
om, at ens elever skal opnå 95 procent og 98 procent dækning, hvis det ordforråd der
skal til for at opnå en sådan dækning, er lysår fra størrelsen af det ordforråd ens elever
reelt har. En ting der imidlertid går igen mange steder, og derfor må ses som et vigtigt
delmål, er vigtigheden af, at elever lærer de 2000 hyppigst forkomne ord. Nation (2013)
udtrykker det på denne måde:
Generelt er højfrekvens ordforråd så vigtigt at alt hvad lærere og elever kan gøre for at sikre sig at det
bliver lært er værd at gøre (I. S. P. Nation, 2013, p. 25). 6
Nations (2013) definition af høj- mellem- og lavfrekvens ordforråd på baggrund af
British National Corpus ses i nedenstående tabel.
6 ”In general, high-frequency words are so important that anything that teachers and learners can do to make sure they are learned is worth doing” (I. S. P. Nation, 2013, p. 25).
26
Ordforråds type % dækning
Højfrekvens (2000 ordfamilier) 86%
Mellemfrekvens (7000 ordfamilier) 9%
Lavfrekvens (10.000 ordfamilier og opefter) 1-2%
Egennavne m.m. 3-4%
Total 100%
Tabel 3 Dækningsgraden for høj-, mellem- og lavfrekvens ordforråd
(I. S. P. Nation, 2013, p. 22) De grænseværdier der her er blevet beskrevet, er alle lavet på basis af det engelske
sprog. På dansk har vi endnu forholdsvis lidt materiale sammenlignet med mængden af
undersøgelser, der er lavet på engelsk, hvilket er naturligt nok, da dansk er et sprog
med væsentlig færre sprogbrugere. Den undersøgelse Jakobsen et al. (2018) lavede af
højfrekvent ordforråd og akademisk ordforråd på dansk er imidlertid et vigtigt skridt på
vejen.
Testtyper
Der findes forskellige typer af tests til at teste ordforråd med. I dette afsnit vil jeg
komme ind på tre testtyper, som alle spiller en vigtig rolle i ordforrådsforskningen. Man
kan ikke udpege én testtype og sige, at den er den bedste, da de forskellige testtyper
tester forskellige aspekter af ordforråds kendskab, og alle testtyper har forskellige
fordele og ulemper. Den fuldkomne test findes med andre ord ikke, selvom enkelte
tests gennem tiden er blevet udråbt som tæt på den fuldkomne test. I. S. P. Nation
(2013) anfører, at når man vil afgøre hvilken ordforrådstest der er den bedste til
formålet, er der tre ting man først skal overveje; formålet med at man vil teste, hvilken
form for kendskab eller viden man vil teste og under hvilke omstændigheder prøven vil
blive forelagt.
Når man taler om formål med at teste, er det fordi en underviser kan have forskellige
grunde til at ville teste sine elevers ordforråd. Det kan være for at finde ud af hvilke
niveau eleverne er på for på den baggrund at kunne vælge undervisningsmateriale, fx
læsetekster i en passende sværhedsgrad. Det kan også være for at kunne inddele en
større elevgruppe i mindre grupper efter hvor meget de kan. Eller for at undersøge om
27
eleverne har lært et givent ordforråd, som man har arbejdet med i undervisningen i en
kortere eller længere periode, eller for at undersøge om der er mangler eller huller i
elevernes ordforråd.
Når man som underviser, forud for valg af test, skal overveje hvilken ordforrådsviden
man vil teste, er det fordi der, som tidligere omtalt, findes forskellige aspekter af at
kende et ord.
Når man som underviser skal overveje, under hvilke omstændigheder prøven vil blive
forelagt, er det, fordi det spiller en rolle i forhold til hvor lang tid, man som underviser
kan og vil bruge på at teste sine elevers ordforrådsviden. For det første er det et
spørgsmål om lærerresurser. Hvis du er én underviser med 25 elever i seks lektioner
om ugen i ét semester, er det svært at argumentere for fornuften i, at du sætter dig
med hver enkelt elev for at udføre en tilbundsgående ordforrådstest, mens de øvrige
elever arbejder selvstændigt, da projektet hurtigt kan komme til at ”koste” en hel uges
undervisningstid. Derfor vil de fleste undervisere nok foretrække en testtype, hvor alle
eleverne kan tage testen selvstændigt og samtidigt. Hvis formålet med
ordforrådstesten derimod er led i et forskningsprojekt, kan der være god logik i at teste
eleverne én og én, da man i den sammenhæng ikke er bundet af, at de resterende
elever også skal undervises eller have hjælp, mens man sidder og tester den enkelte.
Vælger man en testtype som kan forelægges hele elevgruppen samtidig, er det også
værd at have med i sine overvejelser, hvor meget undervisningstid man vil bruge på
testen i forhold til, hvilke oplysninger man får ud af at teste. Hvis fx ens mål med at
teste er at undersøge, om eleverne har lært en bestemt mængde ord, som man har
arbejdet med i et kort undervisningsforløb, skal testen i min optik, tilsvarende være
kort, dvs. hurtig at tage, fordi man som underviser, hellere vil bruge tiden på
undervisning, end på at undersøge om undervisningen har den ønskede effekt.
Der findes mange forskellige testtyper. Jeg vil i det følgende præsentere nogle af de
testtyper, som jeg potentielt kunne have brugt i denne undersøgelse af hvor stort et
ordforråd eleverne har, når de er i gang med den obligatoriske danskundervisning i den
islandske gymnasieskole.
28
Vocabulary Levels Test
Vocabulary Levels Test, herefter omtalt som VLT, blev udviklet af Nation i starten af
1980erne. VLT var tænkt som et værktøj til brug i klasseundervisningen, hvor
underviseren kunne bruge det til at udvikle et undervisningsforløb i ordforråd af en
passende sværhedsgrad til deres elever (Read, 2000). P. Nation and Beglar (2007)
skriver, at VLT er et værktøj som bliver brugt vidt omkring til at afgøre, om eleven skal
fokusere på at lære højfrekvens, akademisk eller lavfrekvens ordforråd.
VLT er en diagnosticerende test med i alt fem niveauer. De fem niveauer er 2000, 3000,
5000 og 10.000 ordniveauerne samt det akademiske ordforrådsniveau. Det er elevens
scoring på det enkelte niveau af testen der er det vigtigste, ikke elevens samlede
scoring i testen. Elevens scoring i de enkelte niveauer af testen giver et fingerpeg om,
hvilken type ordforråd det er hensigtsmæssigt at eleven arbejder med eller fokuserer
på efterfølgende. Underviseren er først og fremmest interesseret i, om eleven har et
tilstrækkeligt kendskab til ordene i testens første niveau, dvs. 2000 ordniveauet, dvs.
har eleven tilstrækkeligt kendskab til de hyppigste 2000 ord. Efter at have testet
elevens kendskab til de 2000 hyppigst forekomne ord, afhænger det af elevens
fremtidsplaner, hvilket ordforråd underviseren dernæst skal fokusere på. Hvis eleven
har planer om et akademisk studie på målsproget, er det hans/hendes kendskab til
ordforrådet på det akademiske niveau der, næstefter kendskabet til de 2000 hyppigst
forekomne ord, er bedst at fokusere på. Hvis eleven derimod ikke har intentioner om
akademiske studier på målsproget, er det mellemfrekvens ordforrådet eleven har mest
gavn af at fokusere på at få lært (I. S. P. Nation, 2013).
VLT er en af de testtyper man ofte hører omtalt i forbindelse med undersøgelser af
elevers ordforråd. Read (2000) citerer Meara for at omtale VLT som “det tætteste vi
kommer på en standardiseret ordforrådstest”7. I ordforrådstestning i danske
sammenhænge har VLT bl.a. været brugt i en omfattende undersøgelse af Albrechtsen,
Haastrup, and Henriksen (2008), hvor de undersøgte leksikalsk kompetence og
skrivefærdigheder på L1 og L2 hos danske unge, der lærte engelsk som fremmedsprog.
Albrechtsen et al. (2008) argumenterede for deres valg VLT som testtype med, at den
7 „The nearest thing we have to a standard test in vocabulary” (Read, 2000, p. 118).
29
er velbeskrevet, den er valideret og at den ofte har været brugt som en slags standard
målestok for ordforrådstilegnelse i en række pædagogiske studier. Desuden egnede VLT
sig godt til deres undersøgelse, fordi de undersøgte en elevgruppe, hvis aldersfordeling
og ordforrådsstørrelse havde et stort spænd. I Albrechtsen et al. (2008) undersøgelse
havde man også brug for en dansk version af VLT, som man enten ikke kunne
fremskaffe eller ikke fandtes. Derfor blev der til undersøgelsen udviklet en dansk
version af VLT. Valideringen af den danske version af VLT blev foretaget af Dr. Norbert
Schmitt fra University of Nottingham, som også validerede den originale version af L2
(Albrechtsen et al., 2008).
VLT blev også brugt af Stæhr (2008), hvor han undersøgte hvor stort et ordforråd en
gruppe folkeskoleelever havde på engelsk, og om der var en sammenhæng mellem
størrelsen på deres ordforråd og deres præsentation i læseprøven, lytteprøven og den
skriftlige fremstilling ved folkeskolens reviderede afgangsprøve i engelsk. Stæhr (2009)
anvendte ligeledes VLT i en anden undersøgelse, hvor testpersonerne var en gruppe
førsteårsstuderende fra Copenhagen Business School. I undersøgelsen sammenholdt
han størrelsen på elevernes ordforråd med deres resultater i en lytteforståelsestest for
at undersøge, om der var en sammenhæng mellem størrelsen på deres ordforråd og
deres evne til at forstå en lytteopgave. VLT er ifølge Stæhr (2008) det mest kendte
eksempel på en test, der kan give et fingerpeg om størrelsen på elevers ordforråd ved
at teste udvalgte ord fra forskellige frekvensniveauer.
Hvert testniveau af VLT består af 36 ord og 18 definitioner. De 36 ord er inddelt i seks
grupper med seks ord i hver. Til hver gruppe med seks ord er der tre definitioner.
Eleven skal markere hvilke tre af de seks ord der matcher hvilke af de tre
ordforklaringer. Eksempel fra 2000 ordniveauet:
1 apply 2 elect ____ choose by voting 3 jump ____ become like water 4 manufacture ____ make 5 melt 6 threaten (Read, 2000, p. 119)
30
Ideen bag designet af testen er bl.a. at minimere mængden af læsestof og samtidig
forsøge at mindske risikoen for, at eleverne gætter sig til svaret fx ved at bruge
udelukkelsesmetoden. Read (2000) henviser til Nation, som har argumenteret for, at
selvom der kun er 18 definitioner på hvert niveau, er eleverne nødt til at læse alle 36
ord for at tjekke, hvilket der passer bedst til definitionen. Studier af hvordan
testdeltagere opfører sig, mens de tager testen, har imidlertid vist, at testdeltagerne
kun holdt alle seks ord op mod definitionerne i de tilfælde, hvor de syntes opgaven var
svær. I de tilfælde, hvor de ikke var i tvivl om hvilket ord der var det rigtige svar, brugte
de ikke tid på at kigge på de øvrige tre valgmuligheder.
Selvom VLT har fået mange fine ord med på vejen, og af nogen er blevet omtalt som
det nærmeste vi kommer på en standardiseret ordforrådstest, er der dog også mere
kritiske røster. Read (2000) påpeger, at han mener, at VLT er et fint redskab til
undervisningsbrug, men at den mangler yderligere analysering og validering før den
kan bruges i forskningsøjemed. Nation (2013) påpeger, at VLT ikke måler hvor mange
ord testpersonen kender, men giver en indikation af om testpersonen har behov for at
fokusere på højfrekvens, akademisk eller mellemfrekvens ordforråd.
Vocabulary Size Test
Vocabulary Size Test, herefter omtalt som VST, blev udviklet af P. Nation and Beglar
(2007) Nation. VST er lavet med det formål at vurdere størrelsen af testdeltagerens
receptive, skrevne ordforråd i engelsk og kan tages både af elever med engelsk som
modersmål og af ikke-modersmåls talende (P. Nation, 2012).
VST findes i forskellige versioner både hvad angår længde, men også i både
enkeltsprogede og tosprogede versioner. Den version som efter min opfattelse er den
mest omtalte er den engelske version, der går op til 14.000 ordniveauet. Den anden
engelske version går op til 20.000 ordniveauet. VST er opbygget på den måde, at der er
ti testord til hvert niveau. For at få resultatet af testen skal man multiplicere antal
korrekte svar med 100, da hvert testord repræsentere 100 ord. Hvert testord
præsenteres først alene, herefter bliver ordet præsenteret i en sætning som man har
bestræbt sig på skulle være en meget simpel ikke-definerende sætning (P. Nation,
31
2012). Nedenfor ses et eksempel på hvordan testordene præsenteres i testen.
Testordet er i dette tilfælde maintain og stammer fra 2000 ordniveauet:
1.MAINTAIN: Can they maintain it?
a.keep it as it is
b.make it larger
c.get a better one than it
d.get it
(P. Nation, 2012)
Efter min opfattelse er der en smule uklarhed om hvorvidt testdeltageren behøver at
tage alle niveauer af testen. Et sted anfører I. S. P. Nation (2013), at VST udelukkende er
tænkt som et værktøj der måler testdeltagerens totale ordforrådsstørrelse, hvorfor det
er vigtigt at testdeltagerne gennemfører alle fjorten niveauer af testen. Omvendt siger
P. Nation and Beglar (2007) om VST, at testdeltagere på begynderniveau kan nøjes med
gennemføre de niveauer af testen, som man har forventning om, at de har kendskab til
plus nogle få niveauer derover.
Ordforrådet brugt i VST er skrapt begrænset forstået på den måde, at man så vidt det
overhovedet har kunnet lade sig gøre har brugt ord hentet fra et højere frekvensniveau
end det man tester i. Dvs. at ordforrådet der er brugt i testens første to niveauer, dvs.
1000 ordniveauet og 2000 ordniveauet, kun er ordforråd fra de hyppigste 1000 ord på
West’s (1953) General Service List. Og til 3000 ordniveauet og opefter brugte man kun
ord fra 2000 ordniveauet og derunder i alle de tilfælde, hvor det kunne lade sig gøre.
På samme måde har man i de tilfælde, hvor ordet i flertalsform var hyppigere brugt
end ordet i entalsform brugte flertalsformen (P. Nation & Beglar, 2007).
Hvis vi afslutningsvis skal sammenligne VST med den tidligere omtalte VLT, er VST ifølge
P. Nation and Beglar (2007) en smule sværere end VLT, fordi de fire svarmuligheder i
VST kan indeholde ens delmeninger, dvs. svarene kan minde om hinanden i mere eller
mindre grad. Det står i modsætning til VLT, hvor intentionen var at svarmulighederne
ikke på nogen måde skulle minde om hinanden. Dermed er det i VLT muligt at få et
korrekt svar selvom graden af kendskab til det testede ord er begrænset. VST og VLT
32
adskiller sig også fra hinanden på den måde, at VST ifølge P. Nation and Beglar (2007)
er bedst til at undersøge udviklingen i testdeltagerens ordforråd. VLT er derimod et et
værktøj som bliver brugt vidt omkring til at afgøre, om eleven skal fokusere på at lære
højfrekvens, akademisk eller lavfrekvens ordforråd.
Vocabulary Knowledge Scale
Vocabulary Knowledge Scale, her efter omtalt som VKS, blev introduceret af Paribakht
and Wesche (1993). Ifølge Bruton (2009) er VSK sandsynligvis en af de mest kendte
testinstrumenter til undersøgelse af både receptivt og produktivt ordforråd og har
været brugt i mindst tolv forskellige studier fortrinsvist af L2 engelsk, men også i
forbindelse med spansk og tysk som L2. VKS tester ordforrådsdybde dybde frem for
ordforråds bredde.
VKS består af to skalaer. Den ene del af VKS, som er den del som testdeltagerne
præsenteres for, består af fem trin eller kategorier. De fem kategorier, som
testdeltageren præsenteres for i forbindelse med hvert testord, ser således ud i min
oversættelse, se originalteksten i fodnoten:
I. Jeg kan ikke huske at have set dette ord før
II. Jeg har set dette ord før, men jeg kan ikke huske hvad det betyder.
III. Jeg har set dette ord før, og jeg tror det betyder__________ (synonym eller
oversættelse)
IV. Jeg kender dette ord, det betyder__________ (synonym eller oversættelse)
V. Jeg kan bruge dette ord i en sætning______________ (skriv en sætning)8
(Paribakht & Wesche, 1997, p. 180)
8 I don´t remember having seen this word before. I have seen this word before, but I don´t know what it means. I have seen this word before, and I think it means_____________. (synonym or translation) I know this word. It means____________. (synonym or translation) I can use this word in a sentence: ______________. (Write a sentence.)
(If you do this section, please also do Section IV.) (Paribakht & Wesche, 1997, p. 180)
33
For at analysere testresultatet kombineres de fem overstående kategorier med en
pointskala, som går fra et til fem point. Det er min oversættelse i tabellen. Originaltekst
findes i fodnoten.9
De fem kategorier
Mulig score
1 1 point
2 2 point
3 2 point, hvis ordet oversættes forkert eller synonymet er forkert. 3 point, hvis oversættelse eller synonym er korrekt.
4 2 point, hvis ordet oversættes forkert eller synonymet er forkert. 3 point, hvis oversættelse eller synonym er korrekt.
5 2 point, hvis ordet oversættes forkert eller synonymet er forkert. 3 point, hvis oversættelse eller synonym er korrekt. 4 point, hvis ordet anvendes på en semantisk passende måde i en sætning 5 point, hvis ordet anvendes på en semantisk passende måde og med grammatisk præcision i en sætning
Tabel 4 Pointskala til VKS
(Paribakht & Wesche, 1997, p. 181) Wasche og Parabakht (1996) citeres i Bruton (2009, p. 289) for selv at erklære, at:
VKS kræver hånd-scoring og derfor er testen ikke anvendelig for store grupper af testdeltagere i sin
nuværende form (Bruton, 2009, p. 289).10
VKS kan bruges til at undersøge en begrænset gruppe af studerendes kendskab til et
begrænset antal ord, næsten uanset hvilket niveau de studerende befinder sig på.
Formålet med VKS er at undersøge testdeltagerens udvikling i kendskab til målordene
fra L2 læsning snarere end udvikling i ordforrådets størrelse. Resultatet af VKS kan
udregnes som total score pr. elev og pr. gruppe, hvilket kan reduceres til kender eller
kender-ikke testordet. Alternativt kan resultatet udregnes som antal procent af det
samlede antal ord (nominal kategori), men dette ville ikke kræve brug af
fempointskalaen (Bruton, 2009).
9 1. The word is not familiar at all. 2. The word is familiar but its meaning is not known. 3. A correct synonym or translation is given. 4. The word is used with semantic appropriateness in a sentence. 5. The word is used with semantic appropriateness and grammatical accuracy in a sentence. 10 “The VKS required hand-scoring and is thus not suitable for testing large numbers of students in its
present form”
34
Ifølge Bruton (2009) er der flere svagheder ved VKS. En af svaghederne ved VKS er, at
testordet altid skal præsenteres udenfor sammenhæng, da man ved at opgive ordet i
en sætning ville ødelægge spørgsmål fem, hvor testdeltageren bliver bedt om at bruge
ordet i en sætning. Det at testordet præsenteres uden sammenhæng medfører, at det i
nogle tilfælde, især i forbindelse med højfrekvente ord, som har flere betydninger fx
ordet have, som kan være navneordet en have eller udsagnsordet at have betyder, at
testdeltagerne ikke ved hvilke betydning af ordet der spørges til, hvilket gør, at ord med
flere betydninger ikke kan bruges som testord.
En anden svaghed ved VKS, er ifølge Bruton (2009), at VKS så at sige ”giver”
testdeltageren testordet. Det er en svaghed, fordi en af de sværeste ting ved L2
produktion netop er at fremkalde ordet.
Et tredje kritikpunkt ved VKS omhandler også skalaen med de fem point. Bruton (2009)
mener, at det er problematisk i kategori tre, at testdeltageren bliver belønnet med lige
mange point uanset om han/hun oversætter ordet helt præcist eller mere generelt. I
forhold til selve skalaen finder han det ligeledes problematisk, at de første fire trin
forholder sig til receptivt ordforråd, hvorimod det sidste og femte trin forholder sig til
produktivt ordforråd. Ifølge Bruton (2009) er både fordelingen mellem point for
receptivt og produktivt ordforråd problematisk, dvs. at receptiv ordforrådsviden står
for de første fire point og produktivt ordforrådsviden kun står for det sidste af de fem
mulige point. Også sammenblandingen af point for receptivt og produktivt ordforråd
finder Bruton problematisk, dvs. at hvis testdeltageren scorer fem, så er det femtal
egentlig et udtryk for både receptivt og produktivt ordforråd. Han mener ligeledes, at
det er problematisk, at der kun er et points forskel på, om man kan oversætte eller
finde et korrekt synonym for et testord eller om man ikke kan. Og på samme måde kun
et points forskel på om man kan bruge ordet semantisk korrekt eller om man kun kan
oversætte eller finde synonym.
En fjerde svaghed ved VKS er, ifølge Bruton (2009), hvordan man tolker de tal, man som
testadministrator får ud af at bruge fempointsskalaen, fordi vidt forskellige svar kan
give samme resultat. Hvis fx testdeltageren markerer kategori et; Jeg kan ikke huske at
35
have set dette ord før femten gange, udløser det femten gange ét point, dvs. femten
point i alt. Hvis derimod testdeltageren tre gange anvender et testord til højeste score,
dvs. anvender ordet på en semantisk passende måde og med grammatisk præcision i
en sætning, udløser det tre gange fem point, dvs. femten point, men de femten point
som den første testdeltager fik er næppe sammenlignelige med de femten point, som
den sidste testdeltager fik. I mellem de to yderpunkter kan der også tænkes et
eksempel, hvor en testdeltager fem gange scorer kategori et, dvs. markerer at han/hun
ikke kan huske at have set ordet før, kombineret med to ord, som han/hun scorer fem
point for, dermed lander vi igen på en scoring på femten point, men denne gang
dækker tallet femten over, at der var fem testord som testdeltagerne ikke kunne huske
at have set før og to ord, som han/hun demonstrerede brugen af til perfektion.
Problemerne med fempointskalaen leder os videre over i Brutons femte store
kritikpunkt ved VKS, som angår hvordan man skaber overblik over testresultaterne.
Som følge af ovenfor nævnte problematik med, at vidt forskellige scoringer kan give
samme resultat i point, mener Bruton, at det er meningsløst at udregne totalscore pr.
ord, da det ville give en tvetydig relativ værdi. Det samme gør sig gældende for at
udregne total score pr. testdeltager eller testdeltager gruppe. Det ville i alle tilfælde
give et svar, som kan dække over et utal af kombinationsmuligheder. Og her er muligvis
det største kritikpunkt. Bruton mener ikke, at testdeltagerens scoring i testen eller
nogen form for gruppering af scoringer i testen giver mening, hvorfor han mener, at
testen fejler netop på det punkt som var VKS hovedformål, nemlig at rapportere om
udvikling i testdeltagernes dybdekendskab til testordene. Bruton (2009) konkluderer, at
VKS i bedste fald kan anvendes til at vurdere udvikling pr. kategori over tid.
Opsummerende kan man sige, at VKS kan bruges til at undersøge en begrænset gruppe
af studerendes kendskab til et begrænset antal ord, næsten uanset hvilket niveau de
studerende befinder sig på. Formålet med VKS er at undersøge udviklingen i
testdeltagerens kendskab til målordene snarere end udvikling i ordforrådets størrelse.
Hvis man afslutningsvist skal sammenligne de tre testtyper, som jeg har gennemgået i
dette afsnit, kan man sige, at VST er god til at undersøge udviklingen i størrelsen af
testdeltagerens ordforråd. VLT er god til at diagnosticere, hvilket ordforråd eleven har
36
mest udbytte af at fokusere på at lære på et givent tidspunkt i sprogundervisningen.
VKS er god til at undersøge testdeltagernes udvikling i dybdekendskab til testordene.
37
Empiri
Udvikling af ordforrådstesten
Denne opgave drejer sig om at undersøge hvor stort et ordforråd eleverne har, når de
er midt i den obligatoriske danskundervisning i gymnasiet. Målet med undersøgelsen
er således at tegne et øjebliksbillede af elevernes ordforråd på dansk. Den perfekte
ordforrådstest findes som tidligere omtalt ikke, da forskellige typer af ordforrådstests
tester forskellige aspekter af ordforråd og alle testtyper har forskellige fordele og
ulemper. I. S. P. Nation (2013) taler om, at man forud for valg af ordforrådstest skal
overveje tre ting; formålet med at man vil teste, hvilken form for kendskab eller viden
man vil teste og under hvilke omstændigheder testen vil blive udført. Jeg vil i det
følgende besvare de tre spørgsmål i relation til den ordforrådstest, jeg lavede og
anvendte i forbindelse med udarbejdelsen af dette speciale.
Mit formål med at teste var at få et generelt billede af størrelsen og kvaliteten af
elevers ordforråd med henblik på at vurdere, om de har tilstrækkeligt styr på 2000
ordniveauet til, at det er realistisk og gavnligt at beskæftige sig med mellemfrekvens
eller akademisk ordforråd som en del af danskundervisningen i gymnasiet. Og også for
at vurdere om eleverne har nogle mangler i det højfrekvente ordforråd som spænder
ben for, at de kan udføre de opgaver som underviserne forventer og stiller krav om.
Det optimale ville være at lave en tilbundsgående ordforrådstest af både elevernes
receptive og produktive ordforråd. Virkeligheden er, at det er simplest at teste
receptivt ordforråd, fordi det er mindre tidskrævende. Produktiv ordforrådstestning
kræver mere tid pr. testord, når eleven udfører testen, fordi eleven selv
skal ”producere” sprog, fx en sætning enten oralt eller skriftligt for at demonstrere, at
han/hun kan bruge ordet produktivt. Efterfølgende skal underviseren vurdere elevens
svar, for at se, om svaret i tilstrækkelig grad demonstrerer, at eleven har kendskab til og
kontrol til at bruge ordet på en tilfredsstillende måde. Svaret på hvilken
ordforrådsviden jeg ville teste i denne sammenhæng blev derfor, at jeg gerne ville teste
både receptivt og produktivt ordforråd i det omfang det kunne lade sig gøre i forhold til
de praktiske omstændigheder.
38
I forbindelse med denne undersøgelse havde jeg den tidsmæssige begrænsning, at de
undervisere som lagde elever til undersøgelsen, naturligvis ikke var interesserede i at
bruge for megen undervisningstid på ordforrådstesten. Rent praktisk havde jeg derfor
de begrænsninger, at testen skulle kunne tages på mindre end én lektion, at samtlige
elever på holdet skulle kunne tage testen samtidig og testen skulle være anonym.
Ifølge Read (2000) er der tre ting man må tage højde for man kan teste størrelse af
ordforråd. Man skal definere, hvad der tæller som et ord. Man skal finde ud af, hvordan
man vil udvælge de ord man vil teste, og man skal finde ud af, om de udvalgte ord er
kendte for testpersonen. I de følgende afsnit vil jeg redegøre for, hvordan jeg har tænkt
de tre aspekter Read nævner ind i udarbejdelsen af testen, som jeg brugte i min
undersøgelse.
Valg af testmetode
Som tidligere nævnt er de to testtyper VST og VLT begge ret omtalte indenfor forskning
i og testning af ordforråd. De er lette at udføre i det, at samtlige elever kan tage testene
samtidig, det tager begrænset tid for testdeltagerne at udføre testene og det kræver
ikke subjektiv vurdering fra underviseren at vurdere testresultaterne. Der er to ulemper
ved testene. Den ene er, at de begge udelukkende tester receptivt ordforråd. Den
anden, og den der var udslagsgivende for at ingen af de to testtyper kunne anvendes i
denne opgave, er, at det ikke lykkedes mig at tilvejebringe nogle at de to tests i danske
udgaver. VST, som er udviklet af Nation findes i et utal af versioner. Både to engelske
monolingvale versioner som tester op enten op til 14.000 ordniveauet eller op til
20.000 ord niveauet og adskillige bilingvale versioner på bl.a. russisk, japansk og
arabisk, men ikke nogen version på dansk eller et lignede nordisk sprog. Hvad angår VLT
kom jeg som tidligere nævnt frem til ved at læse Albrechtsen et al. (2008), at de havde
fået udviklet en dansk version af VLT i forbindelse med deres omfattende undersøgelse
af ordforråd. Valideringen af den danske version af VLT, som Albrechtsen et al. (2008)
anvendte, blev foretaget af Dr. Norbert Schmitt fra University of Nottingham, som også
validerede den originale version af L2. Det ville have været spændende at få fingrene i
den danske version af VLT, men det lod sig ikke gøre. At udvikle min egen danske
version af VST eller VLT ville have været stof til et helt speciale i sig selv, hvis det skulle
39
gøres ordentligt, da der fx i VST er brugt ordforråd som er hyppigere forekommende
end det ordforråd der testes i, og da udvikling af den slags tests kræver omfattende
pilottestning før testene kan anvendes i praksis.
VKS har den fordel i forhold til VST og VLT, at den både tester receptivt og produktivt
ordforråd. Den har også den fordel, at den består af fem spørgsmål, som ”genbruges”
til hvert enkelt testord. Spørgsmålene er lette at oversætte til et hvilket som helst
sprog, hvis de ikke findes på det pågældende sprog i forvejen. Enhver form for test kan
have godt af at bliver pilottestet inden den skal anvendes i det virkelige liv, men for VKS
er det mindre vigtigt end ved fx VST og VLT, fordi der ikke indgår distraktorer i testen,
som er udslagsgivende for hvilket svar testdeltagerne vælger og dermed for deres
resultat i testen. Derfor endte jeg med at vælge VKS som testtype i denne
undersøgelse.
Grundlag for valg af testord
Den egentlige idé bag mit projekt var, at jeg gerne ville undersøge elevernes kendskab
til de hyppigste forekomne 5000 lemmaer på dansk. Den danske lemmafrekvensliste,
der bygger på det største tekstmateriale og er nyest, er en liste som Det Danske Sprog-
og Litteraturselskab har lavet, som jeg herefter slet og ret vil omtale som lemmalisten.
Listen er lavet ud fra et tekstmateriale bestående af cirka 880 millioner ords tekst.
Teksterne, der lå til grund for undersøgelsen, bestod primært af nyhedsstof fra
perioden 2006-2016, og listen består af de 10.000 mest højfrekvente lemmaer på
dansk. Listen findes i to versioner, en liste inklusivt egennavne, stednavne og tal og en
liste eksklusivt egennavne, stednavne og tal. Jeg valgte at bruge listen eksklusivt
egennavne, stednavne og tal, fordi jeg syntes det gav mest mening i denne her
sammenhæng, da egennavne og stednavne ofte er kontekstafhængige og det derfor
giver begrænset mening at teste i dem.
Umiddelbart kunne det se ud som om, at næste skridt ville være at fastslå en eller
anden form for system til at udvælge hvilke af lemmaer fra lemmalisten jeg ville teste
eleverne i. Når man skal teste ordforråd, er det imidlertid vigtigt at teste i et ordforråd,
som man har en forventning om, at eleverne kender i forvejen. Og da lemmalisten
40
bygger på tekstmateriale fra nyhedsstof, kunne lemmalisten ikke stå alene som
grundlag for udvælgelsen af ordforråd til testen. Jeg bestræbte mig derfor på at finde
noget tekstmateriale, der kunne repræsentere den undervisning mine testpersoner
havde været eksponeret for i grundskolen og et andet materiale, som kunne
repræsentere det tekstmateriale de var og blev eksponeret for i gymnasiet.
Jeg forsøgte derfor at spore mig ind på hvilket tekstmateriale, der bliver arbejdet med i
danskundervisningen i de islandske gymnasier. Jeg nærlæste boglisterne på de
islandske gymnasiers hjemmesider og forsøgte at finde en tendens eller et
undervisningsmateriale, som syntes mere brugt end andet. Den mest fremtrædende
tendens var imidlertid, at der i danskundervisning tilsyneladende bliver arbejdet meget
med ”materialer fra underviser”, som er et vidt begreb, der kan dække over mange
forskellige ting. I de tilfælde hvor boglisterne indeholdt en undervisningsbog, var der
næsten lige så mange forskellige undervisningsbøger, som der var skoler. Der var dog to
undervisningsmaterialer som forekom lidt oftere end de andre. Den ene var Ghetto,
som er en novellesamling fra 2008 skrevet med henblik på undervisningsbrug i
danskundervisningen. Den anden var Glimt (Brodersen, Stefánsdóttir, & Monrad,
2015), som bærer mere præg af at være en egentlig grundbog i danskundervisningen
end Ghetto. Jeg fandt ud fra boglisterne tre skoler, som bruger undervisningsmaterialet
Glimt. Materialet blev udgivet for første gang i 2015 og består i alt af tre bøger; Gnist til
1. trin, Glimt til 2. trin og Glød til 3. trin. Jeg valgte på den baggrund, at Glimt skulle
være det undervisningsmateriale, der repræsenterer gymnasiestoffet.
Jeg valgte at bruge undervisningsbogen Ekko (Ásdís Lovísa Grétarsdóttir & Erna Jessen,
2009), som er henvendt til 10. klasse, som grundlaget for ordforrådet fra grundskolen. I
grundskolen finder man ikke samme variation i brug af grundbog, som man gør i
gymnasiet. Hver skole får tildelt en pulje penge hos Det Islandske
Undervisningsdirektorat [Menntamálastofnun], som de kan købe
undervisningsmaterialer for. Og da grundskolerne, i modsætning til gymnasieskolerne,
skal skaffe undervisningsmateriale til eleverne bliver det ofte med hensyn til lærebøger,
de materialer undervisningsdirektoratet tilbyder, som valget står imellem.
41
Analyse af ordforrådet i Ekko og Glimt
For at få overblik over det ordforråd der anvendes i Ekko og Glimt, var det nødvendigt
at lave en frekvensanalyse af de to bøger. Og for at kunne lave en frekvensanalyse var
det nødvendigt at skaffe de to bøger på elektronisk form. Det var ikke noget problem
med Ekko, da den findes frit tilgængeligt i elektronisk form på Det Islandske
Undervisningsdirektorats [Menntamálastofnun] hjemmeside. Jeg kunne downloade
den som PDF og kopiere teksten direkte over i et Word dokument. I min analyse af
tekstmaterialet fra Ekko brugte jeg al tekst i bogen undtagen forside, bagside,
indholdsfortegnelse, litteraturliste og praktiske oplysninger så som oplag og udgiver. I
Ekko er udvalgte gloser skrevet nederst på siderne. Dem fjernede jeg. I Ekko er der
indlagt skriveøvelser, lytteøvelser og samtaleøvelser i forbindelse med de enkelte
tekster. Dem fjernede jeg også, da de ikke findes i Glimt, og jeg gerne ville have, at de
to tekster fremstod så ens som muligt i den samlede analyse.
Glimt fandtes ikke tilgængeligt på elektronisk form, dvs. jeg måtte lave min egen
elektroniske form. Jeg brugte en gratis app til mobiltelefoner og iPads, der hedder
Genius Scan. Jeg tog billeder af bogens sider med appen, og appen omdannede dem til
PDF-filer, som jeg sendte videre til computeren. I computeren gik jeg ind på en
hjemmeside, der hedder https://www.onlineocr.net/, som kan omdanne PDF-filer til
tekst. Teksten kunne jeg flytte over i et Word dokument, hvor den skulle gennemlæses
for fejl, da det var en udfordring for programmet, hvis de affotograferede sider ikke var
helt vandrette eller hvis der var illustrationer på siderne som overlappede teksten. Jeg
medtog i min analyse al tekst i Glimt bortset fra forside, bagside, indholdsfortegnelse,
litteraturliste og siden i med forskellige praktiske oplysninger så som udgiver, ISBN og
den slags. Jeg valgte at tage forordet og indledningen med i tekstanalysen, fordi begge
dele er skrevet i et sprog og en tone som henvender sig til de elever, der er tænkt som
brugere af bogen. Til Glimt hører der et separat glosehæfte og der er derfor ingen
gloser i bogen. Glosehæftet kom ikke med i analysen. I Glimt er der ingen
skriveopgaver, par-øvelser eller samtaleøvelser. De findes på nettet som materiale til
underviseren og kom ikke med i analysen.
Efter at have fået de to bøger på elektronisk form ”rensede” jeg teksterne. Da
42
frekvensanalysen af Ekko og Glimt skulle sammenholdes med lemmalisten eksklusivt
egennavne, stednavne og tal fjernede jeg alle egennavne, stednavne og tal, bortset fra
de tal der var skrevet med bogstaver. Dernæst fjernede jeg forskellige tegn fx
udråbstegn, spørgsmålstegn, kolon, semikolon, tankestreger, kommaer, trykstreger,
parenteser og lighedstegn. I de tilfælde hvor det gav mening, erstattede jeg tegnene
med punktum i stedet for at fjerne dem helt. Det var ikke nødvendigt i forhold til selve
frekvensanalysen, men jeg valgte at gøre det alligevel, for at kunne få et realistisk
fingerpeg om, hvor teksterne fra de to bøger lå i forhold til hinanden med hensyn til
lixtal, som jeg også synes var interessant. Det vil jeg komme ind på senere i opgaven.
Efterfølgende ”rensede” jeg teksterne for alle ord, der var på andre sprog end dansk. I
Glimt, som også indeholder tekster skrevet af færinger, grønlændere og islændinge, er
der en del ord på især grønlandsk, men også nogle stykker på islandsk og færøsk, som
jeg alle fjernede. I begge bøger, men især i Glimt, var der også en del engelske ord. Det
kan være svært at skelne mellem hvilke engelske ord, der også kan regnes som danske
ord, fordi de er blevet integreret i det danske sprog hen ad vejen. Jeg besluttede at
sætte grænsen ved hvilke engelske ord, der findes i ordbogen www.sproget.dk . Dvs.
fandtes de ”engelske” ord på www.sproget.dk, fik de lov til at blive i teksten ellers røg
de ud. Eksempler på ord, der fik lov til at blive i teksten er: firewall, bullshit og hacker.
Eksempler på ord jeg fjernede fra listen er: moves og yes.
Ord der kan skrives både med og uden tryk på skulle også have særlig opmærksomhed.
Et ord som café, der både kan skrives som café og cafe tælles i en ordfrekvensanalyse
på www.lix.se, som to forskellige ord, hvis det ene har tryk på og det andet ikke har. For
at det samme ord ikke skulle forekomme to gange, én gang med tryk og én gang uden,
fjernede jeg alle trykstregerne over ord som fx én, ét, dét, dér. Ordet café forekom både
med og uden trykstreg i tekstmaterialet og jeg besluttede at ændre dem alle til café
med trykstreg på. Der var også en del ord, der sikkert af pædagogiske grunde, var
skrevet med tankestreg mellem, hvor man rent retskrivningsmæssigt hvis materialet
var lavet til fx en voksen, modersmålstalende målgruppe nok hellere ville have undladt
stregen. Her ændrede jeg ordene til to separate ord. Dermed blev fx dna-spor til dna
spor og spaghetti-retter blev til spaghetti retter. Der var også nogle ord i teksterne,
som ikke er egennavne, men alligevel ikke optræder i ordbogen. Det var fx barbiedukke
43
og lego. Dem fjernede jeg. Der var ord som forekommer i ordbogen med bindesteger,
og de fik lov til at blive i teksten med bindestreger, det var fx cd-rom-drev og t-shirt. Der
var også nogle ord i teksterne som var ”hjemmestrikkede ord” som fx tillægsordet
sonnergaardsk, som fik lov til at blive. I teksten var der også e-mailadresser og
henvisninger til hjemmesider. De røg ud. Der var titler på priser fx De Gyldne Laurbær,
de røg ud. Endelsen -erne som i fx 1990erne røg ud for at følge eksemplet på hvad der
er medtaget og undladt på den eksklusive lemmaliste. 16-årig fik lov til at blive i tråd
med den eksklusive lemmaliste, hvor man lod betydningsmættede orddele, som fx -
årige indgå og lod ikke-betydningsmættede orddele som -erne (som i fx 1980erne)
falde ud. Så var der sammenskrivninger som fx børne- og ungdomslitteratur. Dem
omskrev jeg til børn og ungdomslitteratur. Som det ses af ovenstående, var der en hel
del valg om hvilke ord der skulle med i tekstmaterialet, og hvilke der ikke skulle med.
Set i bakspejlet ville det måske have været klogere at lade barbiedukke og lego blive på
listen og sonnergaardsk falde ud, men i det store billede har det ikke afgørende
betydning for resultatet.
Da de ”færdigrensede” tekster fra Ekko og Glimt lå klare analyserede jeg dem både
hver for sig og sammen. Analysen af den sammenklippende tekst bestående af både
Ekko og Glimt, er efterfølgende omtalt som fælleslisten Ekko/Glimt. Jeg analyserede
teksterne ved at køre dem igennem frekvensanalysatoren på www.lix.se .
Ekko Glimt Fælleslisten Ekko/Glimt
Samlet antal ord 29.130 16.388 45.518
Antal forskellige ord 4.835 3.128 6.524
Hvor mange ord der kun forekommer én gang
(4835-1988) = 2847 (3128-1249) = 1879 (6524-2758) = 3766
Procentdel af ord med kun én forekomst
(2847/4835) *100 = 59%
(1879/3128) *100= 60%
(3766/6524) *100=58%
Lixtal 29 27 28
Tabel 5 Resultater af tekstanalyse af Ekko og Glimt
Umiddelbart er det overraskende hvor mange ord, der kun forekommer én gang i
teksterne. I alle tre tilfælde, dvs. både i Ekko og Glimt hver for sig og på fælleslisten for
Ekko/Glimt er andelen på omkring 60 pct. I den sammenhæng skal man huske på, at
44
tallene i ovenstående tabel stammer fra en frekvensanalyse, ikke en lemmaliste, dvs. at
ordene i princippet godt kan forekomme mere end en gang i forskellige bøjningsformer,
men alligevel optræde på listen som om de kun forekommer en enkelt gang, hvis ordet
kun forekommer en gang i hver bøjningsform.
En teksts lixtal, som er en forkortelse af læsbarhedsindekset, fortæller noget om, hvor
let eller svær en tekst er at læse.
Lixtal for læsestof kategoriseres i fem kategorier.
<30: meget letlæst, børnebøger
30-40: letlæst, skønlitteratur, populære magasiner
40-50: middelsvær, normal avistekst
50-60: svær, den normale værdi for officielle tekster
>60: meget svær, bureaukratisk sprog
(www.lix.se)
Lixtallet udregnes ved at lægge gennemsnitlig meningslængde (dvs. antal ord delt med
antal sætninger) sammen med andelen af lange ord (dvs. antal ord med flere end 6
bogstaver delt med det samlede antal ord og gange med 100). Som ses af tabellen
ligger både Ekko og Glimt på knap 30, hvilket betyder, at de begge kategoriseres
som ”meget letlæst/børnebøger”. Det er i sig selv ikke bemærkelsesværdigt, men det
er imidlertid bemærkelsesværdigt, at Ekko, som henvender sig til 10. klasse, har et lixtal
på 29, der er højere end Glimts lixtal, som kun er på 27, set i det lys, at Glimt er
henvendt til et højere skoletrin end Ekko.
Som også ses af tabellen er Ekko næsten dobbelt så lang, dvs. består af næsten dobbelt
så mange ord som Glimt. På den baggrund kan man sige, at ordforrådet fra Ekko er
overrepræsenteret i den fælles frekvensanalyse i forhold til Glimt. Det afspejler på sin
vis virkeligheden fint, idet eleverne som er blevet testet i denne undersøgelse for langt
de flestes vedkommende, har gået et helt skoleår i 10. klasse og på testtidspunktet kun
har deltaget i danskundervisning i gymnasiet i to til tre måneder eller mindre end et
semester.
45
Da den fælles frekvensanalyse af Ekko og Glimt lå klar, kunne jeg begynde at
sammenholde den med lemmalisten. Det krævede flere forsøg at få et brugbart
resultat. Udgangspunktet var, at jeg gerne ville finde 50 testord, som var jævnt fordelt
over de fem første hyppighedsniveauer på lemmalisten, dvs. jeg ville finde ti ord fra
hvert 1000 ordniveau. Jeg ville gerne have ordene jævnt fordelt indenfor de enkelte
1000 ordniveauer, således, at de ikke alle sammen kom fra de første 100 ord i niveauet
eller de sidste 100 ord i niveauet. Samtidig var mit mål at have en jævn fordeling af
testordene i forhold til ordklasser. Dvs. at da fx navneord udgør 60 procent af ordene i
2000 ordniveauet, bestræbte jeg mig på, at 60 procent af testordene i 2000
ordniveauet på min liste også var navneord.
Analyse af ordklasser
For at undersøge hvordan forholdet var mellem de enkelte ordklasser i de forskellige
1000 ordniveauer analyserede jeg ordtyperne på lemmalisten. Det gjorde jeg ved hjælp
af Excel. Konklusionen på min analyse blev, at fordelingen mellem de enkelte ordklasser
skulle være som ses i tabellen nedenfor. Tallene angiver hvor mange ord fra hver
ordklasse, der skal repræsenteres i hvert 1000 ordniveau under forudsætning af at
hvert 1000 ordniveau skulle repræsenteres af ti ord.
Ordtype 1000 2000 3000 4000 5000
A, adjektiver 2 2 2 2 2
D, adverbier 1 1 - - -
NC, substantiver 4 5 6 6 6
V, verber 2 2 2 2 2
T, præpositioner 1 - - - -
Tabel 6 Ordniveau 1000 til 5000 analyseret efter ordklasser
Jeg undersøgte fordelingen mellem funktionsord og indholdsord for alle fem 1000
ordniveauer hver for sig. Funktionsord er ifølge www.sproget.dk; artikler, pronominer
(P), konjunktioner (C) og præpositioner (T). Indholdsord er ifølge www.sproget.dk;
verber (V), substantiver (NC), adjektiver (A) og adverbier (D). Bogstaverne i parentes
46
refererer til kategoriernes navne på engelsk. Jeg valgte at bruge dem, da ordene er
markerede på den måde på lemmalisten. I det første 1000 ordniveau udgør
funktionsordene 8,7 pct. Det valgte jeg at runde op til 10 pct. som altså svarer til, at der
er ét af de ti testord i det første 1000 ordniveau, der repræsenterer funktionsordene.
Funktionsordene er som sagt pronominer (P), konjunktioner (C) og præpositioner (T),
og da præpositionerne (T) udgør den største gruppe af de tre, valgte jeg, at det ene
funktionsord, der skulle med i testen skulle være en præposition. I de øvrige fire 1000
ordniveauer udgør funktionsordene fra 1,7 til 0,5 pct. og blev derfor ikke
repræsenterede blandt de ti ord fra hvert 1000 ordniveau.
Udvælgelsen af 50 testord
Jeg måtte eksperimenter lidt for at finde en passende måde at udvælge ordene på. Mit
udgangspunkt var, at jeg gerne ville have ti ord som repræsentanter for hvert 1000
ordniveau. Først forsøgte jeg mig med bare at vælge hvert 100. ord på lemmalisten,
dvs. ord nummer 100, 200, 300, 400, 500 osv. op til 5000. Det viste sig hurtigt, at det
ikke kunne lade sig gøre, da over halvdelen af ordene fra lemmalisten ikke fandtes på
fælleslisten for Ekko/Glimt.
Mit næste forsøg gik ud på at udvide det antal ord jeg søgte på, så jeg for at finde
ordet, der skulle repræsentere ord nummer 100, ledte mellem ord nummer 91 til 100
på lemmalisten. Ved ordet som skulle repræsentere ord nummer 200 ledte jeg mellem
ord nummer 191 til 200 osv. I det forsøg lykkes det mig nogenlunde at finde ord på
lemmalisten som også fandtes på fælleslisten for Ekko/Glimt. Problemet var, at mange
af ordene kun forekom én enkelt gang på fælleslisten for Ekko/Glimt, hvilket jeg ikke
fandt tilfredsstillende. Jeg ville gerne teste ordforråd, som eleverne forventes at kende
til, og jeg kunne ikke stå inde for, at ord der kun forekommer én enkelt gang på en
fælles frekvensliste over ord brugt i to undervisningsbøger, som de færreste af eleverne
sandsynligvis har læst fra ende til anden, kunne betegnes som ”kendt ordforråd”.
Jeg lavede derfor et tredje forsøg med udvælgelsen af testord, hvor jeg i stedet for at
lade tallene råde, om man så må sige, i stedet opstillede kriteriet for udvælgelsen af
ordene. Kriterierne lød som følger: Jeg ville kun have ord med i testen, der forekom
47
mindst fem gange på fælleslisten for Ekko/Glimt. Jeg ville fortsat have vandtætte
skodder mellem de fem 1000 ordniveauer, og jeg ville forsøge at have ordene jævnt
fordelt ud over de enkelte niveauer, så alle ordene i fx 2000 ordniveauet ikke var hentet
fra omkring 2000 til 2100, men også ord fra 2200, 2300, 2400 og op til 2999. Derudover
skulle ordklasserne være repræsenteret i samme forhold, som fordelingen er mellem
dem i de enkelte 1000 ordniveauer. I dette tredje forsøg lykkes det mig at få lavet en
liste med 50 testord, som jeg kunne stå inde for. Se Tabel 9 De 50 testord i Bilag.
I første udkast havde jeg ordet novelle, som er nr. 3950 på lemmalisten, med på listen
over testord. Det endte imidlertid med, at jeg erstattede novelle med ordet gymnastik,
fordi novelle af testpersonerne kunne forveksles med det engelske ord novel, og det
kunne være svært at vurdere om testdeltagerne kunne afskille de to ords betydning, da
de har betydningssammenfald.
Ordet interesseret er det eneste ord, der ikke forekommer mindst fem gange på
fælleslisten for Ekko /Glimt. Jeg brugte lang tid på at søge efter et adjektiv i 4000
ordniveauet som forekom mindst fem gange, men uden held. Til gengæld optræder
interesseret udover de tre gange, hvor det optræder på fælleslisten over Ekko/Glimt
også som afledning én gang, nemlig uinteresseret og som verbum i nutid interesserer
én gang og som verbum i navneform interessere én gang og som navneord i flertal fire
gange; interesser. Ordet forekommer i alt syv gange i forskellige afledninger og i andre
ordformer foruden de tre gange, hvor det optræder som adjektiv.
En af de store udfordringer i valg af testord, især i de første 1000 ordniveauer var, at jeg
ville forsøge at undgå testord, som tilhører mere end én ordklasse. Det betød, at jeg
blev nødt til at kassere mange gode testord, som ellers havde høj frekvens på
fælleslisten for Ekko/Glimt. Det var ord som fx køb, som både kan være et substantiv i
ental og et verbum i bydeform. Eller unge, som både kan være et substantiv i ental og
et andet substantiv i flertal. Eller verbet at ringe og navneordet i flertal ringe. Eller
navneordet en bakke og udsagnsordet at bakke. Eller navneordet varme og verbet
varme. Eller navneordet plage og verbet plage.
En anden type ord, som måtte udelukkes, var de såkaldte ”falske venner”. I 4000
48
ordniveauet var det svært at finde substantiver. Jeg fandt ordet sodavand, som havde
otte forekomster på fælleslisten for Ekko/Glimt, men da ordet ikke har samme
betydning på dansk og islandsk og muligheden for at undersøge om testdeltagerne
kendte forskellen på ordets betydning på dansk og islandsk ikke var til stede, droppede
jeg ordet.
I 4000 ordniveauet var det svært at finde adjektiver. Ordet sej, som har høj forekomst
på fælleslisten for Ekko/Glimt, er både et adjektiv og et navneord. Jeg valgte at bruge
sej af mangel på bedre, da jeg ikke regnede med at der var nogen testdeltagere, der
kender navneordets betydning, og det derfor ikke ville forstyrre dem i testsituationen.
Afkortning til 30 testord
Efter jeg havde udvalgt de 50 testord, udformede jeg selve testen på hjemmesiden
www.onlineundersoegelse.dk. Den del af processen vil jeg beskrive nærmere senere i
afsnittet, men det korte af det lange var, at jeg var bekymret over, om testen var blevet
for lang til, at eleverne kunne tage den på én lektion, og om de i det hele taget havde
udholdenhed til sådan en lang test. Jeg fik tre personer til at afprøve testen, og de gav
alle tre udtryk for, at de syntes testen var rigelig lang. En af de lærere, som havde sagt
ja til at lade sine elever deltage i testen udtrykte også bekymring over testens længde.
Jeg overvejede at klippe ti testord af, men var fortsat i tvivl, om den var for lang. 35
testord havde også været en mulighed, men jeg ville gerne have et lige antal testord i
hvert 1000 ordniveau, for på den måde at holde muligheden for at analysere testens
resultater i 500 ordniveauer åben, hvis det skulle vise sig at give mere mening. Derfor
valgte jeg i samråd med min vejleder at forkorte testen til bare 30 testord. I
afkortningen af testen tog jeg hensyn til, at ordklasserne fortsat skulle repræsenteres i
forhold til deres andel i de enkelte 1000 ordniveauer og jeg sørgede for, at af de seks
testord, der nu repræsenterede hvert 1000 ordniveau, var fordelingen mellem dem
således, at der var tre testord fra den første halvdel og tre testord fra den senere
halvdel af hvert 1000 ordniveau. Således blev fordelingen mellem ordklasserne på de
seks ord, der repræsenterer hvert 1000 ordniveau som ses i tabellen.
49
Ordtype <1000 6 ord 2000 6 ord 3000 6 ord 4000 6 ord 5000 6 ord
A, adjektiver 16,3% 1 17,3% 1 18% 1 18,7 1 17 1
D, adverbier 10,5% 1 5,8% 0 3,3% 0 2,7 0 2,5 0
NC, substantiver
40,8% 2 52,1% 3 55,2% 3 54,6 3 61,6 4
V, verber 23,2% 1 23,1% 2 22,2% 2 23,3 2 18,3 1
Funktionsord 8,7% 1 1,7% 0 1,2% 0 0,5 0 0,5 0
Tabel 7 De 30 testord fordelt på ordklasser og 1000 ordniveauer
Da jeg skulle forkorte testen, forsøgte jeg efter bedste evne at ”komme af med” de
testord, som jeg var mindst tilfreds i den oprindelige udgave af testen fx fordi de ikke
forekom specielt ofte på fælleslisten for Ekko/Glimt. Listen med de 30 testord kom til at
se således ud.
Nr. på lemma 10.000 listen
Testordet Ord-klasse
Laveste forekomst på fælleslisten Ekko/Glimt
Først forekomne ordform på fælleslisten
Antal forekomster på fælleslisten Ekko/Glimt *
97 sammen D 63 sammen 96
299 person NC 580 person 12+
397 igennem T 616 igennem 9
599 mad NC 196 mad 38+
784 elske V 194 elsker 31+
896 sjov A 291 sjovt 29+
1086 snakke V 328 snakke 33+
1296 vindue NC 529 vinduet 18+
1463 male V 1057 male 5+
1521 kød NC 524 kød 10+
1971 sur A 973 sur 10+
2000 veninde NC 626 veninde 18+
2023 hyggelig A 591 hyggeligt 9+
2123 æg NC 819 æg 6+
2389 slukke V 983 slukker 10
2591 idræt NC 667 idræt 7+
2751 tørre V 1427 tørre 5+
2788 eksamen NC 566 eksamen 9+
3038 brække V 2682 brækker 5+
50
3050 pludselig A 273 pludselig 19
3284 el NC 396 el 13+
3596 kravle V 1872 kravler 6
3732 dagbog NC 673 dagbog 7
3879 søskende NC 1028 søskende 7+
4021 morgenmad NC 724 morgenmad 9
4038 badeværelse NC 651 badeværelset 7+
4334 interesseret**
A 1444 interesseret 3+
4586 lektie NC 438 lektier 12
4665 kysse V 743 kyssede 16+
4870 gymnastik NC 683 gymnastik 7+
Tabel 8 De 30 testord
Testens praktiske udformning
I den praktiske udformning af testen stod valget mellem en test på papir eller en
elektronisk test. Fordelen ved at teste på papir er, at man undgår stress over om
elektronikken strejker i testsituationen, og man undgår bekymringer om tab af data i
tilfælde af at anden part skulle få adgang til programmet. Fordelen ved en elektronisk
test er, at det er let at få overblik over resultaterne, og man til dels undgår at tælle og
føre ind i Excel for at bearbejde resultaterne. Jeg valgte at bruge programmet
www.onlineundersoegelse.dk, som viste sig at være meget let at anvende, og den
færdige test kom efter min mening til at fremstå professionel og lettilgængelig.
Eleverne kunne tage testen enten på deres mobiltelefon, iPad eller computer.
Testen skulle være anonym, hvilket var muligt at sikre ved at indstille programmet
således, at det ikke var muligt at spore testpersonerne via ip-adresserne. Jeg ville
imidlertid gerne give testpersonerne mulighed for at se deres eget resultat i testen,
men da den skulle være anonym, kunne jeg ikke bede om navn. Derfor indsatte jeg
forrest i testen en mulighed for at skrive et dæknavn. I den praktiske udførelse af testen
opfordrede jeg eleverne til at bruge muligheden for at bruge dæknavnet, hvis de var
interesserede i resultatet af testen. Der var to grunde til, at jeg gerne ville give eleverne
mulighed for at få adgang til deres resultat i testen. Den første og vigtigste var, at det
syntes jeg, at jeg skyldte dem, når de nu brugte tid på at tage en test, som jeg havde
udarbejdet primært for egen vindings skyld. Den anden grund var, at jeg forventede, at
51
det var lettere at motivere dem, hvis de havde mulighed for at se resultatet.
Testen indledes med muligheden for at anføre et dæknavn og fire baggrundsspørgsmål.
Baggrundsspørgsmålene var først og fremmest tænkt som en mulighed for at få indblik
i hvilken baggrund testdeltagere havde i forhold til dansk, men også for at identificere
testdeltagere som har boet i Danmark eller har familiære relationer der gør, at deres
danskkundskaber ikke kan regnes til normalen og derfor evt. ikke skulle tælles med i
undersøgelsens endelige resultat. I selve testen blev spørgsmålene stillet på islandsk.
Den islandske version af spørgsmålene ses i fodnoten.11 Spørgsmålene lød som følger:
Dæknavn... (må undlades)
Hvilket køn er du? Pige/dreng/andet
I hvilken klasse begyndte du at lære dansk? I 5. klasse/6. klasse/7. klasse/andet
Har du gået i grundskole i Danmark? Nej/ja, hvis ja, hvor mange år?
Har du forælder/stedforælder eller værge som har dansk som modersmål? Nej/ja
Selve testen bestod af de 30 testord, hvortil der til hvert ord blev stille fem spørgsmål. I
selve testen blev spørgsmålene stillet på islandsk. Den islandske version af
spørgsmålene som blev brugt i undersøgelsen ses i fodnoten.12
I. Jeg kan ikke huske at have set dette ord før
II. Jeg har set dette ord før, men jeg kan ikke huske hvad det betyder.
III. Jeg har set dette ord før, og jeg tror det betyder__________ (synonym eller
oversættelse)
IV. Jeg kender dette ord, det betyder__________ (synonym eller oversættelse)
V. Jeg kan bruge dette ord i en sætning______________ (skriv en sætning)
11 Dulnefni... (má sleppa) Hvaða kyn ertu? Stelpa/strákur/annað
Í hvaða bekk byrjaði þú að læra dönsku? Í 5. bekk/6. bekk/7. bekk/annað Hefur þú verið í grunnskóla í Danmörku? Nei/ja - ef já, hversu mörg ár? Hefur þú foreldri, stjúpforeldri eða foráðamann sem hefur dönsku sem móðurmál? Nei/já. 12 Ég man ekki eftir að hafa séð orðið áður (rétt/rangt) Ég hef séð orðið áður, en ég veit ekki hvað það þýðir (rétt/rangt) Ég hef séð orðið áður og held að það merki... (svaraðu á íslensku) Ég þekki orðið. Það merkir... (svaraðu á íslensku) Ég get notað orðið í setningu... (skrifaðu setningu á dönsku)
52
I undersøgelser af ordforråd bør man skelne mellem receptivt og produktivt ordforråd.
Receptivt ordforråd er ordforråd som testdeltageren kan forstå, når han/hun læser
ordet eller lytter til ordet. Produktivt ordforråd, er ordforråd som testdeltagerne selv
kan ”producere sprog med”, dvs. ordforråd som han/hun kan bruge aktivt, dvs. bruge
verbalt eller skriftligt i en sætning.
Umiddelbart er det langt lettest at vurdere testdeltageres receptive ordforråd fordi
man ”bare” skal beslutte sig for kriterierne for, hvornår man vurderer et ord som
bekendt og hvornår man vurderer det som ubekendt. Når man undersøger produktivt
ordforråd skal testdeltageren i en eller anden grad producere sprog, dvs. skrive eller
sige en sætning for at demonstrere sit kendskab til og sin kontrol over testordet. Når
det kommer til vurdering af produktivt ordforråd er det også mere kompliceret end
vurdering af receptivt ordforråd, fordi testadministratoren skal vurdere i hvor høj grad
han/hun mener, at testdeltageren udviser kontrol over testordet. En sådan vurdering vil
altid i en eller anden grad blive subjektiv, trods alle gode intentioner om at være
objektiv.
Resultater
Jeg forelagde testen på tre forskellige gymnasier i perioden fra den 25. oktober til den
13. november 2019. Det første gymnasie, jeg besøgte, var Fjölbrautaskóli Suðurlands
(FSu) på Selfoss, hvor jeg testede to danskhold. Dernæst kom turen til Menntaskólinn
við Hamrahlíð (MH) i Reykjavik, hvor jeg ligeledes testede to forskellige danskhold. Til
slut besøgte jeg Fjölbreytaskólinn í Breiðholt (FB) også i Reykjavik, hvor jeg testede ét
danskhold. Samtlige hold, som jeg testede på, var hold, der blev undervist i obligatorisk
dansk på gymnasieniveau. Jeg indledte mit besøg med at vise og forklare hvordan
testen virkede, hvorefter testpersonerne gik i gang med at udføre selve testen. Nogle
testpersoner var utrolig hurtige til at gennemføre testen, hvilket stressede mig, fordi
jeg var bange for, at de ikke for alvor prøvede at gøre deres bedste. Ved gennemgangen
af testresultaterne viste det sig imidlertid ikke at have resulteret i direkte ubrugelige
prøver. De testdeltagere der sad i længst tid brugte alt i alt, inklusiv den forklaring jeg
startede med at give, 30 minutter på at gennemføre testen.
53
I alt deltog 104 gymnasieelever i undersøgelsen, men der var kun 96 deltagere der
gennemførte hele undersøgelsen. I det følgende vil jeg kun forholde mig til og omtale
de 96 testdeltagere som gennemførte undersøgelsen. Det er muligt at få adgang til al
data som ligger til grund for undersøgelsen ved at gå ind på:
https://www.onlineundersoegelse.dk/results/bed4fde-1bc9b9c.
Det første baggrundsspørgsmål var egentlig ikke et spørgsmål, men en mulighed for
testdeltagerne til at indsætte et dæknavn således, at han/hun efterfølgende kunne få
sit resultat af testen at se, selvom testen var anonym. Af de 96 deltagere var der 49,
dvs. godt halvdelen, der valgte at benytte sig af muligheden for brug af dæknavn. Efter
min opfattelse er det, at testdeltagerne er interesserede i deres eget resultat et tegn
på, at de tager testen alvorligt og vil gøre deres bedste, hvilket er med til at gøre det
samlede resultat af undersøgelsen mere pålideligt.
Det andet baggrundsspørgsmål var relateret til køn. Der var tre svarmuligheder;
dreng/pige/andet. Der var 37 drenge og 59 piger, der deltog i testen. Dvs. 39 pct. af
testdeltagerne var drenge og 61 pct. af testdeltagerne var piger. Spørgsmålet var først
og fremmest medtaget i undersøgelse for at se, om der var en tendens til, at det ene
køn fik bedre resultat end det andet.
Det tredje baggrundsspørgsmål angik, hvornår testdeltagerne påbegyndte
danskundervisning i grundskolen. Min fornemmelse var, da jeg var ude på skolerne for
at teste, at testdeltagerne i nogle tilfælde havde svært ved at huske det. Ifølge de
oplysninger, som testdeltagerne gav påbegyndte den største del af dem, dvs. 45 pct. af
dem danskundervisningen i 7. klasse. 28 pct. påbegyndte i 6. klasse, 20 pct. i 5. klasse
og syv pct. brugte svarmuligheden ”andet”, som i nogle tilfælde måske dækker over, at
de ikke kan huske hvornår de påbegyndte danskundervisningen i grundskolen. Alt i alt
viser resultatet, at det mest almindelige er, at danskundervisningen påbegyndes i 7.
klasse.
Det fjerde baggrundsspørgsmål gik på, om testpersonerne har gået i grundskole i
Danmark. Der er fem af de i alt 96 testdeltagere, dvs. 5 pct., der angiver at have gået i
skole i Danmark. Én havde gået i skole i Danmark i et halvt år, tre havde gået i skole i
54
Danmark i 4 år og én testdeltager i 7 år. Om det havde betydning for testdeltagernes
resultat, afhænger af hvor gamle testdeltagerne var, da de gik i skole i Danmark, og
hvor gode de har været til at holde danskkundskaberne ved lige. Jeg har brugte
oplysningerne i det afsnit, hvor jeg kommer ind på hvad der karakteriserer de
testpersoner der scorede højest i undersøgelsen.
Det femte og sidste baggrundsspørgsmål drejede sig om, om testpersonerne har en
forælder, stedforælder eller værge, der har dansk som modersmål. Her svarer fire ud af
96, eller det der svarer til fire pct. af testdeltagerne, at det har de. Om det har
betydning for testdeltagernes danskkundskaber afhænger først og fremmest af, om der
bliver talt dansk i hjemmet, da der desværre findes forældre, der ikke taler sit eget
modersmål med sine børn. Oplysningerne om, om testdeltagerne har forældre med
dansk som modersmål kommer jeg ligeledes ind på i afsnittet, hvor jeg behandler hvad
der karakteriserer de testdeltagere, der scorede højest i undersøgelsen.
Receptivt kendskab til de 30 testord
VKS forholder sig både til testdeltagernes receptive og produktive ordforråd. Jeg vil
behandle testdeltagernes receptive og produktive ordforråd hver for sig og begynde
med testdeltagernes receptive ordforråd. Da VKS består af fem spørgsmål til hvert
testord, havde jeg nogle forskellige muligheder for vurdering af, hvornår et testord var
bekendt eller ubekendt. De to første spørgsmål lader testdeltagerne lave en slags
selvrapportering om deres receptive kendskab til testordet. Jeg vil behandle
testdeltagernes svar på spørgsmål et og to under afsnittet om testdeltagernes
produktive kendskab til testordene.
Mit udgangspunkt var at vurdere et testord som bekendt, hvis testpersonen havde
oversat ordet korrekt til islandsk enten i spørgsmål tre eller fire. Da jeg gennemgik
svarene, viste det sig imidlertid, at nogle testdeltagere havde forstået opgaven sådan,
at de ikke behøvede at svare på hverken spørgsmål tre eller fire, hvis bare de svarede
på spørgsmål fem. Det endte derfor med, at jeg valgte at tælle ord som bekendte, hvis
de enten var oversat korrekt eller sætningen overbevisende viste, at eleven havde
kendskab til ordbetydningen.
55
Testens resultater kan vurderes både ud fra hvor mange testdeltagere der genkendte et
givent testord fra et givent 1000 ordniveau, men det kan også vurderes ud fra hver
enkelt deltagers scoring. Jeg vil starte med at se på hvilke scoring de enkelte testord fik.
Nedenstående søjlediagram viser testdeltagernes receptive kendskab til de enkelte
testord. Se Error! Reference source not found. i Bilag.
Figur 1 Testdeltagernes receptive kendskab til de enkelte testord
Det eneste ord, som samtlige testdeltagere kendte, var ordet person, som er af latinsk
oprindelse (www.sproget.dk) og også bruges på engelsk. Derudover ligger det islandsk
ord persóna også tæt på det dansk/engelske ord person. Man kan sige, at
testdeltagerne i tilfældet med testordet person kan hente hjælp både fra deres
kendskab til engelsk og fra eget modersmål. Ordet tilhører det første 1000 ordniveau.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
gymnastik
kysse
lektie
interesseret
badeværelse
morgenmad
søskende
dagbog
kravle
el
pludselig
brække
eksamen
tørre
idræt
slukke
æg
hyggelig
veninde
sur
kød
male
vindue
snakke
sjov
elske
mad
igennem
person
sammen
Andel af testdeltagere der havde receptivt kendskab til testordet
Test
ord
56
Der var to ord i testen der scorede 99 pct. i undersøgelsen. Det er ordet sammen, også
fra det første 1000 ordniveau, som minder en del om det islandske ord saman, men
samtidig også det ord der har den suverænt højeste forekomst blandt testordene på
fælleslisten Ekko/Glimt, hvor det har hele 96 forekomster. Det testord der har næstflest
forekomster på fælleslisten for Ekko/Glimt er ordet mad, som har 36 forekomster. Det
andet ord, der får 99 pct. er elske, som minder om det islandske ord elska og har 31
forekomster på Ekko/Glimt fælleslisten. Elske kommer, som de to andre topscorer
person og sammen, ligeledes fra det første 1000 ordniveau.
Ordene kysse og morgenmad får begge en score på 98 pct. og har derudover også det
til fælles, at de begge kommer fra det femte 1000 ordniveau. Kysse, minder om det
islandske kyssa og har 16 forekomster på Ekko/Glimt fælleslisten. Morgenmad har ni
forekomster på fælleslisten for Ekko/Glimt, og det minder om det islandske ord
morgunmatur, men jeg vil tro, at det der har største betydning for hvor høj en score
det får er, at det er et let gennemskueligt sammensat ord bestående af de to
højfrekvente ord morgen, som er nummer 354 på lemmalisten, og mad, som er
nummer 599 på lemmalisten. Set i bagklogskabens klare lys kan man sætte
spørgsmålstegn ved, om morgenmad er et velvalgt testord af de to grunde, at ordet
mad indgår som et testord et andet sted i testen og af den grund at morgenmad er et
let gennemskueligt sammensat ord bestående af to højfrekvensord. Testordet dagbog
fra det fjerde 1000 ordniveau har samme svaghed, at det er let gennemskueligt og
sammensat af de to højfrekvensord; dag, som er nummer 61 på lemmalisten, og bog,
som er nummer 191 på lemmalisten.
I øvrigt var der en tendens til, at testdeltagernes kendskab til engelsk i nogle tilfælde
forstyrrede dem eller påvirkede deres score i ordforrådstesten negativt. Det skyldes
nok til dels, at testordene blev præsenteret udenfor kontekst. Der var således fire
testdeltagere der oversatte det danske ord mad, som om det var det engelske ord mad
og derfor oversatte ordet til det islandske ord reiður, som betyder vred eller gal. Det
samme problem havde en del af testdeltagerne med testordet male, som hele atten
testdeltagere oversatte til ord, der er relaterer til det at være hankøn, dvs. de svarede
maður, karlkyn eller strákur. Man kan sige, at de to testord male og mad i en testtype
57
som VKS, hvor ordene forekommer ude af kontekst, ikke fungerer optimalt for
testpersoner, der både lærer engelsk og dansk som fremmedsprog. Ordet sjov
oversatte og anvendte én enkelt testdeltager i den engelske/danske betydning show.
Det, at de to sprog islandsk og dansk ligger tæt op ad hinanden, var i nogle tilfælde en
fordel for testdeltagerne, som bl.a. kom til udtryk i forbindelse med testordene kysse
og elske. Af og til var der dog også en tendens til, at det førte testdeltagerne på
vildspor. Testordet vindue blev i seks tilfælde oversat til vindur, det islandske ord for
vind.
Et andet testord, som testdeltagerne behandlede bemærkelsesværdigt, var ordet
interesseret fra 5000 ordniveauet, som er specielt på den måde, at det var det eneste
testord, der ikke opfyldte kravet om at forekomme mindst fem gange på fælleslisten for
Ekko/Glimt. Jeg valgte at medtage det som testord alligevel, fortrinsvis af mangel på
bedre, da jeg ikke kunne ikke finde andre adjektiver. Jeg mener godt, at jeg kan forsvare
brugen af interesseret, fordi det foruden de tre forekomster som adjektiv på
fælleslisten for Ekko/Glimt også forekommer som afledning én gang, nemlig
uinteresseret, som verbum i nutid interesserer én gang, som verbum i navneform
interessere én gang og som navneord i flertal fire gange; interesser. Alt i alt optræder
ordet syv gange i forskellige afledninger og i andre ordformer foruden de tre gange,
hvor det optræder som adjektiv. Det der var bemærkelsesværdigt ved ordet
interesseret er, at 90 pct. af testdeltagerne kender det, selvom det ikke ligner det
islandske ord áhuga. Ordet interesse kommer oprindeligt fra latin (www.ordnet.dk) og
minder om det engelske ord interest. De oversættelser som testdeltagerne lavede af
ordet interesseret var forskellige afledninger af det islandske ord áhugi. De fleste
svarede áhugamál, áhugasamt og áhugasamur. Jeg besluttede mig for, at alle svar som
var afledninger af áhugi talte som rigtige, fordi testdeltagerne efter min bedste
overbevisning ville have afkodet ordet korrekt, hvis de havde set ordet i kontekst, og
alle svar som var afledt af ordet áhugi viste, at de har kendskab til kernebegrebet.
Efter at have set på topscorerne blandt de 30 testord, er det også interessant at se på,
hvilke ord der blev bundskraberne, dvs. dem som færrest testdeltagere havde kendskab
til. Helt i bunden har vi ordet el fra det fjerde 1000 ordniveau, som kun to pct., dvs. to
58
af testdeltagerne havde kendskab til. Ordet el forekommer tretten gange på fælleslisten
for Ekko/Glimt og er egentlig en afkortelse fra svensk af ordet elektricitet
(www.sproget.dk). Mit gæt er, at der var flere testdeltagere, der ville have oversat
ordet rigtigt, hvis testordet havde været elektricitet, som stammer fra græsk og er
kommet ind i det danske sprog via fransk og ligeledes findes i det engelske sprog. Jeg er
også overbevist om, at testdeltagerne ville have scoret højere på ordet el, hvis det var
forekommet i kontekst.
En anden bundskraber var ordet brække fra det fjerde 1000 ordniveau, som kun 15 pct.
eller 14 testdeltagere havde kendskab til. Ordet forekommer fem gange på den fælles
frekvensliste for Ekko/Glimt, som ikke er et overvældende stort antal gange. Ordet
tørre fra det tredje 1000 ordniveau minder om brække. Også et verbum, men fra det
tredje 1000 ordniveau og også kun med fem forekomster på fælleslisten fra Ekko/Glimt.
Ordet tørre er der 21 testdeltagere der kender, hvilket svarer til 22 pct.
Alt i alt kan man sige, at det var en ulempe for eleverne, at testordene ikke forekom i
kontekst og at det oftest var en fordel, hvis testordet mindede om et tilsvarende eller
sammenligneligt islandsk eller engelsk ord, men at det i visse tilfælde også kunne være
en ulempe.
De enkelte testdeltageres score
Hvis vi ser på testordene som en samlet mængde havde testdeltagerne i gennemsnit
kendskab til 19 ud af de 30 testord, dvs. de havde et receptivt kendskab til knap 2/3 af
testordene. Et andet aspekt af resultatet af undersøgelsen af det receptive ordforråds
størrelse er, hvordan fordelingen er mellem de enkelte elever. Om flertallet lå på et
niveau hvor de havde kendskab til cirka 2/3 af testordene eller om der evt. var en stor
gruppe testdeltagerer, der havde et meget omfangsrigt receptivt ordforråd og en
tilsvarende stor gruppe der havde et ret begrænset receptivt ordforråd, hvilket
tilsammen gav et gennemsnit på 2/3. Hvordan fordelingen var imellem de enkelte
testdeltageres score ses i nedenstående søjlediagram. SeTabel 11 Testdeltagernes
samlede score i testen i Bilag.
59
Figur 2 Fordelingen af testdeltagernes samlede score
Hvis man ser på hvad der karakteriserer de tre testpersoner der scorede højest, som fik
29 ud af 30 rigtige, hvilket svarer til 97 pct. rigtige, så kan man se, at den ene
[62287434] er en dreng, der påbegyndte danskundervisningen i 7. klasse og hverken
har gået i skole Danmark eller har forældre med dansk som modersmål. Den anden
[62033125] er en pige, der påbegyndte danskundervisningen i 5. klasse, og hun havde
heller ikke gået i skole i Danmark eller havde forældre, der havde dansk som
modersmål. Den tredje med 29 rigtige [62795634] er ligeledes en pige, der påbegyndte
danskundervisningen i 7. klasse også uden relationer til Danmark.
Den fjerde topscorer med 28 ud af 30 rigtige, dvs. 93 pct. rigtige [62035609] er en
dreng, der svarede andet til, hvornår han begyndte at lære dansk, ikke har gået i skole i
Danmark, men til gengæld angiver at have en forælder med dansk som modersmål. Alt
i alt kan man sige, at de fire topscorer ikke har andet tilfælles, end at ingen af dem har
gået i skole i Danmark. Begge køn er repræsenteret ligeligt, dvs. to af hver, én
påbegyndte danskundervisningen i 5. klasse, to i 7. klasse og én angiver muligheden
andet.
Dernæst er det naturligt at se på hvad der karakteriserer dem, der scorer lavest i
testen. Ingen af de fem med den laveste score havde gået i skole i Danmark eller havde
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
An
tal t
estd
elta
gere
Antal ord som testdeltagerne havde receptivt kendskab til
60
en forælder med dansk som modersmål. Testpersonen med den laveste score
[62287478] fik fire ud af 30 rigtige, dvs. 13 pct. rigtige. Det er en dreng, som
påbegyndte danskundervisningen i 7. klasse. Der var én testdeltager, der fik otte
rigtige, som svarer til 27 pct. [62035597], som også er en dreng, der angiver andet til
hvornår han påbegyndte danskundervisningen. Der var tre [62287431] [62287447]
[62287419] testdeltagere, som alle er drenge, der fik ni rigtige, svarende til 30 pct. To af
drengene havde påbegyndt danskundervisningen i 7. klasse, den tredje svarede andet.
Udover at de fem lavest scorende allesammen er drenge, der ikke har gået i skole i
Danmark eller har forældre med dansk som modersmål, har de tre af dem det til
fælles, at de påbegyndte danskundervisningen i 7. klasse og de sidste to svarede andet.
Efter at have konstateret at de fem lavest scorende i undersøgelsen alle er drenge
besluttede jeg at undersøge om, der var en generel tendens til at drengene i
undersøgelsen scorede lavere end pigerne. Nedenstående søjlediagram viser
henholdsvis drenge og pigers relative score. Se Tabel 12 Testdeltagernes samlede score
i testen opdelt efter køn i Bilag.
Figur 3 Testdeltagernes samlede score i testen opdelt efter køn
Testen indeholdt som tidligere nævnt 30 testord og testdeltagere havde i gennemsnit
kendskab til 19 af testordene, dvs. omkring 2/3 af testordene. Ved aflæsning af
ovenstående tabel ses, at når man sammenligner det samlede resultat for drenge med
det samlede resultat for pigerne i relativ procent, dvs. i forhold til hvor mange
henholdsvis drenge og piger der deltog i undersøgelsen, er der en tendens til, at
0%
2%
4%
6%
8%
10%
12%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Rel
ativ
pro
cen
t af
tes
tdel
tage
re
Antal ord som testdeltagerne havde receptivt kendskab til
Drenge Piger
61
drengene generelt scorer lavere end pigerne. Hvis vi ser på hvor mange af
testdeltagerne, der har kendskab til 1/3 af testordene eller færre, dvs. har kendskab til
ti eller færre af de 30 testord, er tallet 14 pct. for drengenes vedkommende og 2 pct.
for pigernes vedkommende. Ser vi på hvor mange testdeltagere, der havde kendskab til
2/3 af testordene, dvs. har kendskab til højest 20 af de 30 testord eller færre er tallet
68 pct. for drengene og 53 pct. for pigerne. Der er altså en tendens til, at pigerne
generelt klarer testen bedre end drengene, men det er samtidig vigtigt at huske på, at
det er en forholdsvis lille undersøgelse med kun 96 deltagere. En anden ting man kan
overveje er, om pigerne generelt er mere samvittighedsfulde end drengene, og derfor
er villige til at lægge et større stykke arbejde end drengene i en ordforrådstest, som
ikke betyder noget for deres karakter i dansk. Der er selvfølgelig også den mulighed, at
pigerne generelt har et større ordforråd på dansk end drengene har.
Set med en sprogundervisers briller er det også interessant hvilke 1000 ordniveauer de
testord som testdeltagrene havde kendskab til repræsenterer.
Relative score på 1000 ordniveauerne
De 30 testord repræsenterer som tidligere nævnt de fem første 1000 ordniveauer. Der
er seks testord, der repræsenterer hvert 1000 ordniveau. Jeg vil i det følgende kigge på,
hvordan testdeltagerne scorede i de enkelte niveauer for sig. Nedenstående
søjlediagram viser den samlede testdeltagergruppes relative scoring på hvert af de fem
1000 ordniveauer. Se Tabel 13 Testdeltagernes relative score på 1000 til 5000
ordniveauerne i Bilag.
62
Figur 4 Testdeltagernes relative score på 1000 til 5000 ordniveauerne
Som det ses af søjlediagrammet, scorer testdeltagerne som forventet højest på det
første 1000 ordniveau, mindre i det andet 1000 ordniveau og andelen af rigtige falder
stødt frem til det femte 1000 ordniveau, hvor scoringen er nærmest lige så høj som i
det første 1000 ordniveau. Det er ingen overraskelse, at scoringen er højest, dvs.
elevernes kendskab er størst til det første 1000 ordniveau og at kendskabet derefter er
faldende. Overraskelsen er, at kendskabet stiger igen omkring 5000 ordniveauet og
faktisk er højere på 5000 ordniveauet end på 2000 ordniveauet. Her spiller valget af
testord måske en rolle for hvilket resultat undersøgelsen giver. Seks testord som
repræsentanter for hvert niveau er ikke meget.
Testdeltagernes score på de enkelte 1000 ordniveauer kan tolkes på flere måder. En
score på 78 pct. i det første 1000 ordniveau er ikke overvældende. Her havde jeg nok
forventet en score på mellem 90 og 100 pct. På samme måde havde jeg forventet en
højere score på det andet 1000 ordniveau, hvorimod testdeltagernes score på
henholdsvis 51 pct. og 41 pct. i det tredje og fjerde 1000 ordniveau ikke overrasker mig
synderligt. Hvis man ser på de enkelte testords score på det første 1000 ordniveau, kan
man se at ordet igennem kun scorer 24 pct. Dvs. at der er under 1/4 af testdeltagerne,
der demonstrerer receptivt kendskab til ordet. Hvis man fraregner ordet igennem fra
den samlede score i procent i det første 1000 ordniveau, dvs. udregner den som
(428/480) *100 i stedet for (451/576) *100 får man en score på 89 pct. i stedet for 78
1000 2000 3000 4000 5000
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
Ordniveauer
Rel
ativ
sco
re i
pro
cen
t
63
pct. i det første 1000 ordniveau, hvilket viser, at valget af testord kan have afgørende
betydning for resultatet af undersøgelsen. Dette gør sig i særlig grad gældende i en
undersøgelsen som denne, hvor der er få testord, hvormed hvert testord kommer til at
vægte meget i det samlede resultat.
På samme måde har det sandsynligvis også betydning for testresultatet, at de to
testord morgenmad og kysse, har de tidligere nævnte svagheder som testord, i forhold
testdeltagernes score i det femte 1000 ordniveau. Hvis man fraregner morgenmad og
kysse fra resultatet i det femte 1000 ordniveau, dvs. udregner det som (254/384) *100 i
stedet for (442/576)*100 får man en score på den femte 1000 ordniveau på 66 pct. i
stedet for 77 pct. Et resultat på 66 pct. i det femte 1000 ordniveau er stadig en stigning
i forhold til 3000 og 4000 ordniveauerne, men ikke nær så drastisk. Spørgsmålet er, om
det giver mening at ændre på resultatet ved at fraregne bestemte testord, som af den
ene eller anden grund ikke har fungeret optimalt. Det giver måske snarere mening at se
testens resultater som en tendens eller et fingerpeg om at noget forholder sig på en
bestemt måde.
En anden side af sagen er, hvilken spredning der er i størrelsen af testpersonernes
ordforråd, dvs. er der en stor gruppe der scorer omkring middelscoren på 19 ud af 30,
eller har vi at gøre med en forholdsvis stor gruppe der scorer lavt og en forholdsvis stor
gruppe der scorer højt kombineret med mere eller mindre ikke-eksisterende
midtergruppe. Hvis vi ser på hvor stor en andel af testdeltagerne der befinder sig i
feltet mellem en score på plus eller minus fem fra 19, dvs. score mellem 14 og 24 så
udgør den gruppe 72 af de 96 testdeltagere, dvs. 75 pct. af testdeltagerne. Hvis vi
indskrænker feltet til en score på plus eller minus tre fra 19, dvs. score mellem 16 og 22
er tallet 49 af 96, dvs. 51 pct. af testdeltagerne. Det resultat peger på, at vi har en
forholdsvis stor midtergruppe.
Scoring i 1000 ordniveauerne
I dette afsnit vil jeg kigge på, hvor stor en del af testdeltagerne, der har kendskab til
henholdsvis 1000, 2000, 3000, 4000 og 5000 ordniveauet. Her er tallene baseret på, at
testdeltagerne skal have nået de foregående niveauer for at nå et bestemt niveau. Dvs.
64
at de fx skal have nået både første andet og tredje 1000 ordniveau for at opnå en score
på 3000. Som jeg kom ind på i afsnittet om testdeltagernes score på de enkelte testord,
så var der visse testord, som voldte en stor del af testdeltagerne problemer. I visse
tilfælde skyldtes problemerne testens design, dvs. det at testordene blev præsenteret
udenfor kontekst. Eksempler på testord der voldte mange testdeltagere problemer er
fx testordet male, som 18 ud af 96 testdeltagere oversatte til ord, der relaterede til det
at være hankøn, som er den engelske betydning af ordet male. For at give en smule
rabat, eller rette op på, at visse testord var forbundet med problemer i undersøgelsen,
har jeg i det følgende lavet optællingen på den måde, at testpersonerne regnes for at
have fuldt kendskab til de enkelte 1000 ordniveauer, hvis de har fem eller seks ud af de
seks testord i hvert niveau rigtige. Se Tabel 14 Testdeltagernes kendskab til 1000
ordniveauerne i Bilag.
Figur 5 Testdeltagernes kendskab til 1000 ordniveauerne
Søjlediagrammet viser, at forudsat vi regner det at have mindst fem rigtige ud af seks,
er der 41 pct. af testdeltagerne, der ikke engang havde tilstrækkeligt receptivt
kendskab til det første 1000 ordniveau. 20 pct. af testdeltagerne havde fuldt kendskab
til det første 1000 ordniveau i dansk. Dvs. at ca. 60 pct. af testdeltagerne havde
udelukkende tilstrækkeligt receptivt kendskab til det første 1000 ordniveau eller
mindre end det. Det er ikke et overvældende resultat, når man tænker på, at
testdeltagerne på testtidspunktet med enkelte undtagelser, er blevet undervist i dansk i
mindst fire år i grundskolen og nogle måneder i gymnasiet. Hvis man vender tallene på
0%5%
10%15%20%25%30%35%40%45%
Pro
cen
tdel
af
test
del
tage
rne
De fem tusind ordniveauer
65
hovedet kan man glæde sig over, at der trods alt er ca. 40 pct. af eleverne, der har
kendskab både første og andet 1000 ordniveau eller mere end det.
Produktivt ordforråd
Med hensyn til at vurdere hvilket dybdekendskab testdeltagerne havde til testordene
var udfordringen at skabe overblik over resultatet. Hvis vi ser på den omfattende kritik
som Bruton (2009) gav af VKS kan man opdele kritikken i to hovedkritikpunkter, som
har haft betydning for hvordan jeg i det følgende har valgt at tolke undersøgelsens
resultater.
Det ene hovedkritikpunkt angår selve pointskalaen. Bruton mener, at den er
problematisk udformet af flere grunde. For det første fordi der i kategori tre, hvor man
giver point for korrekt oversættelse af testordet, ikke er nogen mulighed for
differentiering, dvs. testdeltagerne får lige mange point uanset, om han/hun svarer helt
præcist eller mere generelt. Det er ifølge Bruton ligeledes problematisk, at de første
fire point kun angår receptivt ordforråd og det sidste femte point kun angår produktivt
ordforråd. Derudover mener Bruton, at det er problematisk, at der sker en
sammenblandingen af vurderingen af receptivt og produktivt ordforråd, da scoren fem
er et udtryk for begge dele. Han mener, det er problematisk at der kun er ét points
forskel på, om man kan oversætte eller finde et korrekt synonym til et testord eller om
man ikke kan. Og på samme måde kun ét points forskel på, om man kan bruge ordet
semantisk korrekt eller om man kun kan oversætte eller finde synonym. Dette ene
hovedkritikpunkt som Bruton anfører kan jeg godt følge, men i mine øjne er det at
teste dybdekendskab af ordforråd ekstremt kompliceret. I mangel af et bedre
testværktøj, har jeg valgt i min vurdering af testpersonernes dybdeviden at bruge den
pointskala som Paribakht and Wesche (1997) foreslår med det i mente, at den har de
svagheder som Bruton anfører.
Det andet hovedkritikpunkt, som Bruton (2009) påpeger, er i relation til hvordan man
omsætter testresultaterne fra VKS til statistik. Kritikken fra Bruton går på, at lignende
resultater i total score kan dække over vidt forskellige kombinationer af svar. Og her er
muligvis det største kritikpunkt fordi Bruton ikke mener, at testdeltagernes scoring i
66
testen eller nogen form for gruppering af scoringer i testen giver mening. Bruton
mener, at testen fejler netop på det punkt som var VKS hovedformål, nemlig at
rapportere om udvikling i testdeltagernes dybdekendskab til testordene. Bruton mener,
at total score pr. deltager kun potentielt giver mening. Bruton mener ligeledes, at det
er meningsløst at udregne totalscore pr. Ord, da det ville give en tvetydig relativ værdi.
Det samme gør sig gældende med hensyn til at udregne total score pr. testdeltager
eller testdeltagergruppe. Det ville i alle tilfælde give et svar, som kan dække over et utal
af kombinationsmuligheder. Bruton konkluderer, at VKS i bedste fald kan anvendes til at
vurdere udvikling pr. kategori over tid.
Jeg kan godt følge den kritik Bruton (2009) giver VKS, men vil på den anden side heller
ikke helt forkaste ideen om, at VKS kan give et indblik i testdeltagernes dybdekendskab
til testordene. Det Bruton anfører som værende det VKS er bedst til, nemlig at følge
udviklingen i testdeltagernes dybdekendskab til testordene over tid, var ikke muligt og
heller ikke hensigten med undersøgelsen i denne opgave. Min hensigt var at undersøge
og give et øjebliksbillede af eleverne i den obligatoriske danskundervisnings kvalitative
og kvantitative ordforrådsviden. Det jeg har valgt at gøre for at få et overblik over
testdeltagernes dybdeviden om testordene er, at jeg har udvalgt ét testord fra hvert
1000 ordniveau og analyseret testdeltagernes svar med de fem points kategorier der
tilhører VKS, for på den måde at skabe overblik over, hvilken grad af dybdeviden
testdeltagerne havde til testordet. Med andre ord, jeg har valgt ét ord fra hvert 1000
ordniveau og undersøgt hvor mange gange det fik henholdsvis et, to, tre, fire eller fem
point for testdeltagernes svar.
Det ord jeg valgte at undersøge fra det første 1000 ordniveau, var ordet sammen. Jeg
havde seks ord at vælge mellem; sammen, person, igennem, mad, elske og sjov. Min
umiddelbare idé var at undersøge testpersonernes dybdeviden for det ord i hvert 1000
ordniveau, der havde fået højest score i den receptive del af testen. Grunden til, at jeg
helst ville undersøge det ord som flest testdeltagere kendte til i hvert 1000 ordniveau
var, at desto flere testpersoner der kendte til ordet, desto større spredning havde jeg
mulighed for at se i svarene. Hvis jeg fx havde valgt at undersøge testdeltagernes
dybdeviden om ordet el fra det fjerde 1000 ordniveau, som kun to testdeltagere kendte
receptivt, ville det være svært at beskrive en tendens. I det første 1000 ordniveau var
67
det ord med den højeste score, som samtidig er det eneste ord i undersøgelsen som
samtlige testdeltagere kendte receptivt, imidlertid ordet person, som også findes på
engelsk. Da ordet findes på engelsk, ville jeg måske ikke helt kunne regne med
resultatet, fordi jeg ikke kunne være sikker på, om elevernes dybdeviden om ordet
person på engelsk ville smitte af på deres dybdeviden om ordet på dansk. De to øvrige
ord i det første 1000 ordniveau, som scorede højest, var ordene sammen og elske. Elske
minder om det islandske ord elska, og kunne derfor smitte af på testdeltagernes
dybdekendskab til ordet på islandsk, hvorfor valget faldt på testordet sammen, som
også er det mest højfrekvente ord i hele undersøgelsen, da det er nr. 97 på
lemmalisten. Se Tabel 15 Testdeltagernes dybdekendskab til testordet; sammen i Bilag.
Testpersonernes scoring på adverbiet sammen ses i nedenstående søjlediagram.
Figur 6 Testdeltagernes dybdekendskab til testordet; sammen
Der var 95 testdeltagere, dvs. 99 pct. af testdeltagerne viste receptivt kendskab til
ordet ved at oversætte det korrekt til islandsk. Det stemmer ikke helt med
selvrapporteringen, hvor 8 pct. svarer, at de ikke kan huske at have set ordet før, og 6
pct. svarer, at de kan huske at have set ordet før, men ikke kan huske hvad det betyder.
I 2000 ordniveauet kunne jeg vælge mellem de seks testord: snakke, vindue, male, kød,
sur og veninde. Den absolutte topscorer på 2000 ordniveauet er verbet snakke, som 89
testdeltagere, dvs. 93 pct. af testdeltagerne havde receptivt kendskab til. På
andenpladsen kom ordet vindue, som 73 testdeltagere, dvs. 76 pct. havde kendskab til.
Se Tabel 16 Testdeltagernes dybdekendskab til testordet; snakke i Bilag.
Testpersonernes scoring på verbet snakke ses i nedenstående søjlediagram.
0
10
20
30
40
50
60
70
80
1 2 3 4 5
An
tal t
estd
elta
gere
Score på fempointsskalaen
68
Figur 7 Testdeltagernes dybdekendskab til testordet; snakke
Der var 89 testdeltagere, dvs. 93 pct. der viste receptivt kendskab til ordet ved at
oversætte det korrekt til islandsk. Det stemmer fint overens med selvrapporteringen,
hvor én pct. svarer, at de ikke kan huske at have set ordet før, og seks pct. svarer, at de
kan huske at have set ordet før, men ikke kan huske hvad det betyder.
Hvis man sammenligner scoringsfordelingen mellem de to ord sammen og snakke kan
man se, at flertallet af testpersonerne scorer fem point ved ordet sammen. Den anden
store gruppe scorer tre point. Groft sagt kan man sige, at der var to typer af
dybdekendskab til ordet sammen. Der var dem der kun kunne oversætte ordet, og der
var dem der kunne bruge det semantisk og grammatisk korrekt i en sætning. Ved ordet
snakke er der sammenlignet med ordet sammen langt flere testpersoner der scorer
fire. Det skyldes, at verbet snakke kan bøjes i modsætning til adverbiet sammen. Dvs.
at de testpersoner der viste, at de kunne bruge ordet snakke i en sætning for de flestes
vedkommende gjorde det semantisk korrekt, men de bøjede ordet forkert, hvorfor de
alligevel kun scorede fire. Et typisk svar der fik fire point, var sætninger, der lød i
retning af ”jeg snakke med mine venner”. Set med den viden i baghovedet, at de fleste
af dem der scorede fire ved ordet snakke gjorde det, fordi de bøjede ordet forkert, er
der ikke den store forskel på testdeltagernes dybdeviden om de to ord sammen og
snakke.
I det tredje 1000 ordniveau er der ligeledes seks testord, som jeg kan vælge at
undersøge testpersonernes dybdeviden om; hyggelig, æg, slukke, idræt, tørre og
eksamen. Ordet hyggelig er topscoren med 82 testpersoner, dvs. 85 pct. der har
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5
An
tal t
estd
elta
gere
Score på fempointsskalaen
69
receptivt kendskab til ordet og eksamen kommer på andenpladsen med scoren 68, dvs.
71 pct. Da hyggelig både er topscorer og det eneste adjektiv blandt topscorerne valgte
jeg at undersøge det. Se Tabel 17 Testdeltagernes dybdekendskab til testordet; hyggelig
i Bilag. Testpersonernes scoring på adjektivet hyggelig ses i nedenstående
søjlediagram.
Figur 8 Testdeltagernes dybdekendskab til testordet; hyggelig
Der var 82 testdeltagere, dvs. 85 pct. der viste receptivt kendskab til ordet hyggelig ved
at oversætte det korrekt til islandsk. Det stemmer ikke helt overens med
selvrapporteringen, hvor seks pct. svarer, at de ikke kan huske at have set ordet før, og
19 pct. svarer, at de kan huske at have set ordet før, men ikke kan huske hvad det
betyder. Testdeltagerne lavede typisk den fejl i deres sætninger, at de ikke bøjede
adjektivet hyggelig korrekt. De skrev typisk ”det er hyggelig hjemme”. På den måde
ligner fejltypen ved testordet hyggelig fejltypen ved testordet snakke, som også ses når
man sammenligner søjlediagrammet over testdeltagernes scoringer på de to ord.
I det fjerde 1000 ordniveau er testordene; brække, pludselig, el, kravle, dagbog og
søskende. De to topscorer er dagbog og søskende begge med scoren 87, dvs. 91 pct. Da
dagbog som tidligere nævnt minder om det islandske ord dagbog og i øvrigt er
sammensat af to højfrekvente navneord, valgte jeg at undersøge ordet søskende. Ordet
søskende har imidlertid den ulempe, at det kun findes i plural, dvs. testpersonerne har
ikke mulighed for at demonstrere viden, eller mangler på samme, om bøjningen af
ordet, hvilket giver mindre mulighed for difference i svarene. Et argument der tæller for
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5
An
tal t
estd
elta
gere
Score på fempointsskalaen
70
at vælge søskende er, at navneordene udgør den største del af testordene, hvorfor det
giver mening at undersøge testdeltagerens dybdeviden om netop et navneord. Se Tabel
18 Testdeltagernes dybdekendskab til testordet; søskende i Bilag. Testpersonernes
scoring på navneordet søskende ses i nedenstående søjlediagram.
Figur 9 Testdeltagernes dybdekendskab til testordet; søskende
Der var 87 testdeltagere, dvs. 91 pct. der viste receptivt kendskab til ordet søskende
ved at oversætte det korrekt til islandsk. Hvis vi sammenligner det med
selvrapporteringen, angav fem pct. af deltagerne, at de ikke kunne huske, at de havde
set ordet før, og otte pct. angav, at de havde set ordet før, men ikke kunne huske hvad
det betyder. De tal stemmer nogenlunde overens med, at 91 pct. af testdeltagerne
demonstrerede kendskab til ordet, hvis vi antager, at der er overlap mellem dem der
svarer positivt til, at de ikke kan huske at have set ordet før, og dem der kan huske at de
har set ordet før, men ikke kan huske hvad det betyder.
I det femte 1000 ordniveau er testordene; morgenmad, badeværelse, interesseret,
lektie, kysse og gymnastik. Morgenmad og kysse er topscorer begge med 94
testdeltagere, dvs. 98 pct., der har receptivt kendskab til ordene. Som tidligere nævnt
har morgenmad den ulempe som testord, at det er sammensat af to højfrekvente
navneord og ligesom kysse minder det om det tilsvarende ord på islandsk. Da
navneordene udgør den største ordgruppe på lemmalisten, og i alle 1000 ordniveauer,
bortset fra det første udgør over 50 pct. af ordene vil jeg gerne undersøge
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5
An
tal t
estd
elta
gere
Score på fempointsskalaen
71
testdeltagernes dybdeviden om endnu et navneord. Badeværelse er ligesom
morgenmad et sammensat ord, hvilket muligvis kan påvirke resultatet, hvilket lod mig
tilbage med testordet lektie, som kun 34 testdeltagere, dvs. 35 pct. havde receptivt
kendskab til. Se Tabel 19 Testdeltagernes dybdekendskab til testordet; lektie i Bilag.
Testpersonernes scoring på navneordet lektie ses i nedenstående søjlediagram.
Figur 10 Testdeltagernes dybdekendskab til testordet; lektie
Der var 34 testdeltagere, dvs. 35 pct. der viste receptivt kendskab til testordet lektie.
Hvis vi sammenligner tallene med selvrapporteringen ser vi, at 42 pct. angiver, at de
ikke har set ordet før og 32 pct. angiver, at de har set det før, men ikke kan huske hvad
det betyder. De oplysninger passer ikke rigtigt sammen, med mindre vi forudsætter, at
der er overlap mellem dem, der siger de ikke har set ordet før og dem der siger de har
set ordet før, men ikke kan huske hvad det betyder.
Opsummerende kan man sige om testdeltagernes produktive ordforråd, at den score
testdeltagerne fik i de enkelte testord afhang af, om ordet kunne bøjes eller ikke.
Adverbiet sammen fra det første 1000 ordniveau kan ikke bøjes og 67 af de 96
testdeltagere, dvs. 70 pct. af testdeltagerne scorede fem på det testord. Den samme
tendens gør sig gældende for testordet søskende, som heller ikke kunne bøjes. Her er
der ligeledes flest testdeltagere der scorer fem, eller 44 af 96 testdeltagere, hvilket
svarer til 46 pct.
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5
An
tal t
estd
elta
gere
Score på fempointsskalaen
72
Ser man på testordet lektie fra det femte 1000 ordniveau, kan man tydeligt se en
forskel i scoren i forhold til de andre testord. Her befinder 39 testdeltagere sig i
kategori et og 24 testdeltagere befinder sig i kategori to. Både kategori et og to
repræsenterer, at testdeltageren ikke kender ordets betydning. Dvs. at sammenlagt er
der 63 af de 96 testdeltagere, dvs. 66 pct. der angiver ikke at have kendskab til
betydningen af testordet lektie. Det er et højt tal sammenlignet med de fire øvrige
testord, som jeg undersøgte i forbindelse med elevernes dybdekendskab til ordet, men
tallet afspejler udmærket, at der i den receptive del af testen var 35 pct. af
testdeltagerne, der viste receptivt kendskab til ordet.
Med hensyn til den del af testen der omhandler testdeltagernes selvrapportering,
kommer det til udtryk i, om de vælger at svare et eller to, dvs. om de angiver, at de ikke
har set ordet før eller om de har set ordet før, men ikke ved hvad det betyder. Det
kommer ligeledes til udtryk i, om de vælger at svare på spørgsmål tre eller fire, eller
svarer på dem begge eller ikke svarer på nogen af dem og i stedet bruger ordet korrekt
i spørgsmål fem. Alt i alt var der så mange overlap i testdeltagernes svar, at jeg ikke
mener at kunne bruge svarene til at drage nogen konklusion af den del af testen. Om
det skyldes, at min instruktion af testdeltagerne har været mangelfuld eller om det
skyldes at selve testen ikke er designet optimalt er svært at svare på.
Opsummering af testresultater
Samlet set kan man sige, at resultaterne af undersøgelsen blev anskuet fra forskellige
vinkler i ovenstående afsnit. Først så jeg på hvilke af de 30 testord flest testdeltagere
havde receptivt kendskab til, og hvordan testdeltagernes relative score var på de fem
forskellige 1000 ordniveauer. Dernæst så jeg på, hvor stor en del af testdeltagerne der
havde kendskab til henholdsvis første, første og andet 1000 ordniveau op til og med
5000 ordniveauet. Efterfølgende så jeg på de enkelte testdeltagere og hvad der
karakteriserede dem der scorede højest og lavest og hvordan scoringsfordelingen var
indenfor gruppen. Afslutningsvis så jeg på testdeltagernes dybdekendskab til
testordene.
Først kiggede jeg på bredden af den samlende gruppe testdeltageres ordforråd. Dvs.
hvilke af de 30 testord havde flest testdeltagere receptivt kendskab til. Her var
73
resultatet, at testdeltagerne som gennemsnit havde receptivt kendskab til 19 af de 30
testord, dvs. de havde receptivt kendskab til knap 2/3 af testordene. De ord som
næsten alle testdeltagere havde kendskab til, dvs. mellem 98 og 100 pct. af
testdeltagerne, var ordene sammen, elske og person fra det første 1000 ordniveau
samt kysse og morgenmad fra det femte 1000 ordniveau.
Efterfølgende kiggede jeg på de enkelte testdeltagere hver for sig. Hvad karakteriserede
dem der scorede højest i testen og hvad karakteriserede dem der scorede lavest. Her
var resultatet, at dem der scorede højest, var karakteriseret ved at være en ligelig
fordeling mellem drenge og piger, én påbegyndte danskundervisningen i 5. klasse, to i
7. klasse og én angiver muligheden andet. Ingen af dem havde gået i skole i Danmark,
men den testdeltager som kom på fjerde pladsen angav at have en forælder, der har
dansk som modersmål.
De fem testdeltagere der scorede lavest i undersøgelsen var karakteriseret ved alle
sammen at være drenge, der ikke har gået i skole i Danmark eller har forældre med
dansk som modersmål. Tre af dem har det til fælles, at de påbegyndte
danskundervisningen i 7. klasse og de sidste to svarede andet.
Hvad angår hvor stor spredningen der er på størrelsen af testdeltagernes ordforråd, er
der en forholdsvis stor gruppe, der scorer omkring middelscoren på 19 ud af 30. Hvis vi
ser på hvor stor en andel af testdeltagerne der befinder sig i feltet mellem en score på
plus eller minus fem fra gennemsnittet på 19 udgør de 75 pct. af testdeltagerne. Det
resultat peger på, at vi har en forholdsvis stor midtergruppe.
Hvad angår hvor stor en del at testdeltagerne, der ikke havde kendskab til det første
1000 ordniveau, var tallet 41 pct. Der var 20 pct. af testdeltagerne der udelukkende
havde kendskab til det første 1000 ordniveau. Der var 19 pct. af testdeltagerne, der
havde kendskab til både første og andet 1000 ordniveau. Der var 14 pct. af
testdeltagerne, der havde kendskab til første, andet og tredje 1000 ordniveau. Ingen
testdeltagere havde udelukkende kendskab til første, andet, tredje og fjerde niveau,
men til gengæld var der 7 pct. af testdeltagerne, der havde kendskab til både, første,
anden, tredje, fjerde og femte 1000 ordniveau. Lidt forsimplet kan man sige, at ca. 60
74
pct. af testdeltagerne udelukkende har styr på det første 1000 ordniveau eller mindre
end det.
Hvad angår undersøgelsen af testdeltagernes dybdekendskab til testordene, ser man,
at testdeltagernes score afhænger af to ting. For det første hvor stor en del af
testdeltagerne der har receptivt kendskab til ordet, som igen hænger sammen med
hvilket 1000 ordniveau ordet tilhører, da testdeltagerne generelt havde et større
receptivt kendskab til ordene i de første 1000 ordniveauer. Det andet der er afgørende
for, hvordan scoringsfordelingen er mellem de fem kategorier afhang af, om ordet
kunne bøjes eller ikke. Hvis ordet ikke kunne bøjes, var der en større andel af eleverne,
der kunne producere en semantisk og grammatisk korrekt sætning med ordet. Hvis
ordet kunne bøjes, hvorved der kunne opstå fejl i bøjningen, var der risiko for, at
testdeltageren kun ville få fire point i stedet for fem, selvom han/hun havde brugt
ordet i en sætning.
Sammenligner man testdeltagernes selvrapportering om deres kendskab til testordene
med scoringerne i dybdekendskabsdelen er der i visse tilfælde et vist sammenfald
mellem hvad testdeltagerne selv angiver og hvad de siden demonstrerer i spørgsmål
tre til fem. I andre tilfælde var der ikke signifikant sammenfald. Af den grund mener jeg
ikke at kunne drage nogen egentlig konklusion angående testdeltagernes
selvrapportering andet end, at det er tvivlsomt om man kan regne med den.
Der er en generel tendens i testresultaterne til overlap mellem de fem kategorier. Dvs.
at testdeltagerne fx både svarer ja til spørgsmål et; jeg kan ikke huske at have set dette
ord før og samme testdeltager svarer måske også ja til spørgsmål to; jeg har set dette
ord før, men jeg kan ikke huske hvad det betyder. Det er modstridende at svare ja til
både spørgsmål et og to. På samme måde er der en del testdeltagere der svarer både
på spørgsmål tre; jeg har set dette ord før, og jeg tror det betyder... og fire; jeg kender
dette ord, det betyder... De testdeltagere der har svaret på både tre og fire har sikkert
gjort det for at være pligtopfyldende, men idet de svare på begge spørgsmål, mister jeg
som testadministrator muligheden for at differentiere mellem om testdeltagrene tror
de kender testordet eller ved de kender testordet. Derudover var der også eksempler
på testdeltagere, der udelukkende svarede på spørgsmål fem; jeg kan bruge dette ord i
75
en sætning... De testdeltagere der udelukkende svarede på spørgsmål fem, dvs.
anvendte testordet i en sætning på dansk, gjorde det til gengæld generelt med en
sådan overlegenhed, at man som testadministrator ikke var i tvivl om, at de havde
kendskab til og kontrol over brugen af testordet.
76
Diskussion
Jeg er særligt godt tilfreds med det baggrundsarbejde jeg fik lavet forud for
udvælgelsen af testordene, dvs. den del hvor jeg lavede frekvensanalyse af
undervisningsbøgerne Ekko og Glimt og sammenkørte den fælles frekvensliste af de to
bøger med lemmalisten. Det var ærgerligt, at jeg blev nødt til at forkorte testens
længde fra 50 ord til bare 30 ord, men rent praktisk var det en god beslutning, da
testen ellers ville have været for lang for testdeltagerne at gennemføre. Hvis jeg havde
brugt den udgave af testen som havde 50 testord ville det sandsynligvis have medført,
at en endnu større del af testdeltagerne ikke ville have gennemført testen, eller at de
ville have gjort det halvhjertet bare for at få det overstået, hvilket ville have gjort
resultatet mindre pålideligt. I. S. P. Nation (2013) henviser til at en god ordforrådstest
indeholder mange testord og anfører, at 30 testord sandsynligvis er minimum antal for
en pålidelig ordforrådstest, hvormed testen der blev brugt i denne undersøgelse lige
præcis opfylder kravene.
I udvælgelsen af testordene er der som tidligere nævnt nogle ord, som jeg efter at have
set undersøgelsens resultater måske burde have fravalgt. Et ord som person, der er
sammenfaldende med det engelske ord person og minder meget om det islandske ord
persóna var det eneste ord som samtlige testdeltagere havde receptivt kendskab til.
Alligevel er testordet person ikke et af de testord, som jeg ”fortryder” om man så at
sige, fordi det afspejler virkeligheden som den er, forstået på den måde, at der er en
mængde af ord, som minder om hinanden eller er sammenfaldende mellem enten
engelsk og dansk eller mellem dansk og islandsk. Af testord der minder om hinanden
på dansk og islandsk kan nævnes elske, sammen og kysse, men dem mener jeg heller
ikke, at der er grund til at sætte spørgsmålstegn ved som gode testord. Derimod kan
der måske sættes spørgsmålstegn ved de tre testord, som er sammensatte navneord;
dagbog, badeværelse og morgenmad, fordi det evt. kan påvirke resultatet, at ordene er
nemt gennemskuelige sammensatte navneord, og de ord som testordene er
sammensatte af, er navneord, som ligger meget højt på lemmalisten, og de derfor ikke
kan ses som ”ægte repræsentanter” for det 1000 ordniveau, som de befinder sig på.
Under alle omstændigheder burde testordet morgenmad måske ikke have været med i
testen, fordi ordet mad optræder som testord andetsteds i testen, hvorved
77
testdeltagerne kan få dobbelt point eller halvanden gange point for det samme testord
under forudsætning af, at de oversætter ordet ens i begge tilfælde.
Hvad angår testordene mad og male, hvor især male voldte en stor del af
testdeltagerne problemer, da de oversatte ordet til den engelske betydning hankøn, så
er det nok desværre en af de svagheder VKS har, at den præsenterer testordene
udenfor kontekst. Jeg må ærligt indrømme, at jeg ikke havde forudset, at de to ord ville
kunne blive opfattet af eleverne i engelsk betydning. Og hvis ordene var blevet
præsenteret i kontekst, var det givetvis ikke sket. Jeg overvejede i udarbejdelsen af
testen, om jeg skulle angive testordets ordklasse i parentes efter ordet, men besluttede
ikke at gøre det, da jeg var bange for, at det ville forvirre unødigt.
Hvad angår brugen af VKS som testtype er min mening, at den med fem spørgsmål til
hvert testord, er uforholdsmæssig omfattende i forhold til resultatet. Det skal forstås på
den måde, at det er ret omfattende, at testdeltagerne bliver stillet over for fem
spørgsmål til hvert eneste testord, når det så efterfølgende viser sig, at det kun er en
del af svarene på de fem spørgsmål, der giver et reelt billede af testdeltagerens
kendskab til testordet. Her henviser jeg til, at der i resultatet af min undersøgelse ikke
kom noget brugbart resultat ud af selvrapporteringen i spørgsmål et og to, da der var
for mange overlap. Det samme gjorde sig gældende med spørgsmål tre og fire, hvor jeg
heller ikke kunne drage nogle slutninger ud fra om testdeltagerne havde svaret på
spørgsmål tre, fire, begge to eller ingen af dem. Set i lyset af det resultat, som jeg fik af
min undersøgelse, kunne man lige så godt have nøjes med bare to spørgsmål eller
opgaver, som kunne lyde noget i retning af; oversæt ordet til islandsk hvis du kan og
skriv en sætning på dansk, hvor du bruger ordet. På den måde havde man sikkert kunne
teste flere ord på den samme mængde tid og havde sandsynligvis fået mere eller
mindre samme resultat.
Her er vi tilbage til den kritik som Bruton (2009) gav af VKS. Han henviser til, at
Paribakht and Wesche (1993) og Paribakht and Wesche (1997) slog
scoringskategorierne sammen til to, dvs. Kendt eller ubekendt i den kvantitative del af
ordforrådstesten. Det passer fint overens med de erfaringer jeg fik ved brugen af VKS
som testform.
78
Perspektivering
Undersøgelsen belyser flere aspekter af testdeltagernes ordforråd på dansk. Den
oplysning som man rent praktisk, som underviser, kan bruge til mest er resultatet, der
viser, at hele 41 pct. af testdeltagerne ikke engang havde tilstrækkeligt kendskab til det
første 1000 ordniveau og 20 pct. af testdeltagerne kun havde tilstrækkeligt kendskab til
det første 1000 ordniveau. Det vil sige, at der sidder en gruppe på godt 60 pct. at
eleverne i den obligatoriske danskundervisning, som kun har styr på det første 1000
ordniveau eller mindre end det. Der er en gruppe på knap 20 pct. som har tilstrækkeligt
receptivt kendskab til det første og andet 1000 ordniveau. Der var 14 pct. af
testdeltagerne, som havde tilstrækkeligt receptivt kendskab til det første, andet og
tredje 1000 ordniveau og syv pct. havde kendskab til alle fem 1000 ordniveauer. De
oplysninger peger rent praktisk i retning af, at det ville være gavnligt for eleverne, hvis
der ville blive gjort en målrettet indsats i forhold til, at hovedparten af eleverne, dem
der ikke allerede har det, kan få styr på de hyppigste 2000 ord på dansk. Indsatsen bør,
til at starte med, fokusere på de mest hyppige 1000 ord i dansk, og bør efterfølgende
udvides til de hyppigste 2000 ord i dansk.
Set i lyset af, at testdeltagerne på testtidspunktet har modtaget danskundervisning i
grundskolen i mindst fire år og har færdiggjort godt halvdelen af det ene semesters
obligatoriske danskundervisning i gymnasiet, er det nok hverken realistisk eller
anbefalelsesværdigt at påbegynde undervisning i ordforråd i akademisk dansk i den
obligatoriske danskundervisning i gymnasiet.
Undersøgelsens resultat, der viser at godt 60 pct. af testdeltagerne kun havde
kendskab til det første 1000 ordniveau eller mindre, kan være en del af forklaringen på
det fænomen, som jeg af og til stødte på hos mine tidligere elever. At de gav udtryk for,
at de ikke syntes, at de kunne ret meget på dansk til trods for, at de var elever, som
generelt klarede sig godt i de prøver og opgaver, som de blev bedt om at løse i
forbindelse med undervisningen. Stæhr (2013) påpeger:
Størrelsen af elevers ordforråd har vist sig at være en god indikator af deres generelle sproglige
kompetence på et fremmedsprog (Stæhr, 2013, p. 195).
79
Hvis vi sammenholder testdeltagernes mangelfulde kendskab til de første to 1000
ordniveauer, havde de elever som jeg refererede til ovenfor muligvis ret, når de gav
udtryk for, at de ikke følte, at de kunne ret meget på dansk. Grunden dertil kan være, at
de ikke har tilstrækkeligt kendskab til ordforrådet på de to hyppigste 1000 ordniveauer
på dansk.
At godt 60 pct. af testdeltagerne kun havde kendskab til det første 1000 ordniveau eller
mindre efter fire års danskundervisning i folkeskolen og nogle måneders
danskundervisning i gymnasiet tyder på, at Henriksen (2009) har ret, når hun påpeger,
at der foregår for lidt planlagt og systematisk undervisning i ordforråd, og at
sprogundervisere har en tendens at tro, at eleverne, når de er kommet ud over
begynderniveau, primært udvikler deres ordforråd ved at læse meget. En anden ting,
som Henriksen (2009) beskriver som et problem i forhold til at styrke udviklingen af
elevernes ordforråd, er noget jeg selv som underviser kan nikke genkendende til; at
man som underviser har en tendens til at vælge en tekst eller andet
undervisningsmateriale på baggrund af indholdet fordi emnet er interessant eller
relevant for elevgruppen og i den sammenhæng lader man ordforrådet komme i anden
række. Dertil kommer at man, som underviser i gennemgangen af teksten, ofte vil
fokusere på, at eleverne forstår nøgleordene i teksten, men ellers lader det være op til
dem selv at spørge, hvis der er nogle ord de ikke forstår.
Spørgsmålet er, hvordan man som underviser i dansk i gymnasiet og som
sprogunderviser i det hele taget, helt konkret kan føre den systematiske og planlagte
undervisning i ordforråd ud i livet. Heller ikke her hænger de lette løsninger på
træerne. Som Henriksen (2009) formulerer det:
Vi savner således både kriterier for udvælgelse af det relevante ordstof, samt for valg af arbejdsformer,
der målrettet fokuserer på ordforrådet (Henriksen, 2009, p. 72).
I den sammenhæng er det vigtigt at huske på, at selvom godt 60 pct. af eleverne kun
havde tilstrækkeligt receptivt kendskab til det første 1000 ordniveau eller mindre, er
der samtidig en gruppe på ca. 40 pct. som har tilstrækkeligt kendskab til både første og
andet 1000 ordniveau eller mere, og den gruppe skal også have udfordringer og
arbejde på at forbedre sit ordforråd.
80
Konklusion
Denne opgave omhandler en undersøgelse af, hvor stort et ordforråd eleverne har på
dansk, når de er i gang med den obligatoriske danskundervisning i gymnasiet. På
baggrund af den undersøgelse, som jeg lavede i forbindelse med dette speciale, er
svaret, at 41 pct. af eleverne ikke en gang har tilstrækkeligt receptivt kendskab til de
første 1000 hyppigst forekomne ord på dansk. At 20 pct. af eleverne kun har kendskab
til det første 1000 ordniveau. At 19 pct. af eleverne har tilstrækkeligt receptivt
kendskab til både det første og andet 1000 ordniveau, imens 14 pct. af eleverne har
tilstrækkeligt receptivt kendskab til både det første, andet og tredje 1000 ordniveau, og
7 pct. af eleverne har kendskab til både første, andet, tredje, fjerde og femte 1000
ordniveau. Resultatet er umiddelbart skuffende set i det lys, at eleverne på
testtidspunktet, for langt de flestes vedkommende, har modtaget undervisning i dansk
i grundskolen i mindst fire år og dertil er over halvvejs i den obligatoriske
danskundervisning i gymnasiet.
Hvis man sammenligner med oversigten, som er omtalt i afsnittet Hvor mange ord man
skal kunne over hvor mange ord man skal have kendskab til for at kunne udføre
forskellige opgaver på målsproget fx for at forstå talt sprog, for at kunne forstå en
børnefilm eller læse en roman eller en avis, er der med den størrelse af ordforråd, som
denne undersøgelse indikerer, at eleverne har, langt i land før eleverne reelt kan bruge
sproget til ret meget i praksis, hvilket er ærgerligt. Man kan dog håbe på, at man som
underviser ved at arbejde målrettet med at øge elevernes kendskab til de hyppigst
forekomne 2000 ord på dansk, kan løfte deres kundskaber markant. Hvis man skal se
på resultatet af undersøgelsen med positive øjne, som bekendt er den bedste måde at
betragte verden på, er de gode nyheder, at der trods alt var ca. 40 pct. af eleverne som
havde kendskab til de 2000 hyppigst forekomne ord eller mere på dansk.
81
Litteraturliste
Aðalnámskrá Framhaldsskóla 2011 - almennur hluti. (2012). Reykjavik, Island:
Mennta- og menningarmálaráðuneyti
Albrechtsen, D., Haastrup, K., & Henriksen, B. (2008). Vocabulary and Writing in a
First and Second Language. New York, USA: Palgrave Macmillan.
Ásdís Lovísa Grétarsdóttir, & Erna Jessen. (2009). Ekko Læsebog. Kópavogur, Island:
Námsgagnastofnun.
Auður Hauksdóttir. (2012). Dansk som fremmedsprog i en akademisk kontekst - om
islændinges behov for danskkundskaber under videreuddannelse i Danmark.
København, Danmark: Københavns Universitets Humanistiske Fakultet.
Brink, E. T. (2016). Man skal bare kaste sig ud i det... - En interviewundersøgelse af
unge i Nordens nabosprogsforståelse i praksis. København, Danmark.
Brodersen, R. B., Stefánsdóttir, B., & Monrad, J. (2015). Glimt - ny litteratur på dansk.
Reykjavik, Island: Iðnú Útgáfa.
Bruton, A. (2009). The Vocabulary Knowledge Scale: A Critical Analysis. Language
Assessment Quarterly, 6, 288–297. doi: 10.1080/15434300902801909
Coxhead, A. (2000). A new academic word list. TESOL QUARTERLY, 34(2), 213-238.
Henriksen, B. (2009). Ordforråd og ordforrådsindlæring. In A. Holmen, Lund, K. (Ed.),
Studier i dansk som andetsprog (pp. 71-106).
Henriksen, B. (2018). Fokus på ordforråd i alle sprogfag.
Hill, M., & Laufur, B. (2003). Type of task, time-on-task and electronic dictionaries in
incidental vocabulary acquisition. IRAL, 41(2), 87-106.
Hyland, K., & Tse, P. (2007). Is There an "Academic Vocabulary"? TESOL
QUARTERLY, 41(2), 35-253.
Jakobsen, A. S. (2017). From implicit norms to explicit skills - focusing on Danish
academic vocabulary. Oslo Studies in Language, 9(3), 59–76.
Jakobsen, A. S., Coxhead, A., & Henriksen, B. (2018). General and academic high
frequency vocabulary in Danish. Nordand, 13(1-2018), 64-89.
doi:10.18261/issn.2535-3381-2018-01-04
Kremmel, B. (2016). Word Families and Frequency Bands in Vocabulary Tests:
Challenging Conventions. TESOL QUARTERLY, 50(4), 976-987.
Nation, I. S. P. (2013). Learning Vocabulary in Another Language. New York, USA:
Cambridge University Press.
Nation, P. (2012). The Vocabulary Size Test:
82
https://www.wgtn.ac.nz/lals/about/staff/Publications/paul-nation/Vocabulary-
Size-Test-information-and-specifications.pdf.
Nation, P., & Beglar, D. (2007). A vocabulary size test The Language Teacher, 31(7), 9-
12.
Paribakht, T. S., & Wesche, M. (1993). Reading Comprehension and Second Language
Development in a Comprehension-Based ESL Program. TESL CANADA
JOURNAL, 11(1), 9-29.
Paribakht, T. S., & Wesche, M. (1997). Vocabulary enchancement activities and reading
for meaning in second language vocabulary acquisition. In J. Coady, Huckin, T.
(Ed.), Second Language Vocabulary Acquisition. Cambridge, United Kingdom:
Cambridge University Press.
Read, J. (2000). Assessing Vocabulary. Cambridge, United Kingdom: Cambridge
University Press.
Ruus, H. (1995). Danske Kerneord Centrale dele af den danske leksikalske norm.
København, Danmark: Museum Tusculanums Forlag.
Schmitt, N., & Schmitt, D. (2012). A reassessment of frequency and vocabulary size in
L2 vocabulary teaching. Language Teaching, 1-20.
doi:10.1017/S0261444812000018
Stæhr, L. S. (2008). Vocabulary size and the skills of listening, reading and writing.
Language Learning Journal, 36(2), 139-152. doi:10.1080/09571730802389975
Stæhr, L. S. (2009). Vocabulary Knowledge and Advanced Listening Comprehension in
English as a Foreign Language Cambridge University Press, 577– 607.
doi:10.1017/S0272263109990039
Stæhr, L. S. (2013). Tilegnelse og testning af ordforråd. In M. Byram (Ed.), Sprogfag i
forandring - pædagogik og praksis (1. ed.). Frederiksberg, Danmark:
Samfundslittaratur.
Ward, J., & Chuenjundaeng, J. (2009). Suffix knowledge: Acquisition and applications.
System, 37, 461–469. doi:10.1016/j.system.2009.01.004
Wilkins, D. A. (1972). Linguistics in language teaching. London, United Kingdom:
Edward Arnold.
www.lix.se. LIX räknare.
www.sproget.dk. Elektronisk ordbog.
83
Bilag
Nr. på lemma 10.000 listen
Ord på lemma 10.000 listen
Ord-klasse Laveste forekomst på fælleslisten Ekko/Glimt
Først forekomne ordform på fælleslisten
Antal forekomster på fælleslisten Ekko/Glimt *
97 sammen D 63 sammen 96
197 sidde V 340 sidder 29
299 person NC 580 person 12+
397 igennem T 616 igennem 9
496 rød A 762 røde 10+
599 mad NC 196 mad 38+
700 gade NC 1770 gaden 6+
784 elske V 194 elsker 31+
896 sjov A 291 sjovt 29+
1000 ejendom NC 2711 ejendommen 5+
1086 snakke V 328 snakke 33+
1196 regel NC 1142 regel 4+
1296 vindue NC 529 vinduet 18+
1371 bagefter D 457 bagefter 11
1400 mørk A 1124 mørkt 5+
1463 male V 1057 male 5+
1521 kød NC 524 kød 10+
1706 maskine NC 2220 maskine 5
1971 sur A 973 sur 10+
2000 veninde NC 626 veninde 18+
2099 tyv NC 557 tyven 17+
2023 hyggelig A 591 hyggeligt 9+
2123 æg NC 819 æg 6+
2146 lækker A 4817 lækkert 6+
2389 slukke V 983 slukker 10
2506 hud NC 1199 huden 7
2591 idræt NC 667 idræt 7+
2607 toilet NC 428 toilettet 6+
2751 tørre V 1427 tørre 5+
2788 eksamen NC 566 eksamen 9+
3038 brække V 2682 brækker 5+
3050 pludselig A 273 pludselig 19
3284 el NC 396 el 13+
84
3596 kravle V 1872 kravler 6
3732 dagbog NC 673 dagbog 7
3746 jakke NC 906 jakke 6+
3803 mest A 236 mest 23
3879 søskende NC 1028 søskende 7+
3904 cirkus NC 929 cirkus 5+
3375 venskab NC 1281 venskaber 6
4021 morgenmad NC 724 morgenmad 9
4037 sej A 1307 sej 5
4038 badeværelse NC 651 badeværelset 7+
4334 interesseret** A 1444 interesseret 3+
4565 storebror NC 646 storebror 7
4586 lektie NC 438 lektier 12
4637 soveværelse NC 768 soveværelset 6
4665 kysse V 743 kyssede 16+
4676 hviske V 1178 hviskede 5+
4870 gymnastik NC 683 gymnastik 7+
Tabel 9 De 50 testord
85
Testordets nr. på lemma 10.000 listen
Testordet Antal testdeltagere der kendte ordet
Procentdel af testdeltagere der kendte ordet
97 sammen 95 99%
299 person 96 100%
397 igennem 23 24%
599 mad 81 84%
784 elske 95 99%
896 sjov 61 64%
Niveau <1000 451 i alt (451/576)*100=78%
1086 snakke 89 93%
1296 vindue 73 76%
1463 male 34 35%
1521 kød 64 67%
1971 sur 71 74%
2000 veninde 70 73%
Niveau 1001-2000 401 i alt (401/576)*100=70%
2023 hyggelig 82 85%
2123 æg 57 59%
2389 slukke 30 31%
2591 idræt 37 39%
2751 tørre 21 22%
2788 eksamen 68 71%
Niveau 2001-3000 295 i alt (295/576)*100=51%
3038 brække 14 15%
3050 pludselig 21 22%
3284 el 2 2%
3596 kravle 26 27%
3732 dagbog 87 91%
3879 søskende 87 91%
Niveau 3001-4000 237 i alt (237/576)*100=41%
4021 morgenmad 94 98%
4038 badeværelse 64 67%
4334 interesseret** 86 90%
4586 lektie 34 35%
4665 kysse 94 98%
4870 gymnastik 70 73%
Niveau 4001-5000 442 i alt (442/576)*100=77%
Tabel 10 Testdeltagernes receptive kendskab til de enkelte testord
86
Score Testdeltagernes score
Testdeltagernes score i pct.
Testdeltagernes score opsummeret
Testdeltagernes score opsummeret i pct.
1 - - - -
2 - - - -
3 - - - -
4 1 1% 1 1%
5 - - - -
6 - - - -
7 - - - -
8 1 1% 2 2%
9 3 3% 5 5%
10 1 1% 6 6%
11 3 3% 9 9%
12 2 2% 11 11%
13 1 1% 12 13%
14 3 3% 15 16%
15 8 8% 23 24%
16 6 6% 29 30%
17 8 8% 37 39%
18 7 7% 44 46%
19 4 4% 48 50%
20 8 8% 56 58%
21 8 8% 64 67%
22 8 8% 72 75%
23 4 4% 76 79%
24 8 8% 84 88%
25 1 1% 85 89%
26 6 6% 91 95%
27 1 1% 92 96%
28 1 1% 93 97%
29 3 3% 96 100%
30 - - - -
I alt 96 - 96 100%
Tabel 11 Testdeltagernes samlede score i testen
87
Sco
re
Drenge Piger
An
tal
Pct
.
Op
sum
mer
et
Op
sum
mer
et p
ct.
An
tal
Pct
.
Op
sum
mer
et
Op
sum
mer
et p
ct.
1 - - - - - - - -
2 - - - - - - - -
3 - - - - - - - -
4 1 3% 1 3% - - - -
5 - - - - - - - -
6 - - - - - - - -
7 - - - - - - - -
8 1 3% 2 5% - - - -
9 3 8% 5 14% - - - -
10 - - - - 1 2% 1 2%
11 1 3% 6 16% 2 3% 3 5%
12 1 3% 7 19% 1 2% 4 7%
13 - - - - 1 2% 5 8%
14 3 8% 10 27% - - - -
15 3 8% 13 35% 5 8% 10 17%
16 2 5% 15 41% 4 7% 14 24%
17 2 5% 17 46% 6 10% 20 34%
18 3 8% 20 54% 4 7% 24 41%
19 3 8% 23 62% 1 2% 25 42%
20 2 5% 25 68% 6 10% 31 53%
21 2 5% 27 73% 6 10% 37 63%
22 3 8% 30 81% 5 8% 42 71%
23 1 3% 31 84% 3 5% 45 76%
24 3 8% 34 92% 5 8% 50 85%
25 - - - - 1 2% 51 86%
26 1 3% 35 95% 5 8% 56 95%
27 - - - - 1 2% 57 97%
28 1 3% 36 97% - - - -
29 1 3% 37 100% 2 3% 59 100%
30 - - - - - - - -
I alt 37 37 100% 59 59 100%
Tabel 12 Testdeltagernes samlede score i testen opdelt efter køn
88
1000 2000 3000 4000 5000
78% 70% 51% 41% 77%
Tabel 13 Testdeltagernes relative score på 1000 til 5000 ordniveauerne
1000 ordniveau Mindst 5 eller 6 rigtige Pct. der scorer 5/6 rigtige
Nåede ikke første 1000 39 41%
1000 19 20%
1000+2000 18 19%
1000+2000+3000 13 14%
1000+2000+3000+4000 0 0%
1000+2000+3000+4000+5000 7 7%
I alt 96
Tabel 14 Testdeltagernes kendskab til 1000 ordniveauerne
Score: 1 2 3 4 5
Antal testpersoner
med den score: 2 0 17 10 67
Tabel 15 Testdeltagernes dybdekendskab til testordet; sammen
Score: 1 2 3 4 5
Antal testpersoner
med den score: 7 0 6 36 47
Tabel 16 Testdeltagernes dybdekendskab til testordet; snakke
Score 1 2 3 4 5
Antal testpersoner
med den score 6 7 18 45 20
Tabel 17 Testdeltagernes dybdekendskab til testordet; hyggelig
Score 1 2 3 4 5
Antal testpersoner
med den score 4 1 18 29 44
Tabel 18 Testdeltagernes dybdekendskab til testordet; søskende