ordforråd - skemman

1

Háskóli Íslands

Hugvísindasvið

Danska

Ordforråd

En undersøgelse af islanske gymnasieelevers ordforråd på

dansk

Ritgerð til M.A.-prófs í dönsku

Trine Holm Houmøller

Kt.: 030877-2259

Leiðbeinandi: Þórhildur Oddsdóttir

Janúar 2020

2

Indholdsfortegnelse Abstract ............................................................................................................................. 5

Útdráttur ........................................................................................................................... 6

Indledning ......................................................................................................................... 7

Problemformulering ..................................................................................................... 8

Motivation .................................................................................................................... 8

Danskfaget i det islandske skolesystem .................................................................. 10

Islandske studerende i Norden ............................................................................... 12

Teori ................................................................................................................................ 13

Begrebsafklaring ......................................................................................................... 13

Ord .............................................................................................................................. 15

Lemma versus ordfamilier ...................................................................................... 15

At kende et ord ....................................................................................................... 17

Tilegnelse af nye ord ............................................................................................... 18

Hvor mange ord man skal kunne ............................................................................ 19

Ordlister ...................................................................................................................... 20

Frekvenslister .......................................................................................................... 20

Akademiske ordlister .............................................................................................. 21

Dækningsgrad ......................................................................................................... 22

Testtyper ..................................................................................................................... 26

Vocabulary Levels Test ............................................................................................ 28

Vocabulary Size Test ................................................................................................ 30

Vocabulary Knowledge Scale .................................................................................. 32

Empiri .............................................................................................................................. 37

Udvikling af ordforrådstesten ..................................................................................... 37

Valg af testmetode .................................................................................................. 38

Grundlag for valg af testord .................................................................................... 39

Analyse af ordforrådet i Ekko og Glimt ................................................................... 41

Analyse af ordklasser .............................................................................................. 45

Udvælgelsen af 50 testord ...................................................................................... 46

Afkortning til 30 testord ......................................................................................... 48

Testens praktiske udformning ................................................................................. 50

Resultater .................................................................................................................... 52

Receptivt kendskab til de 30 testord ...................................................................... 54

De enkelte testdeltageres score ............................................................................. 58

Relative score på 1000 ordniveauerne ................................................................... 61

3

Scoring i 1000 ordniveauerne ................................................................................. 63

Produktivt ordforråd ............................................................................................... 65

Opsummering af testresultater .................................................................................. 72

Diskussion ....................................................................................................................... 76

Perspektivering ............................................................................................................... 78

Konklusion ...................................................................................................................... 80

Litteraturliste .................................................................................................................. 81

Bilag ................................................................................................................................ 83

4

Oversigt over tabeller Tabel 1 Dækningsgrad 95/98 pct. af forskellige tekstmaterialer .................................... 22

Tabel 2 Dækningsgrad for hvert 1000 ordniveau ........................................................... 24

Tabel 3 Dækningsgraden for høj-, mellem- og lavfrekvens ordforråd ............................ 26

Tabel 4 Pointskala til VKS ................................................................................................ 33

Tabel 5 Resultater af tekstanalyse af Ekko og Glimt ....................................................... 43

Tabel 6 Ordniveau 1000 til 5000 analyseret efter ordklasser ......................................... 45

Tabel 7 De 30 testord fordelt på ordklasser og 1000 ordniveauer ................................. 49

Tabel 8 De 30 testord ...................................................................................................... 50

Tabel 9 De 50 testord ...................................................................................................... 84

Tabel 10 Testdeltagernes receptive kendskab til de enkelte testord .............................. 85

Tabel 11 Testdeltagernes samlede score i testen ........................................................... 86

Tabel 12 Testdeltagernes samlede score i testen opdelt efter køn ................................ 87

Tabel 13 Testdeltagernes relative score på 1000 til 5000 ordniveauerne ...................... 88

Tabel 14 Testdeltagernes kendskab til 1000 ordniveauerne .......................................... 88

Tabel 15 Testdeltagernes dybdekendskab til testordet; sammen .................................. 88

Tabel 16 Testdeltagernes dybdekendskab til testordet; snakke ..................................... 88

Tabel 17 Testdeltagernes dybdekendskab til testordet; hyggelig ................................... 88

Tabel 18 Testdeltagernes dybdekendskab til testordet; søskende ................................. 88

Tabel 19 Testdeltagernes dybdekendskab til testordet; lektie ....................................... 89

5

Abstract

Dette speciale omhandler en undersøgelse af, hvor stort et ordforråd eleverne har på

dansk, når de er i gang med den obligatoriske danskundervisning i den islandske

gymnasieskole.

Formålet med undersøgelsen er at give undervisere i gymnasiet indsigt i hvor stort

elevernes ordforråd er, for at underviseren på den baggrund kan tage stilling til hvilken

type ordforråd det er mest relevant at beskæftige sig med i undervisningen. Viden om

størrelsen af elevernes ordforråd kan også give underviseren et indblik i, hvilke

teksttyper eleverne har forudsætninger for at læse på baggrund af størrelsen af deres

ordforråd.

Til undersøgelsen af størrelsen af elevernes ordforråd blev der udarbejdet en test med

30 testord, der byggede på Vocabulary Knowledge Scale (VKS). Kriterierne for

udvælgelsen af testordene var, at der var seks ord fra hver af de første fem 1000

ordniveauer og samtidig skulle ordene være repræsenteret mindst fem gange på en

ordfrekvensliste udarbejdet på baggrund af analyse af undervisningsmateriale fra både

grundskolen og gymnasiet.

Testen blev forelagt fem forskellige danskhold på tre forskellige gymnasier. Testen viste

bl.a. at eleverne i gennemsnit havde receptivt kendskab til 19 af de 30 testord. Testen

viste ligeledes, at ca. 40 pct. af eleverne ikke har tilstrækkeligt kendskab til de 1000

hyppigst forekomne ord på dansk. At 20 pct. af eleverne udelukkende havde kendskab

til de 1000 hyppigst forekomne ord på dansk. At 14 pct. af eleverne har kendskab til

første, andet og tredje 1000 ordniveau og 7 pct. af eleverne har kendskab til både

første, andet, tredje, fjerde og femte 1000 ordniveau. Resultatet af undersøgelsen

indikerer, at en stor del af elevgruppen har et meget begrænset ordforråd på dansk.

6

Útdráttur

Þessi meistararitgerð fjallar um rannsókn á orðaforða nemenda sem eru í skyldunámi í

dönsku á framhaldsskólastigi á Íslandi.

Tilgangur rannsóknarinnar er að veita kennurum í framhaldsskólum innsýn í hversu

mikinn orðaforða nemendur hafa til þess að kennari geti metið hverskonar orðaforða er

gagnlegast að vinna með í kennslunni. Þekking á orðaforða nemenda getur einnig gefið

kennara innsýn í hverskonar lesefni nemendur hafa forsendur til að lesa með tilliti til

umfangs orðaforða þeirra.

Til að rannsaka umfang orðaforða nemanda var útbúin könnun með 30 orðum sem

byggja á Vocabulary Knowledge Scale (VKS). Val á þeim orðum sem notuð voru í

könnunni byggja á þeim viðmiðum að þar skyldu vera sex orð úr hverjum af fimm

algengustu tíðniflokkunum og samtímis þurftu orðin að koma fyrir að minnsti kosti

fimm sinnum á orðtíðnilista sem var unnin út frá námsefni nemenda bæði á

grunnskóla- og framhaldsskólastigi.

Könnunin var lögð fyrir fimm mismunandi hópa nemenda í dönskunámi í þremur

framhaldsskólum. Niðurstöður könnunarinnar leiddu í ljós að nemendur þekktu að

meðaltali 19 af þeim 30 orðum sem voru könnuð. Auk þess kom fram í niðurstöðunum

að u.þ.b. 40 prósent nemenda höfðu ekki nægjanlega þekkingu á 1000 algengustu

orðunum í dönsku. Að 20 prósent nemenda hafði eingöngu þekkingu á 1000

algengustu orðum í dönsku. Að 14 prósent nemenda höfðu þekkingu á fyrsta, öðrum og

þriðja 1000 tíðniflokkunum og 7 prósent nemenda höfðu þekkingu á fyrsta, öðru,

þriðja, fjórða og fimmta tíðniflokkunum. Niðurstaða rannsóknarinnar gefur til kynna að

stór hluti nemendahópsins hafi mjög takmarkaðan orðaforða í dönsku.

7

Indledning

Ideen til denne opgave udsprang af et foredrag, jeg var til i foråret 2018. Foredraget var

arrangeret af STÍL, foreningen for sprogundervisere i Island [Samtök Tungumálakennara

á Íslandi] og var egentligt primært målrettet mod undervisere i engelsk. Foredraget

blev afholdt af engelsklærerne på et gymnasium, der hedder Menntaskólinn við

Hamrahlíð, og omhandlede undervisning i akademisk ordforråd på engelsk, og hvordan

dette helt konkret gribes an på Menntaskólinn við Hamrahlíð. Foredraget åbnede mine

øjne for den omfattende forskning og viden der er om det engelske sprog og dets

ordforråd i relation til undervisning. Det var et felt, som jeg ikke tidligere havde haft

kendskab til. Jeg gik derfra med et indblik i en for mig hidtil ukendt verden, som jeg var

ivrigt efter at lære mere om, men jeg var tvivlende overfor, om den viden der findes om

det engelske sprog i samme grad findes om det danske sprog. I Island kan det ikke

undgås, at både elever og lærere til en vis grad sammenligner de to fremmedsprog

dansk og engelsk, som har samme målsætning ved grundskolens afslutning. Min tanke

var, at hvis undervisning i akademisk engelsk er en del af engelskundervisningen i den

islandske gymnasieskole, ville det være interessant at undersøge hvor danskfaget står i

den sammenhæng.

Samme forår havde jeg hørt om en omfattende undersøgelse, der hedder Language

development across the life span: the impact of English on education and work in

Iceland. Undersøgelsen omhandler det engelske sprogs rolle i det islandske samfund,

og den viste bl.a. at der er en generel tendens i Island til, at folk overvurderer egne

engelskkundskaber. Det lå fint i tråd med en tendens, som min kollega fra grundskolen

havde fortalt mig om. Hun fik som engelsklærer jævnligt klager fra både elever og

deres forældre, der mente, at deres børn skulle have højere karakterer i engelsk end

hvad deres opgaver og prøveresultater indikerede. I min tid som dansklærer i

grundskolen oplevede jeg det omvendte problem. Jeg mødte ofte elever, som gav

udtryk for, at de ikke mente de kunne ret meget i dansk, selvom de i virkeligheden efter

min opfattelse kunne temmelig meget. Dette gav mig blod på tanden i forhold til at

undersøge, hvor stor forskellen er på elevernes ordforråd på henholdsvis engelsk og

dansk ved grundskolens afslutning.

8

Foråret 2019 tog jeg som resultat af min nyvundne interesse for

ordforrådsundervisning, som en del af min MA i dansk ved Islands Universitet, et

kursus i ordforrådstilegnelse. Jeg lærte på kurset om forskning i ordforråd og i

særdeleshed om forskning i ordforråd i undervisningsmæssige sammenhænge. Kurset

lå i forlængelse af det, jeg havde stiftet bekendtskab med på foredraget på

Menntaskólinn við Hamrahlíð, og jeg blev bekræftet i, at ordforråd er et både stort og

relevant emne i sprogundervisningen.

I forbindelse med kurset i ordforrådstilegnelse lavede jeg en pilotundersøgelse af 10.

klasses elever i den islandske grundskoles kendskab til de 2000 hyppigst forekomne ord

på henholdsvis engelsk og dansk. Pilotundersøgelsen lærte mig bl.a., at det er

problematisk at sammenligne størrelse af ordforråd på engelsk og dansk, fordi

hovedparten af forskningen i ordforråd på engelsk er baseret på, at ordene er opdelt i

ordfamilier, hvorimod vi på dansk og i en nordisk kontekst fortrinsvis opererer med ord

opdelt i lemmaer. Et andet problem, som jeg stødte på undervejs, var at der ikke findes

danske udgaver af de mest brugte engelske ordforrådstests VST og VLT. Eller det vil sige,

måske findes der danske udgaver af de to testtyper, men ikke versificerede udgaver,

som jeg havde mulighed for at komme i besiddelse af.

Som resultat af de erfaringer jeg gjorde mig i pilotundersøgelsen, besluttede jeg, at

specialet ikke skulle indeholde en sammenligning af ordforråd på henholdsvis engelsk

og dansk, men derimod udelukkende fokusere på størrelsen af elevernes ordforråd på

dansk, når de påbegynder den obligatoriske danskundervisning i gymnasiet. Det ledte

mig frem til problemformuleringen for dette speciale.

Problemformulering

Jeg vil undersøge, hvor stort et ordforråd har eleverne på dansk, når de er i gang med

den obligatoriske danskundervisning i gymnasiet.

Motivation

Min motivation for at undersøge hvor stort et ordforråd eleverne har, når de

9

påbegynder den obligatoriske danskundervisning i gymnasiet udsprang, som tidligere

nævnt, af indsigten i den omfattende viden der findes om ordforråd og

ordforrådsundervisning i relation til det engelske sprog. Jeg vil gerne vide, hvor

danskfaget står sammenlignet med engelskfaget. Dvs. har eleverne et tilstrækkelig stort

ordforråd på dansk, når de starter på den obligatoriske danskundervisning i gymnasiet,

til at det giver mening at arbejde med fx akademisk ordforråd i danskfaget. Og hvis

ikke, hvilket ordforråd er det så mest gavnligt, at man som danskunderviser i den

islandske gymnasieskole fokuserer på i undervisningen.

Et andet argument for at undersøge elevernes ordforråd kan være, at man kan

afdække, om eleverne evt. har nogle mangler eller huller i det ordforråd, man som

underviser forventer de har, som spænder ben for, at de kan klare de opgaver man

stiller dem overfor. Flere forskere bl.a. Henriksen (2009) har peget på, at

ordforrådstilegnelse i sprogundervisningen generelt får for lidt og i nogle tilfælde

måske forkert behandling i sprogundervisningen;

Men fare for at generalisere alt for bredt vil jeg våge den påstand, at der foregår for lidt planlagt og

systematisk undervisning i ordforråd. Grundlæggende tror vi som sproglærere på, at når eleverne

først er nået ud over begynderniveauet, udvikler de primært deres ordforråd ved at læse meget. Og

det er uden tvivl rigtigt. Men at læse er næppe nok (Henriksen, 2009, p. 72).

Der er flere gode grunde til at undersøge og interessere sig for elevernes ordforråd. Et

argument kan være at undersøge, om elevernes ordforråd har en størrelse, der gør

dem i stand til at løse de opgaver man som underviser stiller dem overfor. Dvs. har

eleverne en reel chance for at forstå og få udbytte af de materialer fx en film eller en

tekstsamling, man som underviser vælger at bruge i sin undervisning. Det er

frustrerende for eleverne, og i sidste ende også for underviseren, hvis eleverne ikke har

tilstrækkeligt ordforråd til at kunne få tilstrækkeligt udbytte af undervisningsmaterialet.

Man kan som underviser selvfølgelig løse en del af problemet med utilstrækkeligt

ordforråd hos eleverne ved stilladsering. Stilladsering kan afløse problemet med

utilstrækkeligt ordforråd, fx hvis det drejer sig om en film, som man ser sammen i

klassen, men det nytter ikke at sende eleverne hjem og læse en tekst selvstændigt, som

de ikke har forudsætninger for at læse hvad angår ordforrådet, fordi eleverne for det

10

første vil blive frustrerede, men heller ikke vil få noget nævneværdig udbytte af at læse

teksten, hvad angår tilegnelse af ordforråd.

Uanset hvordan vi vender og drejer det, spiller ordforråd en vigtig rolle i

sprogundervisning, da ordforrådet er fundament for alt, hvad vi gør med sproget. Med

intet eller meget begrænset ordforråd er det svært at forstå noget og endnu sværere at

udtrykke sig. Som Wilkins så klogt sagde: ”Uden grammatik kan vi kun udtrykke meget

lidt, men uden ordforråd kan vi intet udtrykke” (Wilkins, 1972, p. 111).1

Danskfaget i det islandske skolesystem

Der undervises i dansk som et obligatorisk fremmedsprog både i grundskolen og på

ungdomsuddannelserne i Island. Frem til 1999 var dansk det første fremmedsprog i

grundskolen. Der blev undervist i dansk i fem år i grundskolen, fra eleverne gik i 6. til

10. klasse, hvilket svarer til 5. til 9. klasse i Danmark. I 1999 trådte en ny

bekendtgørelse i kraft, hvilket gjorde, at engelsk blev det første fremmedsprog

eleverne blev undervist i i grundskolen (Auður Hauksdóttir, 2012).

På nuværende tidspunkt er det således, at engelsk fortsat er det første fremmedsprog

eleverne undervises i. Fremmedsprogene engelsk og dansk har en samlet mængde

undervisningstimer i grundskolen, og det er op til den enkelte skole at beslutte,

hvordan man fordeler timerne mellem de to fag. Det er ligeledes op til den enkelte

skole at beslutte på hvilket klassetrin eleverne påbegynder undervisningen i

henholdsvis engelsk og dansk, dog skal engelskundervisningen påbegyndes senest i 5.

klasse og danskundervisningen påbegyndes senest i 7. klasse. Ved afslutningen af

grundskolen stilles der samme krav til elevernes kundskaber i de to fag engelsk og

dansk (Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013).

I det følgende vil jeg opridse nogle få punkter fra den nationale læreplan for

grundskolen [Aðalnámskrá grunnskóla], som jeg mener er relevante, for at kaste lys

over, hvilke forventninger der stilles til elevernes danskkundskaber, når de forlader

grundskolen. Her er det værd at bemærke, at de nedenstående punkter ikke bare

1 „The fact is that while without grammar very little can be conveyed, without vocabulary nothing can be conveyed” (Wilkins, 1972). (Wilkins, 1972, p. 111)

11

præciserer, hvilke danskkundskaber det forventes eleverne har, når de forlader

grundskolen, men samtidig også afdækker de danskkundskaber, man må forvente, at

eleverne har med sig, når de påbegynder en ungdomsuddannelse, som fx gymnasiet,

som denne opgave primært beskæftiger sig med.

Ved afslutningen af grundskolen forventes det bl.a., at eleven [min oversættelse, se

original tekst på islandsk i fodnoten]

• med henblik på at erhverve sig viden kan læse autentiske tekster fx fra aviser, magasiner og

internetressourcer, der omhandler emner der er relevante i forhold til elevens eget liv eller

egne forhold eller miljø, reagere på stoffet, genfortælle stoffet eller på anden måde bearbejde

det (Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013, p. 126).2

• uden problemer kan følge med i tilgængeligt stof fra medierne af lyst, og at de kan genfortælle

stoffet og forarbejde det (Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013,

p. 125).3

Hvad angår hvilke krav der stilles til elevernes danskkundskaber ved afslutningen af den

obligatoriske danskundervisning i gymnasiet forventes det bl.a., at eleven [min

oversættelse, se original tekst på islandsk i fodnoten]

• skal have tilegnet sig et ordforråd, der gør ham i stand til på tilstrækkelig vis at kunne tilegne sig

læsestof i forbindelse med videregående uddannelse eller i jobsammenhænge.4

• Kan anvende det skriftlige sprog til forskellige formål, videnskabelige og personlige, og med

stiltræk og sprogbrug som passer ind i sammenhæng (…) (Aðalnámskrá Framhaldsskóla 2011 -

almennur hluti, 2012, p. 102)5

Begge de to ovennævnte punkter peger i retning af, at eleverne ved afslutningen af den

obligatoriske danskundervisning i gymnasiet skal have danskkundskaber på et niveau,

der vil gøre dem i stand til at kunne tage en videregående uddannelse på dansk.

2 - lesið sér til fróðleiks rauntexta, t.d. úr dagblöðum, tímaritum og netmiðlum sem fjalla um efni er varðar líf hans, aðstæður eða umhverfi, brugðist við efni þeirra, sagt frá eða unnið úr á annan hátt, (Aðalnámskrá grunnskóla, 2013, s. 126) 3 : - án vandkvæða fylgst með aðgengilegu efni í fjöl- og myndmiðlum sér til gagns og ánægju, sagt frá og unnið úr, (Aðalnámskrá grunnskóla, 2013, s. 125) 4 - orðaforða sem gerir honum kleift að tileinka sér með góðu móti lesefni í áframhaldandi námi eða starfi (Aðalnámskrá Framhaldsskóla 2011 - almennur hluti, 2012, p. 102) 5 - að beita ritmálinu í mismunandi tilgangi, fræðilegum og persónulegum, með stílbrigðum og málsniði sem við á (...) (Aðalnámskrá Framhaldsskóla 2011 - almennur hluti, 2012, p. 102)

12

Islandske studerende i Norden

I Island er der en stærk tradition for at rejse til udlandet for at studere. I den

sammenhæng spiller de nordiske lande og i særdeleshed Danmark en stor rolle. I Island

har man ikke som i Danmark mulighed for at få SU (Statens Uddannelsesstøtte), men

man har til gengæld mulighed for, som studerende på en anerkendt uddannelse, at

optage et studielån. I studieåret 2009-2010 var der ifølge Auður Hauksdóttir (2012)

2414 islandske studerende, der modtog lån til at studere udenlands. Af dem var der

1290, dvs. 53 pct. der modtog lån til at studere i et andet nordisk land. Og af den

samlede gruppe islandske studerende der modtog lån til at studere i udlandet, var der

1069, der modtog lån til at studere i Danmark. Dvs. at af den samlede gruppe af

islandske studerende, der valgte at studere i udlandet i studieåret 2009-2010 rejste 44

pct. til Danmark for at studere. Og af den gruppe af studerende der valgte at studere i

et andet nordisk land valgte 83 pct. at rejse til Danmark for at studere. Ovennævnte tal

er fra studieåret 2009-2010 og medtaget her for at vise hvor almindeligt det er, at

islændinge tager til Danmark eller et andet nordisk land for at studere. Det er

efterfølgende blevet muligt for islandske studerende i Danmark at få SU under

forudsætning af, at de opfylder visse krav.

Brink (2016) undersøgte unge nordboers kommunikation på tværs af landegrænser og

deres syn på internordisk kommunikation, dvs. det at skulle kommunikere med andre

nordboer på et skandinavisk sprog, der ikke var deres modersmål. Brinks undersøgelse

er interessant i forhold til islandske studerende, der vælger at studere i et andet

nordisk land end Island. Undersøgelsen viste, at der var en tendens til, at de unge

islændinge havde en negativ opfattelse af det at de skulle lære dansk i skolen.

Hovedårsagen til at de islandske unge ikke havde været motiverede for at lære dansk i

skolen var, at de ikke havde kunnet se formålet med det. De kunne ikke forestille sig, at

de nogensinde ville få brug for at kunne sproget. Det ærgerlige er, at de islandske unge

for de flestes vedkommende senere fortrød ikke at have lært mere dansk, da chancen

bød sig i deres skoletid. Det positive er, at de fleste islandske unge rapporterede om, at

det dansk de trods alt havde lært i skolen, havde været en hjælp for dem, da de senere

skulle kommunikere i praksis enten på dansk eller på et andet skandinavisk sprog.

13

Teori

Begrebsafklaring

Jeg vil i dette afsnit kort forklare forskellige begreber, som jeg kommer ind på i

opgaven. For nogle begrebers vedkommende giver det mere mening at forklare dem i

sammenhæng, hvor de første gang optræder i teksten.

Målsproget, er det sprog man underviser i. Dvs. at for elever i danskundervisningen, er

dansk målsproget.

1000 ordniveauer, er den inddeling af ordene man oftest laver, når man undersøger og

omtaler hvor ofte ordene forekommer i sproget. Det første 1000 ordniveau består

således af de oftest forekomne 1000 ord i et sprog, dvs. fra nummer et til nummer

1000. Ord nummer et i det første 1000 ordniveau er det ord, der oftest forekommer i

sproget. Ord nummer to er det ord der næst oftest forekommer i sproget osv. Det

andet 1000 ordniveau består af de næst oftest 1000 forekomne ord i sproget, dvs. fra

nummer 1001 til nummer 2000. Det tredje 1000 ordniveau består af de dernæst oftest

forekomne 1000 ord i sproget, dvs. fra nummer 2001 til nummer 3000.

Højfrekvens ordforråd, er den samling af ord, der oftest forekommer i sproget. I de

fleste sammenhænge henviser begrebet højfrekvens ordforråd, til de hyppigst

forekomne 2000 ord i sproget. I. S. P. Nation (2013) definerer højfrekvens ordforråd

som værende de hyppigst forekomne 2000 ord. Schmitt and Schmitt (2012) derimod

foreslår, at man definerer de hyppigst forekomne 3000 ord som højfrekvens ordforråd.

Når jeg i denne opgave omtaler højfrekvens ordforråd, henviser jeg til de hyppigst

forekomne 2000 ord.

Mellemfrekvens ordforråd, er ifølge I. S. P. Nation (2013) defineret som de ord der

kommer fra det tredje til det niende 1000 ordniveau. Dvs. hvis man ville sortere ordene

efter hvor ofte de forekommer i sproget, så er det ord nummer; 2001 til ord nummer

9000. Mellemfrekvens ordforrådet er således en gruppe på 7000 ord.

Lavfrekvens ordforråd, er ifølge I. S. P. Nation (2013) defineret som alt hvad der ligger

14

over det mellemfrekvente ordforråd. Dvs. at det er ord fra nummer 9001 og opefter.

Akademisk ordforråd, er ordforråd som er hyppigt anvendt i akademiske tekster på

tværs af fagområder. På engelsk findes der forskellige lister over akademisk ordforråd.

Den mest kendte er Academic Word List (Coxhead, 2000), som består af 570 ord.

Akademisk ordforråd er vigtigt at lære, for dem der har planer om akademiske studier

på det pågældende sprog (I. S. P. Nation, 2013).

Dækningsgrad, fortæller noget om hvor stor en procentdel af ordforrådet i en given

tekst læseren har kendskab til. Hvis man fx kender de hyppigst forekomne 1000

ordfamilier på engelsk har man en dækningsgrad på ca. 78 pct. af en hvilken som helst

tekst. For de næste 2000 hyppigst forekomne ordfamilier på engelsk er

dækningsgraden 8 pct., dvs. at man ”tjener” en dækningsgrad på yderligere 8 pct. ved

at lære ordene i det andet 1000 ordniveau på engelsk. Alt i alt betyder det, at hvis man

har kendskab til både det første og det andet 1000 ordniveau i engelsk, også omtalt

som de hyppigst forekomne 2000 ord, opnår man en dækningsgrad på 86 pct. (I. S. P.

Nation, 2013).

Tokens, antallet af tokens er det samlede antal ord der forekommer i en tekst. På

engelsk også nogle gange betegnet som ”runnig words” (I. S. P. Nation, 2013). Selvom

det samme ord forekommer i samme form mere end én gang i samme tekst tælles det

med hver gang det forekommer (Read, 2000). Sætningen ”Jeg ved ikke, om jeg vil vide

det” indeholder 8 tokens.

Types, er det samlede antal forskellige ordformer der optræder i en tekst, dvs. at hvis

det samme ord forekommer mere end en gang, tæller det alligevel kun med én gang

(Read, 2000). Sætningen ”Jeg ved ikke, om jeg vil vide det” indeholder 7 types, fordi

ordet jeg kun tæller med én gang, selvom det forekommer to gange.

Lemma, er et begreb man ofte opererer med i ordforrådsstudier. Lemma er den

kollektive betegnelse for ordets grundform samt ordets bøjningsformer (Read, 2000).

Sætningen ”Jeg ved ikke, om jeg vil vide det”, indeholder 6 lemmaer, fordi de to gange

jeg tæller som ét lemma på samme måde som vide og ved tælles som ét lemma, da

15

begge tilhører lemmaet vide.

Ordfamilier, består af et ords grundform samt ordets bøjningsformer og de afledte

former af ordet, som har den samme betydning. Fænomenet ordfamilier er imidlertid

en kompleks størrelse, da en del ord er afledt af den samme grundform, men alligevel

har vidt forskellige betydning. Det giver anledning til, at ordets grundform, så at sige,

kan være ”moder” til mere end én ordfamilie. Hvordan man adskiller den samme

grundforms ordfamilier kan have stor betydning for hvilket resultat man får, når man fx

undersøger størrelsen på ordforråd hos modersmålstalende, for hvis hver ordfamilie

indeholder mange medlemmer, får man et resultat der viser et større ordforråd hos

testpersonerne end hvis hver ordfamilie indeholder færre ord (Read, 2000). Som I. S. P.

Nation (2013) anfører, er det største problem ved at bruge ordfamilier som tælleenhed

at afgøre, hvad der skal tælles med i ordfamilien og hvad der ikke skal tælles med.

Ord

For at kunne undersøge størrelsen af elevernes ordforråd i forbindelse med den

obligatoriske danskundervisning i gymnasiet er det relevant at komme ind på, hvad et

ord egentlig er, eller sagt på en anden måde, definere hvad der tæller som et ord i

hvilke sammenhænge. Der er som i begrebsafklaringen nævnt forskellige tælleenheder

for ord. I nedenstående afsnit vil jeg redegøre for, hvilken tælleenhed der i denne

opgave primært gør sig gældende for ord.

Lemma versus ordfamilier

Der er en generel tendens til, at man i de nordiske sprog beskæftiger sig med lemmaer,

hvorimod man på engelsk oftest beskæftiger sig med ordfamilier. Jakobsen, Coxhead,

and Henriksen (2018) beskæftigede sig med højfrekvens ordforråd og akademisk

ordforråd på dansk og brugte i den sammenhæng tælleenheden lemma af to grunde.

For det først mente de ikke, at konceptet ordfamilier i relation til det danske sprog er

blevet undersøgt i tilstrækkelig grad til, at de kunne forsvare at bruge det i deres

undersøgelse. For det andet var deres valg af lemmaer som tælleenhed praktisk

betinget, da det kildemateriale, som de brugte i deres undersøgelse, var

16

lemmabaseret.

P. Nation (2012) argumenterer for sin brug af ordfamilier frem for fx lemma eller

ordtyper ved at anføre at forskning har vist, at ordfamilier er, om man så må

sige, ”psykologisk rigtige eller ægte”. For det andet argumenterer han for brugen af

ordfamilier som tælleenhed ved at sige, at hvis man læser et hidtil ukendt medlem af

ordfamilien og i forvejen kender ét medlem af samme ordfamilie, og også kender de

mest basale almindelige og regelmæssige ordbygningsprocesser, vil det gøre det muligt

for én at gætte betydningen af det nye ord. Ordfamilier er ifølge Nation (2012) den

bedste tælleenhed, når det drejer sig om testning af receptivt ordforråd, hvorimod han

i forbindelse med testning af produktivt ordforråd finder brugen af lemmaer eller types

mere hensigtsmæssig.

Hvor mange ord en ordfamilie består af, afhænger som tidligere nævnt af kriterierne

for, hvordan man definerer en ordfamilie, dvs. hvor mange ord man tæller med til hver

familie. Et eksempel på hvor mange ord en ordfamilie kan bestå af, finder vi hos Nation

(2012). Han angiver, at det første 1000 ordniveau i alt består af 6857 ord, hvilket

betyder, at hver ordfamilie i gennemsnit består af knap syv ord. Antallet af medlemmer

i hver ordfamilie falder efterhånden som man kommer op i frekvensniveauerne, dvs. at

det andet 1000 ordniveau gennemsnitligt har færre medlemmer end det første, det

tredje har færre end det andet osv.

Accepten af brugen af ordfamilier som tælleenhed er omdiskuteret. Bl.a. Ward and

Chuenjundaeng (2009) advarer om, at vi må være påpasselige med at antage, at elever

kender familiemedlemmerne i en ordfamilie. Også Kremmel (2016) kritiserer brugen af

ordfamilier i forbindelse med ordforrådstestning. Kremmel angiver, at nyere forskning

viser, at den tidligere antagelse, om at hvis en person kender ét medlem af en

ordfamilie, kan han/hun slutte sig til betydningen af de øvrige ord i ordfamilien, ikke

holder stik. Kremmel foreslår tælleenheden lemma som den mest optimale.

Som Nation (2012) angiver, har valget af tælleenhed for ord stor betydning for hvor

mange ord man anslår et givent sprog har. Hvor mange ord der findes på henholdsvis

dansk eller engelsk har imidlertid ikke afgørende betydning for omdrejningspunktet i

17

denne opgave. Det eneste tilfælde hvor tælleenheden har betydning, er hvis man gerne

vil anvende den ordforrådsforskning som fx I. S. P. Nation (2013) har lavet om engelsk,

hvor man tæller i ordfamilier, og overføre den viden til dansk, hvor man tæller i

lemmaer. Det Nation bl.a. har undersøgt er, hvor mange ordfamilier der skal til, for at

man fx kan læse og forstå en avis uden brug af hjælpemidler. Eller hvor mange

højfrekvens ordfamilier man skal have lært, før man går i gang med at arbejde med det

akademiske ordforråd. Det kan være problematisk umiddelbart at overføre eller

sammenføre den viden, vi har om ordforråd i det engelske sprog, med den viden vi har

om ordforråd i det danske sprog, hvor fx Jakobsen et al. (2018) undersøgelse opererer

med lemmaer i stedet for ordfamilier.

Denne opgave omhandler primært ordforråd i relation til det danske sprog, og da det

danske sprog primært er optalt i tælleenheden lemma, vil lemmaer spille hovedrollen

som tælleenhed i denne opgave. Det er et praktisk valg i lighed med det Jakobsen et al.

(2018) tog i deres forskningsprojekt. Som nævnt i ovenstående afsnit er meget af den

forskning, der har fundet sted på engelsk, lavet på baggrund af tælleenheden

ordfamilier, hvorfor jeg ikke helt kan undgå at omtale tælleenheden ordfamilier i visse

sammenhænge. Når jeg omtaler ordfamilier i opgaven, er jeg helt klar over, at de ikke

umiddelbart kan sammenlignes med lemmaer.

At kende et ord

Hvornår man kender et ord, er svært at svare på, for hvad vil det egentlig sige at kunne

ord. Er det nok, at man kan forstå ordet, eller skal man også kunne udtale og skrive det

korrekt? Er det også nødvendigt, at man ved hvordan ordet bøjes, og behøver man at

vide noget om i hvilke sammenhænge man bruger ordet, og evt. hvornår man bestemt

ikke skal bruge ordet? Der er som sagt flere aspekter af at kende et ord og i forbindelse

med testning af elevers ordforråd, som denne opgave omhandler, er det i særdeleshed

vigtigt at gøre sig klart, hvilket aspekt af elevernes ordforrådsviden man interesserer sig

for, da de forskellige typer af ordforrådstests, tester forskellige aspekter.

Iflg. Henriksen (2009) tales der oftest om tre dimensioner af ordforrådsviden:

– hvor mange ord sprogbrugeren kender, dvs. kvantitet

18

– hvor godt sprogbrugeren kender det enkelte ord, dvs. kvalitet

– hvor godt sprogbrugeren kan bruge ordene i kommunikation, dvs. kontrol

Der bruges af forskellige forskere forskellige betegnelser for de tre ovennævnte

dimensioner af ordforrådskendskab. Hvor mange ord sprogbrugeren kender, dvs.

ordforrådets størrelse eller kvantiteten, omtales bl.a. hos Stæhr (2013) som

ordforrådets bredde. Og hvor godt sprogbrugeren kender ordene i ordforrådet, dvs.

kvaliteten, omtaler Stæhr som ordforrådets dybde. Den tredje dimension er udtryk for

elevens grad af kontrol over ordet i forbindelse med kommunikation, dvs. i hvilken grad

ordet er receptivt og produktivt tilgængeligt for eleven. At et ord er receptivt

tilgængeligt, vil sige, at eleven kan bruge ordet i læse- og lyttesammenhænge, dvs. kan

forstå ordet, når han læser det eller hører det. Det omtales også sommetider som

elevens passive ordforråd. At et ord er produktivt tilgængeligt, vil sige, at eleven selv

kan bruge ordet i skrive- eller talesammenhænge, dvs. kan bruge ordet, når han/hun

taler eller skriver. Det omtales i nogle sammenhænge som elevens aktive ordforråd.

Tilegnelse af nye ord

I forbindelse med ordforråd er det også interessant at se på, hvordan sprogeleven

bedst tilegner sig nye ord. Der er to yderpunkter i ordforrådstilegnelsen, hvoraf den

ene er den tilfældige, også betegnet som den indirekte metode. Her finder

ordforrådstilegnelsen sted ved læsning, og foregår ligesom ”tilfældigt”. Den anden er

den planlagte, også betegnet som den direkte metode. Imellem de to yderpunkter er

en kombination af begge metoder, dvs. en kombination af planlagt og tilfældig

ordforrådstilegnelse.

Der er blevet lavet forskellige undersøgelser af direkte ordforrådstilegnelse versus

indirekte ordforrådstilegnelse. Stæhr (2013) henviser til Parabakht og Wesche (1996),

der sammenlignede ordforrådstilegnelse hos elever der udelukkende læste, med elever

der både læste og blev udsat for ordforrådsøvelser. Undersøgelsen viste, at de elever

der både læste og blev udsat for ordforrådsøvelser var dem der tilegnede sig flest ord.

Hill and Laufur (2003) har på baggrund af forskningsresultater indenfor området regnet

19

sig frem til, at fremmedsprogselever skal læse over otte millioner ord, hvilket svarer til

omkring 420 romaner, for at udvide deres receptive ordforråd med 2000 ord. At læse

420 romaner er for langt de fleste fremmedsprogselever et helt uoverskueligt projekt,

hvilket peger i retning af, at den indirekte ordforrådstilegnelse ikke kan stå alene, hvis

eleverne skal udvikle et ordforråd, som skal gøre dem til kompetente sprogbrugere.

Også Henriksen (2018) omtaler den udbredte misforståelse, at hvis bare eleverne læser

en masse udvider de automatisk deres ordforråd. Henriksen kommer i den forbindelse

ind på undervisningen i tysk og fransk i Danmark, som efter min mening kan sidestilles

med undervisningen i dansk i Island, da tysk og fransk i Danmark har rollen som andet

eller evt. tredje fremmedsprog, ligesom dansk har i Island. Henriksen henviser til, at i

forbindelse med undervisning i tysk og fransk i Danmark er det særligt vigtigt at

arbejde målrettet med udvidelse af elevernes ordforråd fx ved hjælp af forskellige

typer af ordforrådsopgaver, da eleverne i de to sprog ikke i særlig vid udstrækning

eksponeres for sprogene i deres fritid i modsætning til den store eksponering de

udsættes for fra den engelske sprog, som finder sted hele tiden. Den observation som

Henriksen her påpeger, svarer til hvordan det forholder sig for de islandske elevers

manglede eksponering for dansk udenfor klasseværelset.

Hvor mange ord man skal kunne

Hvor mange ord skal man kunne? Det er et godt spørgsmål. Hvor mange ord man skal

kunne afhænger af, hvilke opgaver man skal kunne udføre. For sproglæreren er

spørgsmålet om, hvor mange ord eleverne skal kunne særligt interessant. Hvis

sproglæreren ikke ved hvor mange ord eleverne skal kunne fx efter afslutning af

grundskolen eller efter afslutningen af den obligatoriske danskundervisning i

gymnasiet, har han/hun ikke noget mål at arbejde hen imod. Dem der har kendskab til

den nationale læseplan i Island [Aðalnámskrá grundskóla, 2013] ved imidlertid godt, at

man ikke kan slå op på side sytten, eller noget andet sted, og finde et tal, for hvor stort

et ordforråd det forventes, at eleverne har ved afslutningen af den obligatoriske

danskundervisning i grundskolen eller gymnasiet. I dette afsnit beskæftiger jeg mig

med, hvor stort et ordforråd der skal til, for at man som fremmedsprogselev kan udføre

forskellige opgaver på målsproget. En ting er hvor mange ord man skal kunne, en anden

20

ting er, at det ikke er alle ord, der har lige stor værdi for eleven at kunne. Her kommer

frekvensniveauerne ind billedet.

Ordlister

Der findes forskellige lister over ord i sproget. De to typer jeg her vil komme ind på er

frekvenslister og lister over akademisk ordforråd.

Frekvenslister

Når man kigger på, hvilke ord der er de mest brugte i sproget, afhænger resultatet af

hvilke sproglige materialer, man undersøger. Man kan undersøge både talt sprog og

skriftligt sprog. Det er imidlertid lettest at undersøge skrevet sprog, hvorfor de

frekvenslister der findes over sprog, i vid udstrækning er frekvenslister over det

skrevne sprog. Når man kigger på forskellige frekvenslister over det skrevne sprog, er

der afvigelser mellem listerne afhængigt af, hvilke typer skriftligt materiale listerne er

baseret på. På dansk findes der forskellige frekvenslister af varierende alder. På

www.sproget.dk omtales der fire forskellige danske frekvenslister, der bygger på

ordmateriale af vidt forskellige størrelse.

Den første liste er fra bogen Hyppige Ord i Danske Aviser, Ugeblade og Fagblade og

lavet på grundlag af 250.000 ord. Ordene stammer fra tekstuddrag fra udvalgte

fagblade fra 1970-74. Den anden liste er fra bogen Hyppige Ord i Danske Romaner og

er ligeledes lavet på grundlag af et materiale på 250.000 ord. Ordene stammer fra

tekstuddrag fra udvalgte børnebøger fra 1970-74. Den tredje stammer fra bogen Dansk

Frekvensordbog, som bygger på et grundlag på 4.070.419 ord, hvor ordene stammede

fra tekstuddrag fra udvalgte romaner og noveller, aviser og ugeblade fra 1987-90. Den

fjerde liste, som er den jeg har valgt at bruge i denne her opgave, er en liste som Det

Danske Sprog- og Litteraturselskab har lavet. Listen er lavet ud fra et tekstmateriale

bestående af cirka 880 millioner ords tekst, hvilket er en helt, helt anden skala end de

øvrige frekvenslister. Det skyldes, at denne liste er blevet udarbejdet efter det blev

muligt at bruge computere til at analysere tekstmaterialet. Teksterne som lå til

grundlag for listen fra Det Danske Sprog- og Litteraturselskab bestod primært af

nyhedsstof fra 2006-2016. Listen består af lemmaer. Ifølge den liste er de ti hyppigste

21

ord på dansk: i, være, og, en, den, på, til, det, at, af (www.sproget.dk), men der er ikke

de store afvigelser i de ti hyppigste ord imellem de fire lister. Det skyldes, at de mest

højfrekvente ord er funktionsord, der får sproget til at hænge sammen, og det at

sproget skal hænge sammen ændrer sig ikke over tid på samme måde som

indholdsordene, som i højere grad afspejler tidsånden, om man så må sige. I

forbindelse med frekvenslister over det danske sprog er det også værd at nævne, at

Ruus (1995) udarbejdede en liste med 1117 kerneord i dansk, som betegnes som

værende dele af den basale ordviden hos alle dansklæsende og dansktalende.

Akademiske ordlister

Den gruppe af ord som betegnes som akademiske ord er kendetegnet ved, at de

hyppigt bruges i forskellige akademiske tekster på tværs af fagområder. Den ifølge

Nation (2013) mest kendte liste over akademiske ord er The Academic Word List

(Coxhead, 2000). The Academic Word List består af 570 ordfamilier og er udarbejdet på

baggrund af et korpus af akademisk engelsk bestående af 3,5 mio. tokens på tværs af

de fire akademiske felter; humaniora, naturvidenskab, jura og handel (I. S. P. Nation,

2013). Ifølge Nation (2013) er det at lære det akademiske ordforråd et mål af høj

prioritet for elever, som har planer om akademiske studier på engelsk, så snart

eleverne har lært de 2000 hyppigste ord i engelsk. Når eleverne har lært de 2000

hyppigst forkomne ord, har de fået en dækning på 90 pct. af ordforrådet i en

akademisk tekst. Nation argumenterer for, at selv hvis man regner med, at det

akademiske ordforråd kun giver 6 pct. dækning, som Hyland and Tse (2007) kom frem

til indenfor naturvidenskab, er det en højere dækning end eleverne ville kunne opnå

ved at lære ordene fra det tredje 1000 ordniveau.

Der findes som sagt akademiske ordlister på engelsk, men på dansk er sagen en lidt

anden. Ifølge Jakobsen et al. (2018) er status i en skandinavisk kontekst, at der på

nuværende tidspunkt er udviklet akademiske ordlister på både svensk og norsk. Den

svenske liste indeholder 655 lemmaer, og den norske liste indeholder 750 lemmaer. De

to lister har det til fælles, at generelt højfrekvens ordforråd til en vis grad er

ekskluderet fra listerne ved hjælp af en eller anden form for stop-liste. På dansk er den

akademiske ordliste ifølge Jakobsen et al. (2018) fortsat under udarbejdelse. Man har

22

ifølge Jakobsen (2017) etableret et korpus, som benævnes AcaDan, på tværs af

discipliner, som skal danne grundlag for udarbejdelsen af en akademisk ordliste på

dansk. Listen er lavet, men den kræver nærmere undersøgelse, før den kan anvendes i

praksis.

Dækningsgrad

I fastsættelsen af hvor stort et ordforråd eleverne har brug for tales der ofte om to

grænseværdier; 95 procentgrænsen og 98 procentgrænsen. Ved 95 procentgrænsen

kender eleven 95 procent af de ord, der forekommer i en tekst. De øvrige fem procent

af ordene er for eleven ukendte. På samme måde gør det sig gældende for 98

procentgrænsen, hvor eleven kender 98 procent af ordene, og to procent af ordene er

ukendte. I praksis betyder 95 procentgrænsen, at når eleven læser en tekst er fem ud

af hundrede ord ukendte, eller sagt på en anden måde hvert tyvende ord er ukendt. 98

procentgrænsen betyder i praksis, at to ud af hver 100 ord er ukendte eller hvert 50.

ord er ukendt. Forskellen på de to grænseværdier 95 procentgrænsen og 98

procentgrænsen er, at forskning har vist, at en lille gruppe elever er i stand til at læse

og forstå en tekst med et ordforrådskendskab på 95 procent, men langt den største del

af eleverne har brug for et kendskab på 98 procent (I. S. P. Nation, 2013).

Forskellige opgavetyper kræver som tidligere nævnt forskellig mængder ordforråd. I

nedenstående tabel ses hvor stort et ordforråd man ifølge I. S. P. Nation (2013) skal

have for at kunne opnå henholdsvis 95 procent og 98 procent dækning af forskellige

teksttyper. Det man i denne sammenhæng skal være opmærksom på, er at antal ord i

nedenstående tabel er opgivet i ordfamilier, hvorimod jeg i denne opgave, og vi i

Danmark og Norden generelt, oftest opererer med lemmaer.

Tekstmateriale 95% dækning 98% dækning egennavne

romaner 4000 ordfamilier 9000 ordfamilier 1-2%

aviser 4000 ordfamilier 8000 ordfamilier 5-6%

børnefilm 4000 ordfamilier 6000 ordfamilier 1,5%

talt engelsk 3000 ordfamilier 7000 ordfamilier 1,3%

Tabel 1 Dækningsgrad 95/98 pct. af forskellige tekstmaterialer

23

(I. S. P. Nation, 2013, p. 16)

Tallene i tabel 1 er særligt interessante, når vi sammenholder dem med kravene fra den

nationale læseplan for grundskolen [Aðalnámskrá grundskóla, 2013], der bl.a.

udtrykker forventninger om, at eleverne ved grundskolens afslutning skal være i stand

til at ”læse autentiske tekster fx fra aviser, magasiner og internetressourcer”

(Aðalnámskrá grunnskóla Almennur hluti 2011 Greinasvið 2013, 2013, p. 126). Dette

udsagn indikerer sammenholdt med tallene fra ovenstående tabel, at man har en

forventning om, at eleverne har kendskab mindst 4000 ordfamilier, når de forlader

grundskolen. Og det tal er endda meget lavt sat, da et kendskab til 4000 ordfamilier

kun giver en dækningsgrad på 95 pct., som for de fleste elevers vedkommende er i

underkanten.

Man kan også vende talmaterialet om og kigge på, hvor stor en dækning, dvs. hvor stor

en procentdel af en given tekst, man kan forstå, hvis man fx har kendskab til de

hyppigst forkomne 1000 ord. Dvs. hvor mange procent af en given tekst kan eleven

forstå, hvis han/hun har kendskab til de hyppigste 1000 ord i målsproget. Og hvor

mange procent kan han/hun forstå, hvis han/hun har kendskab til de hyppigst

forkomne 2000 ord osv. På den måde kan man se hvor stor en ”fortjeneste” i form af

forståelse af ordforråd, eleven ”tjener” på hvert 1000 ordniveau, som han/hun tilegner

sig. Det første 1000 ordniveau giver mest, dvs. den største fortjeneste, og dernæst

falder mængden drastisk for hvert 1000 ordniveau (I. S. P. Nation, 2013).

1000 ordniveau Dækning af tokens i pct. Opsummeret dækning af tokens i pct. inkl. egennavne, grænseord og gennemskuelige sammensatte ord

1. 1000 77,96 81,14

2. 1000 8,10 89,24

3. 1000 4,36 93,60

4. 1000 1,77 95,37

5. 1000 1,04 96,41

6. 1000 0,67 97,08

24

7. 1000 0,45 97,53

8. 1000 0,33 97,86

9. 1000 0,22 98,08

10. 1000 0,28 98,23

11. 1000 0,15 98,38

12. 1000 0,11 98,49

13. 1000 0,09 98,58

14. 1000 0,07 98,65

15. 1000 0,06 98,71

16. 1000 0,04 98,75

17. 1000 0,04 98,79

18. 1000 0,03 98,83

19. 1000 0,02 98,85

20. 1000 0,01 98,86

Egennavne 2,57

Grænseord 0,31

Sammensatte ord 0,30

Off list 1,02 99,08

Tabel 2 Dækningsgrad for hvert 1000 ordniveau

(I. S. P. Nation, 2013, p. 21)

Det der er mest bemærkelsesværdigt ved tabellen er for det første, hvor enorm stor en

dækning man får ved at have kendskab til de hyppigst forkomne 1000 ord i engelsk.

Ved at kende dem, får man knap 78 procents dækning. Og man får 81 procent

dækning, hvis man tæller egennavne, grænseord og gennemskuelige sammensatte ord

med. Frekvensniveau to for de 1000 næst hyppigste ord i engelsk er også interessant,

fordi det niveau alene giver godt otte procent, som ikke lyder af meget i forhold til 78

procent i det første 1000 ordniveau, men alligevel er et højt tal, når man sammenligner

med hvor lidt man ”tjener” i procentpoint ved at lære ordene i de efterfølgende

frekvensniveauer.

Jakobsen et al. (2018) undersøgte dækningsniveauet for det første 1000 ordniveau på

dansk i forskellige tekstformer; generelle teksttyper, akademiske tekster og

fagspecifikke teksttyper, og i alle tre tilfælde havde det første 1000 ordniveau højest

dækning, efterfulgt af det andet 1000 ordniveau osv. Det mønster for udvikling i

25

dækningsgrad, hvor dækningen er højest i det første 1000 ordniveau, mindre i det

andet 1000 ordniveau osv. ligner det dækningsmønster man ser på engelsk. Jakobsen

et al. (2018) anfører, at udviklingen i dækningsgraden på dansk følger udviklingen i

dækningsgraden på engelsk, hvilket er vigtigt, da man dermed mere eller mindre, kan

overføre tallene fra det engelske sprog til det danske sprog, dog med det in mente, at vi

på dansk tæller i lemmaer, ikke i ordfamilier.

Hvis vi igen ser på tabel 2, er særligt 4000 ordniveauet interessant, fordi eleven, ifølge

tabellen, ved det frekvensniveau opnår 95 procent dækning, som er den grænseværdi,

hvor man mener, at en lille del af eleverne vil være i stand til at læse teksten uden

hjælpemidler. 9000 ordniveauet er også interessant, fordi eleven ifølge tabellen ved det

frekvensniveau opnår 98 procent dækning, som Nation (2006) ifølge Stæhr (2009)

bruger som grænseværdi for hvilken ordforrådsstørrelse, der skal til for, at eleven kan

opnå tilstrækkelig forståelse for skrevne og talte tekster. Stæhr (2009) henviser også til

Hu and Nation (2000) der angiver, at en forståelse af 98 procent af ordforrådet er en

forudsætning for at få en rimelig læseforståelse.

Hvor vigtige tallene i de ovenstående tabeller er, afhænger af hvad det er for en

elevgruppe man underviser. Med andre ord giver det måske begrænset mening at tale

om, at ens elever skal opnå 95 procent og 98 procent dækning, hvis det ordforråd der

skal til for at opnå en sådan dækning, er lysår fra størrelsen af det ordforråd ens elever

reelt har. En ting der imidlertid går igen mange steder, og derfor må ses som et vigtigt

delmål, er vigtigheden af, at elever lærer de 2000 hyppigst forkomne ord. Nation (2013)

udtrykker det på denne måde:

Generelt er højfrekvens ordforråd så vigtigt at alt hvad lærere og elever kan gøre for at sikre sig at det

bliver lært er værd at gøre (I. S. P. Nation, 2013, p. 25). 6

Nations (2013) definition af høj- mellem- og lavfrekvens ordforråd på baggrund af

British National Corpus ses i nedenstående tabel.

6 ”In general, high-frequency words are so important that anything that teachers and learners can do to make sure they are learned is worth doing” (I. S. P. Nation, 2013, p. 25).

26

Ordforråds type % dækning

Højfrekvens (2000 ordfamilier) 86%

Mellemfrekvens (7000 ordfamilier) 9%

Lavfrekvens (10.000 ordfamilier og opefter) 1-2%

Egennavne m.m. 3-4%

Total 100%

Tabel 3 Dækningsgraden for høj-, mellem- og lavfrekvens ordforråd

(I. S. P. Nation, 2013, p. 22) De grænseværdier der her er blevet beskrevet, er alle lavet på basis af det engelske

sprog. På dansk har vi endnu forholdsvis lidt materiale sammenlignet med mængden af

undersøgelser, der er lavet på engelsk, hvilket er naturligt nok, da dansk er et sprog

med væsentlig færre sprogbrugere. Den undersøgelse Jakobsen et al. (2018) lavede af

højfrekvent ordforråd og akademisk ordforråd på dansk er imidlertid et vigtigt skridt på

vejen.

Testtyper

Der findes forskellige typer af tests til at teste ordforråd med. I dette afsnit vil jeg

komme ind på tre testtyper, som alle spiller en vigtig rolle i ordforrådsforskningen. Man

kan ikke udpege én testtype og sige, at den er den bedste, da de forskellige testtyper

tester forskellige aspekter af ordforråds kendskab, og alle testtyper har forskellige

fordele og ulemper. Den fuldkomne test findes med andre ord ikke, selvom enkelte

tests gennem tiden er blevet udråbt som tæt på den fuldkomne test. I. S. P. Nation

(2013) anfører, at når man vil afgøre hvilken ordforrådstest der er den bedste til

formålet, er der tre ting man først skal overveje; formålet med at man vil teste, hvilken

form for kendskab eller viden man vil teste og under hvilke omstændigheder prøven vil

blive forelagt.

Når man taler om formål med at teste, er det fordi en underviser kan have forskellige

grunde til at ville teste sine elevers ordforråd. Det kan være for at finde ud af hvilke

niveau eleverne er på for på den baggrund at kunne vælge undervisningsmateriale, fx

læsetekster i en passende sværhedsgrad. Det kan også være for at kunne inddele en

større elevgruppe i mindre grupper efter hvor meget de kan. Eller for at undersøge om

27

eleverne har lært et givent ordforråd, som man har arbejdet med i undervisningen i en

kortere eller længere periode, eller for at undersøge om der er mangler eller huller i

elevernes ordforråd.

Når man som underviser, forud for valg af test, skal overveje hvilken ordforrådsviden

man vil teste, er det fordi der, som tidligere omtalt, findes forskellige aspekter af at

kende et ord.

Når man som underviser skal overveje, under hvilke omstændigheder prøven vil blive

forelagt, er det, fordi det spiller en rolle i forhold til hvor lang tid, man som underviser

kan og vil bruge på at teste sine elevers ordforrådsviden. For det første er det et

spørgsmål om lærerresurser. Hvis du er én underviser med 25 elever i seks lektioner

om ugen i ét semester, er det svært at argumentere for fornuften i, at du sætter dig

med hver enkelt elev for at udføre en tilbundsgående ordforrådstest, mens de øvrige

elever arbejder selvstændigt, da projektet hurtigt kan komme til at ”koste” en hel uges

undervisningstid. Derfor vil de fleste undervisere nok foretrække en testtype, hvor alle

eleverne kan tage testen selvstændigt og samtidigt. Hvis formålet med

ordforrådstesten derimod er led i et forskningsprojekt, kan der være god logik i at teste

eleverne én og én, da man i den sammenhæng ikke er bundet af, at de resterende

elever også skal undervises eller have hjælp, mens man sidder og tester den enkelte.

Vælger man en testtype som kan forelægges hele elevgruppen samtidig, er det også

værd at have med i sine overvejelser, hvor meget undervisningstid man vil bruge på

testen i forhold til, hvilke oplysninger man får ud af at teste. Hvis fx ens mål med at

teste er at undersøge, om eleverne har lært en bestemt mængde ord, som man har

arbejdet med i et kort undervisningsforløb, skal testen i min optik, tilsvarende være

kort, dvs. hurtig at tage, fordi man som underviser, hellere vil bruge tiden på

undervisning, end på at undersøge om undervisningen har den ønskede effekt.

Der findes mange forskellige testtyper. Jeg vil i det følgende præsentere nogle af de

testtyper, som jeg potentielt kunne have brugt i denne undersøgelse af hvor stort et

ordforråd eleverne har, når de er i gang med den obligatoriske danskundervisning i den

islandske gymnasieskole.

28

Vocabulary Levels Test

Vocabulary Levels Test, herefter omtalt som VLT, blev udviklet af Nation i starten af

1980erne. VLT var tænkt som et værktøj til brug i klasseundervisningen, hvor

underviseren kunne bruge det til at udvikle et undervisningsforløb i ordforråd af en

passende sværhedsgrad til deres elever (Read, 2000). P. Nation and Beglar (2007)

skriver, at VLT er et værktøj som bliver brugt vidt omkring til at afgøre, om eleven skal

fokusere på at lære højfrekvens, akademisk eller lavfrekvens ordforråd.

VLT er en diagnosticerende test med i alt fem niveauer. De fem niveauer er 2000, 3000,

5000 og 10.000 ordniveauerne samt det akademiske ordforrådsniveau. Det er elevens

scoring på det enkelte niveau af testen der er det vigtigste, ikke elevens samlede

scoring i testen. Elevens scoring i de enkelte niveauer af testen giver et fingerpeg om,

hvilken type ordforråd det er hensigtsmæssigt at eleven arbejder med eller fokuserer

på efterfølgende. Underviseren er først og fremmest interesseret i, om eleven har et

tilstrækkeligt kendskab til ordene i testens første niveau, dvs. 2000 ordniveauet, dvs.

har eleven tilstrækkeligt kendskab til de hyppigste 2000 ord. Efter at have testet

elevens kendskab til de 2000 hyppigst forekomne ord, afhænger det af elevens

fremtidsplaner, hvilket ordforråd underviseren dernæst skal fokusere på. Hvis eleven

har planer om et akademisk studie på målsproget, er det hans/hendes kendskab til

ordforrådet på det akademiske niveau der, næstefter kendskabet til de 2000 hyppigst

forekomne ord, er bedst at fokusere på. Hvis eleven derimod ikke har intentioner om

akademiske studier på målsproget, er det mellemfrekvens ordforrådet eleven har mest

gavn af at fokusere på at få lært (I. S. P. Nation, 2013).

VLT er en af de testtyper man ofte hører omtalt i forbindelse med undersøgelser af

elevers ordforråd. Read (2000) citerer Meara for at omtale VLT som “det tætteste vi

kommer på en standardiseret ordforrådstest”7. I ordforrådstestning i danske

sammenhænge har VLT bl.a. været brugt i en omfattende undersøgelse af Albrechtsen,

Haastrup, and Henriksen (2008), hvor de undersøgte leksikalsk kompetence og

skrivefærdigheder på L1 og L2 hos danske unge, der lærte engelsk som fremmedsprog.

Albrechtsen et al. (2008) argumenterede for deres valg VLT som testtype med, at den

7 „The nearest thing we have to a standard test in vocabulary” (Read, 2000, p. 118).

29

er velbeskrevet, den er valideret og at den ofte har været brugt som en slags standard

målestok for ordforrådstilegnelse i en række pædagogiske studier. Desuden egnede VLT

sig godt til deres undersøgelse, fordi de undersøgte en elevgruppe, hvis aldersfordeling

og ordforrådsstørrelse havde et stort spænd. I Albrechtsen et al. (2008) undersøgelse

havde man også brug for en dansk version af VLT, som man enten ikke kunne

fremskaffe eller ikke fandtes. Derfor blev der til undersøgelsen udviklet en dansk

version af VLT. Valideringen af den danske version af VLT blev foretaget af Dr. Norbert

Schmitt fra University of Nottingham, som også validerede den originale version af L2

(Albrechtsen et al., 2008).

VLT blev også brugt af Stæhr (2008), hvor han undersøgte hvor stort et ordforråd en

gruppe folkeskoleelever havde på engelsk, og om der var en sammenhæng mellem

størrelsen på deres ordforråd og deres præsentation i læseprøven, lytteprøven og den

skriftlige fremstilling ved folkeskolens reviderede afgangsprøve i engelsk. Stæhr (2009)

anvendte ligeledes VLT i en anden undersøgelse, hvor testpersonerne var en gruppe

førsteårsstuderende fra Copenhagen Business School. I undersøgelsen sammenholdt

han størrelsen på elevernes ordforråd med deres resultater i en lytteforståelsestest for

at undersøge, om der var en sammenhæng mellem størrelsen på deres ordforråd og

deres evne til at forstå en lytteopgave. VLT er ifølge Stæhr (2008) det mest kendte

eksempel på en test, der kan give et fingerpeg om størrelsen på elevers ordforråd ved

at teste udvalgte ord fra forskellige frekvensniveauer.

Hvert testniveau af VLT består af 36 ord og 18 definitioner. De 36 ord er inddelt i seks

grupper med seks ord i hver. Til hver gruppe med seks ord er der tre definitioner.

Eleven skal markere hvilke tre af de seks ord der matcher hvilke af de tre

ordforklaringer. Eksempel fra 2000 ordniveauet:

1 apply 2 elect ____ choose by voting 3 jump ____ become like water 4 manufacture ____ make 5 melt 6 threaten (Read, 2000, p. 119)

30

Ideen bag designet af testen er bl.a. at minimere mængden af læsestof og samtidig

forsøge at mindske risikoen for, at eleverne gætter sig til svaret fx ved at bruge

udelukkelsesmetoden. Read (2000) henviser til Nation, som har argumenteret for, at

selvom der kun er 18 definitioner på hvert niveau, er eleverne nødt til at læse alle 36

ord for at tjekke, hvilket der passer bedst til definitionen. Studier af hvordan

testdeltagere opfører sig, mens de tager testen, har imidlertid vist, at testdeltagerne

kun holdt alle seks ord op mod definitionerne i de tilfælde, hvor de syntes opgaven var

svær. I de tilfælde, hvor de ikke var i tvivl om hvilket ord der var det rigtige svar, brugte

de ikke tid på at kigge på de øvrige tre valgmuligheder.

Selvom VLT har fået mange fine ord med på vejen, og af nogen er blevet omtalt som

det nærmeste vi kommer på en standardiseret ordforrådstest, er der dog også mere

kritiske røster. Read (2000) påpeger, at han mener, at VLT er et fint redskab til

undervisningsbrug, men at den mangler yderligere analysering og validering før den

kan bruges i forskningsøjemed. Nation (2013) påpeger, at VLT ikke måler hvor mange

ord testpersonen kender, men giver en indikation af om testpersonen har behov for at

fokusere på højfrekvens, akademisk eller mellemfrekvens ordforråd.

Vocabulary Size Test

Vocabulary Size Test, herefter omtalt som VST, blev udviklet af P. Nation and Beglar

(2007) Nation. VST er lavet med det formål at vurdere størrelsen af testdeltagerens

receptive, skrevne ordforråd i engelsk og kan tages både af elever med engelsk som

modersmål og af ikke-modersmåls talende (P. Nation, 2012).

VST findes i forskellige versioner både hvad angår længde, men også i både

enkeltsprogede og tosprogede versioner. Den version som efter min opfattelse er den

mest omtalte er den engelske version, der går op til 14.000 ordniveauet. Den anden

engelske version går op til 20.000 ordniveauet. VST er opbygget på den måde, at der er

ti testord til hvert niveau. For at få resultatet af testen skal man multiplicere antal

korrekte svar med 100, da hvert testord repræsentere 100 ord. Hvert testord

præsenteres først alene, herefter bliver ordet præsenteret i en sætning som man har

bestræbt sig på skulle være en meget simpel ikke-definerende sætning (P. Nation,

31

2012). Nedenfor ses et eksempel på hvordan testordene præsenteres i testen.

Testordet er i dette tilfælde maintain og stammer fra 2000 ordniveauet:

1.MAINTAIN: Can they maintain it?

a.keep it as it is

b.make it larger

c.get a better one than it

d.get it

(P. Nation, 2012)

Efter min opfattelse er der en smule uklarhed om hvorvidt testdeltageren behøver at

tage alle niveauer af testen. Et sted anfører I. S. P. Nation (2013), at VST udelukkende er

tænkt som et værktøj der måler testdeltagerens totale ordforrådsstørrelse, hvorfor det

er vigtigt at testdeltagerne gennemfører alle fjorten niveauer af testen. Omvendt siger

P. Nation and Beglar (2007) om VST, at testdeltagere på begynderniveau kan nøjes med

gennemføre de niveauer af testen, som man har forventning om, at de har kendskab til

plus nogle få niveauer derover.

Ordforrådet brugt i VST er skrapt begrænset forstået på den måde, at man så vidt det

overhovedet har kunnet lade sig gøre har brugt ord hentet fra et højere frekvensniveau

end det man tester i. Dvs. at ordforrådet der er brugt i testens første to niveauer, dvs.

1000 ordniveauet og 2000 ordniveauet, kun er ordforråd fra de hyppigste 1000 ord på

West’s (1953) General Service List. Og til 3000 ordniveauet og opefter brugte man kun

ord fra 2000 ordniveauet og derunder i alle de tilfælde, hvor det kunne lade sig gøre.

På samme måde har man i de tilfælde, hvor ordet i flertalsform var hyppigere brugt

end ordet i entalsform brugte flertalsformen (P. Nation & Beglar, 2007).

Hvis vi afslutningsvis skal sammenligne VST med den tidligere omtalte VLT, er VST ifølge

P. Nation and Beglar (2007) en smule sværere end VLT, fordi de fire svarmuligheder i

VST kan indeholde ens delmeninger, dvs. svarene kan minde om hinanden i mere eller

mindre grad. Det står i modsætning til VLT, hvor intentionen var at svarmulighederne

ikke på nogen måde skulle minde om hinanden. Dermed er det i VLT muligt at få et

korrekt svar selvom graden af kendskab til det testede ord er begrænset. VST og VLT

32

adskiller sig også fra hinanden på den måde, at VST ifølge P. Nation and Beglar (2007)

er bedst til at undersøge udviklingen i testdeltagerens ordforråd. VLT er derimod et et

værktøj som bliver brugt vidt omkring til at afgøre, om eleven skal fokusere på at lære

højfrekvens, akademisk eller lavfrekvens ordforråd.

Vocabulary Knowledge Scale

Vocabulary Knowledge Scale, her efter omtalt som VKS, blev introduceret af Paribakht

and Wesche (1993). Ifølge Bruton (2009) er VSK sandsynligvis en af de mest kendte

testinstrumenter til undersøgelse af både receptivt og produktivt ordforråd og har

været brugt i mindst tolv forskellige studier fortrinsvist af L2 engelsk, men også i

forbindelse med spansk og tysk som L2. VKS tester ordforrådsdybde dybde frem for

ordforråds bredde.

VKS består af to skalaer. Den ene del af VKS, som er den del som testdeltagerne

præsenteres for, består af fem trin eller kategorier. De fem kategorier, som

testdeltageren præsenteres for i forbindelse med hvert testord, ser således ud i min

oversættelse, se originalteksten i fodnoten:

I. Jeg kan ikke huske at have set dette ord før

II. Jeg har set dette ord før, men jeg kan ikke huske hvad det betyder.

III. Jeg har set dette ord før, og jeg tror det betyder__________ (synonym eller

oversættelse)

IV. Jeg kender dette ord, det betyder__________ (synonym eller oversættelse)

V. Jeg kan bruge dette ord i en sætning______________ (skriv en sætning)8

(Paribakht & Wesche, 1997, p. 180)

8 I don´t remember having seen this word before. I have seen this word before, but I don´t know what it means. I have seen this word before, and I think it means_____________. (synonym or translation) I know this word. It means____________. (synonym or translation) I can use this word in a sentence: ______________. (Write a sentence.)

(If you do this section, please also do Section IV.) (Paribakht & Wesche, 1997, p. 180)

33

For at analysere testresultatet kombineres de fem overstående kategorier med en

pointskala, som går fra et til fem point. Det er min oversættelse i tabellen. Originaltekst

findes i fodnoten.9

De fem kategorier

Mulig score

1 1 point

2 2 point

3 2 point, hvis ordet oversættes forkert eller synonymet er forkert. 3 point, hvis oversættelse eller synonym er korrekt.

4 2 point, hvis ordet oversættes forkert eller synonymet er forkert. 3 point, hvis oversættelse eller synonym er korrekt.

5 2 point, hvis ordet oversættes forkert eller synonymet er forkert. 3 point, hvis oversættelse eller synonym er korrekt. 4 point, hvis ordet anvendes på en semantisk passende måde i en sætning 5 point, hvis ordet anvendes på en semantisk passende måde og med grammatisk præcision i en sætning

Tabel 4 Pointskala til VKS

(Paribakht & Wesche, 1997, p. 181) Wasche og Parabakht (1996) citeres i Bruton (2009, p. 289) for selv at erklære, at:

VKS kræver hånd-scoring og derfor er testen ikke anvendelig for store grupper af testdeltagere i sin

nuværende form (Bruton, 2009, p. 289).10

VKS kan bruges til at undersøge en begrænset gruppe af studerendes kendskab til et

begrænset antal ord, næsten uanset hvilket niveau de studerende befinder sig på.

Formålet med VKS er at undersøge testdeltagerens udvikling i kendskab til målordene

fra L2 læsning snarere end udvikling i ordforrådets størrelse. Resultatet af VKS kan

udregnes som total score pr. elev og pr. gruppe, hvilket kan reduceres til kender eller

kender-ikke testordet. Alternativt kan resultatet udregnes som antal procent af det

samlede antal ord (nominal kategori), men dette ville ikke kræve brug af

fempointskalaen (Bruton, 2009).

9 1. The word is not familiar at all. 2. The word is familiar but its meaning is not known. 3. A correct synonym or translation is given. 4. The word is used with semantic appropriateness in a sentence. 5. The word is used with semantic appropriateness and grammatical accuracy in a sentence. 10 “The VKS required hand-scoring and is thus not suitable for testing large numbers of students in its

present form”

34

Ifølge Bruton (2009) er der flere svagheder ved VKS. En af svaghederne ved VKS er, at

testordet altid skal præsenteres udenfor sammenhæng, da man ved at opgive ordet i

en sætning ville ødelægge spørgsmål fem, hvor testdeltageren bliver bedt om at bruge

ordet i en sætning. Det at testordet præsenteres uden sammenhæng medfører, at det i

nogle tilfælde, især i forbindelse med højfrekvente ord, som har flere betydninger fx

ordet have, som kan være navneordet en have eller udsagnsordet at have betyder, at

testdeltagerne ikke ved hvilke betydning af ordet der spørges til, hvilket gør, at ord med

flere betydninger ikke kan bruges som testord.

En anden svaghed ved VKS, er ifølge Bruton (2009), at VKS så at sige ”giver”

testdeltageren testordet. Det er en svaghed, fordi en af de sværeste ting ved L2

produktion netop er at fremkalde ordet.

Et tredje kritikpunkt ved VKS omhandler også skalaen med de fem point. Bruton (2009)

mener, at det er problematisk i kategori tre, at testdeltageren bliver belønnet med lige

mange point uanset om han/hun oversætter ordet helt præcist eller mere generelt. I

forhold til selve skalaen finder han det ligeledes problematisk, at de første fire trin

forholder sig til receptivt ordforråd, hvorimod det sidste og femte trin forholder sig til

produktivt ordforråd. Ifølge Bruton (2009) er både fordelingen mellem point for

receptivt og produktivt ordforråd problematisk, dvs. at receptiv ordforrådsviden står

for de første fire point og produktivt ordforrådsviden kun står for det sidste af de fem

mulige point. Også sammenblandingen af point for receptivt og produktivt ordforråd

finder Bruton problematisk, dvs. at hvis testdeltageren scorer fem, så er det femtal

egentlig et udtryk for både receptivt og produktivt ordforråd. Han mener ligeledes, at

det er problematisk, at der kun er et points forskel på, om man kan oversætte eller

finde et korrekt synonym for et testord eller om man ikke kan. Og på samme måde kun

et points forskel på om man kan bruge ordet semantisk korrekt eller om man kun kan

oversætte eller finde synonym.

En fjerde svaghed ved VKS er, ifølge Bruton (2009), hvordan man tolker de tal, man som

testadministrator får ud af at bruge fempointsskalaen, fordi vidt forskellige svar kan

give samme resultat. Hvis fx testdeltageren markerer kategori et; Jeg kan ikke huske at

35

have set dette ord før femten gange, udløser det femten gange ét point, dvs. femten

point i alt. Hvis derimod testdeltageren tre gange anvender et testord til højeste score,

dvs. anvender ordet på en semantisk passende måde og med grammatisk præcision i

en sætning, udløser det tre gange fem point, dvs. femten point, men de femten point

som den første testdeltager fik er næppe sammenlignelige med de femten point, som

den sidste testdeltager fik. I mellem de to yderpunkter kan der også tænkes et

eksempel, hvor en testdeltager fem gange scorer kategori et, dvs. markerer at han/hun

ikke kan huske at have set ordet før, kombineret med to ord, som han/hun scorer fem

point for, dermed lander vi igen på en scoring på femten point, men denne gang

dækker tallet femten over, at der var fem testord som testdeltagerne ikke kunne huske

at have set før og to ord, som han/hun demonstrerede brugen af til perfektion.

Problemerne med fempointskalaen leder os videre over i Brutons femte store

kritikpunkt ved VKS, som angår hvordan man skaber overblik over testresultaterne.

Som følge af ovenfor nævnte problematik med, at vidt forskellige scoringer kan give

samme resultat i point, mener Bruton, at det er meningsløst at udregne totalscore pr.

ord, da det ville give en tvetydig relativ værdi. Det samme gør sig gældende for at

udregne total score pr. testdeltager eller testdeltager gruppe. Det ville i alle tilfælde

give et svar, som kan dække over et utal af kombinationsmuligheder. Og her er muligvis

det største kritikpunkt. Bruton mener ikke, at testdeltagerens scoring i testen eller

nogen form for gruppering af scoringer i testen giver mening, hvorfor han mener, at

testen fejler netop på det punkt som var VKS hovedformål, nemlig at rapportere om

udvikling i testdeltagernes dybdekendskab til testordene. Bruton (2009) konkluderer, at

VKS i bedste fald kan anvendes til at vurdere udvikling pr. kategori over tid.

Opsummerende kan man sige, at VKS kan bruges til at undersøge en begrænset gruppe

af studerendes kendskab til et begrænset antal ord, næsten uanset hvilket niveau de

studerende befinder sig på. Formålet med VKS er at undersøge udviklingen i

testdeltagerens kendskab til målordene snarere end udvikling i ordforrådets størrelse.

Hvis man afslutningsvist skal sammenligne de tre testtyper, som jeg har gennemgået i

dette afsnit, kan man sige, at VST er god til at undersøge udviklingen i størrelsen af

testdeltagerens ordforråd. VLT er god til at diagnosticere, hvilket ordforråd eleven har

36

mest udbytte af at fokusere på at lære på et givent tidspunkt i sprogundervisningen.

VKS er god til at undersøge testdeltagernes udvikling i dybdekendskab til testordene.

37

Empiri

Udvikling af ordforrådstesten

Denne opgave drejer sig om at undersøge hvor stort et ordforråd eleverne har, når de

er midt i den obligatoriske danskundervisning i gymnasiet. Målet med undersøgelsen

er således at tegne et øjebliksbillede af elevernes ordforråd på dansk. Den perfekte

ordforrådstest findes som tidligere omtalt ikke, da forskellige typer af ordforrådstests

tester forskellige aspekter af ordforråd og alle testtyper har forskellige fordele og

ulemper. I. S. P. Nation (2013) taler om, at man forud for valg af ordforrådstest skal

overveje tre ting; formålet med at man vil teste, hvilken form for kendskab eller viden

man vil teste og under hvilke omstændigheder testen vil blive udført. Jeg vil i det

følgende besvare de tre spørgsmål i relation til den ordforrådstest, jeg lavede og

anvendte i forbindelse med udarbejdelsen af dette speciale.

Mit formål med at teste var at få et generelt billede af størrelsen og kvaliteten af

elevers ordforråd med henblik på at vurdere, om de har tilstrækkeligt styr på 2000

ordniveauet til, at det er realistisk og gavnligt at beskæftige sig med mellemfrekvens

eller akademisk ordforråd som en del af danskundervisningen i gymnasiet. Og også for

at vurdere om eleverne har nogle mangler i det højfrekvente ordforråd som spænder

ben for, at de kan udføre de opgaver som underviserne forventer og stiller krav om.

Det optimale ville være at lave en tilbundsgående ordforrådstest af både elevernes

receptive og produktive ordforråd. Virkeligheden er, at det er simplest at teste

receptivt ordforråd, fordi det er mindre tidskrævende. Produktiv ordforrådstestning

kræver mere tid pr. testord, når eleven udfører testen, fordi eleven selv

skal ”producere” sprog, fx en sætning enten oralt eller skriftligt for at demonstrere, at

han/hun kan bruge ordet produktivt. Efterfølgende skal underviseren vurdere elevens

svar, for at se, om svaret i tilstrækkelig grad demonstrerer, at eleven har kendskab til og

kontrol til at bruge ordet på en tilfredsstillende måde. Svaret på hvilken

ordforrådsviden jeg ville teste i denne sammenhæng blev derfor, at jeg gerne ville teste

både receptivt og produktivt ordforråd i det omfang det kunne lade sig gøre i forhold til

de praktiske omstændigheder.

38

I forbindelse med denne undersøgelse havde jeg den tidsmæssige begrænsning, at de

undervisere som lagde elever til undersøgelsen, naturligvis ikke var interesserede i at

bruge for megen undervisningstid på ordforrådstesten. Rent praktisk havde jeg derfor

de begrænsninger, at testen skulle kunne tages på mindre end én lektion, at samtlige

elever på holdet skulle kunne tage testen samtidig og testen skulle være anonym.

Ifølge Read (2000) er der tre ting man må tage højde for man kan teste størrelse af

ordforråd. Man skal definere, hvad der tæller som et ord. Man skal finde ud af, hvordan

man vil udvælge de ord man vil teste, og man skal finde ud af, om de udvalgte ord er

kendte for testpersonen. I de følgende afsnit vil jeg redegøre for, hvordan jeg har tænkt

de tre aspekter Read nævner ind i udarbejdelsen af testen, som jeg brugte i min

undersøgelse.

Valg af testmetode

Som tidligere nævnt er de to testtyper VST og VLT begge ret omtalte indenfor forskning

i og testning af ordforråd. De er lette at udføre i det, at samtlige elever kan tage testene

samtidig, det tager begrænset tid for testdeltagerne at udføre testene og det kræver

ikke subjektiv vurdering fra underviseren at vurdere testresultaterne. Der er to ulemper

ved testene. Den ene er, at de begge udelukkende tester receptivt ordforråd. Den

anden, og den der var udslagsgivende for at ingen af de to testtyper kunne anvendes i

denne opgave, er, at det ikke lykkedes mig at tilvejebringe nogle at de to tests i danske

udgaver. VST, som er udviklet af Nation findes i et utal af versioner. Både to engelske

monolingvale versioner som tester op enten op til 14.000 ordniveauet eller op til

20.000 ord niveauet og adskillige bilingvale versioner på bl.a. russisk, japansk og

arabisk, men ikke nogen version på dansk eller et lignede nordisk sprog. Hvad angår VLT

kom jeg som tidligere nævnt frem til ved at læse Albrechtsen et al. (2008), at de havde

fået udviklet en dansk version af VLT i forbindelse med deres omfattende undersøgelse

af ordforråd. Valideringen af den danske version af VLT, som Albrechtsen et al. (2008)

anvendte, blev foretaget af Dr. Norbert Schmitt fra University of Nottingham, som også

validerede den originale version af L2. Det ville have været spændende at få fingrene i

den danske version af VLT, men det lod sig ikke gøre. At udvikle min egen danske

version af VST eller VLT ville have været stof til et helt speciale i sig selv, hvis det skulle

39

gøres ordentligt, da der fx i VST er brugt ordforråd som er hyppigere forekommende

end det ordforråd der testes i, og da udvikling af den slags tests kræver omfattende

pilottestning før testene kan anvendes i praksis.

VKS har den fordel i forhold til VST og VLT, at den både tester receptivt og produktivt

ordforråd. Den har også den fordel, at den består af fem spørgsmål, som ”genbruges”

til hvert enkelt testord. Spørgsmålene er lette at oversætte til et hvilket som helst

sprog, hvis de ikke findes på det pågældende sprog i forvejen. Enhver form for test kan

have godt af at bliver pilottestet inden den skal anvendes i det virkelige liv, men for VKS

er det mindre vigtigt end ved fx VST og VLT, fordi der ikke indgår distraktorer i testen,

som er udslagsgivende for hvilket svar testdeltagerne vælger og dermed for deres

resultat i testen. Derfor endte jeg med at vælge VKS som testtype i denne

undersøgelse.

Grundlag for valg af testord

Den egentlige idé bag mit projekt var, at jeg gerne ville undersøge elevernes kendskab

til de hyppigste forekomne 5000 lemmaer på dansk. Den danske lemmafrekvensliste,

der bygger på det største tekstmateriale og er nyest, er en liste som Det Danske Sprog-

og Litteraturselskab har lavet, som jeg herefter slet og ret vil omtale som lemmalisten.

Listen er lavet ud fra et tekstmateriale bestående af cirka 880 millioner ords tekst.

Teksterne, der lå til grund for undersøgelsen, bestod primært af nyhedsstof fra

perioden 2006-2016, og listen består af de 10.000 mest højfrekvente lemmaer på

dansk. Listen findes i to versioner, en liste inklusivt egennavne, stednavne og tal og en

liste eksklusivt egennavne, stednavne og tal. Jeg valgte at bruge listen eksklusivt

egennavne, stednavne og tal, fordi jeg syntes det gav mest mening i denne her

sammenhæng, da egennavne og stednavne ofte er kontekstafhængige og det derfor

giver begrænset mening at teste i dem.

Umiddelbart kunne det se ud som om, at næste skridt ville være at fastslå en eller

anden form for system til at udvælge hvilke af lemmaer fra lemmalisten jeg ville teste

eleverne i. Når man skal teste ordforråd, er det imidlertid vigtigt at teste i et ordforråd,

som man har en forventning om, at eleverne kender i forvejen. Og da lemmalisten

40

bygger på tekstmateriale fra nyhedsstof, kunne lemmalisten ikke stå alene som

grundlag for udvælgelsen af ordforråd til testen. Jeg bestræbte mig derfor på at finde

noget tekstmateriale, der kunne repræsentere den undervisning mine testpersoner

havde været eksponeret for i grundskolen og et andet materiale, som kunne

repræsentere det tekstmateriale de var og blev eksponeret for i gymnasiet.

Jeg forsøgte derfor at spore mig ind på hvilket tekstmateriale, der bliver arbejdet med i

danskundervisningen i de islandske gymnasier. Jeg nærlæste boglisterne på de

islandske gymnasiers hjemmesider og forsøgte at finde en tendens eller et

undervisningsmateriale, som syntes mere brugt end andet. Den mest fremtrædende

tendens var imidlertid, at der i danskundervisning tilsyneladende bliver arbejdet meget

med ”materialer fra underviser”, som er et vidt begreb, der kan dække over mange

forskellige ting. I de tilfælde hvor boglisterne indeholdt en undervisningsbog, var der

næsten lige så mange forskellige undervisningsbøger, som der var skoler. Der var dog to

undervisningsmaterialer som forekom lidt oftere end de andre. Den ene var Ghetto,

som er en novellesamling fra 2008 skrevet med henblik på undervisningsbrug i

danskundervisningen. Den anden var Glimt (Brodersen, Stefánsdóttir, & Monrad,

2015), som bærer mere præg af at være en egentlig grundbog i danskundervisningen

end Ghetto. Jeg fandt ud fra boglisterne tre skoler, som bruger undervisningsmaterialet

Glimt. Materialet blev udgivet for første gang i 2015 og består i alt af tre bøger; Gnist til

1. trin, Glimt til 2. trin og Glød til 3. trin. Jeg valgte på den baggrund, at Glimt skulle

være det undervisningsmateriale, der repræsenterer gymnasiestoffet.

Jeg valgte at bruge undervisningsbogen Ekko (Ásdís Lovísa Grétarsdóttir & Erna Jessen,

2009), som er henvendt til 10. klasse, som grundlaget for ordforrådet fra grundskolen. I

grundskolen finder man ikke samme variation i brug af grundbog, som man gør i

gymnasiet. Hver skole får tildelt en pulje penge hos Det Islandske

Undervisningsdirektorat [Menntamálastofnun], som de kan købe

undervisningsmaterialer for. Og da grundskolerne, i modsætning til gymnasieskolerne,

skal skaffe undervisningsmateriale til eleverne bliver det ofte med hensyn til lærebøger,

de materialer undervisningsdirektoratet tilbyder, som valget står imellem.

41

Analyse af ordforrådet i Ekko og Glimt

For at få overblik over det ordforråd der anvendes i Ekko og Glimt, var det nødvendigt

at lave en frekvensanalyse af de to bøger. Og for at kunne lave en frekvensanalyse var

det nødvendigt at skaffe de to bøger på elektronisk form. Det var ikke noget problem

med Ekko, da den findes frit tilgængeligt i elektronisk form på Det Islandske

Undervisningsdirektorats [Menntamálastofnun] hjemmeside. Jeg kunne downloade

den som PDF og kopiere teksten direkte over i et Word dokument. I min analyse af

tekstmaterialet fra Ekko brugte jeg al tekst i bogen undtagen forside, bagside,

indholdsfortegnelse, litteraturliste og praktiske oplysninger så som oplag og udgiver. I

Ekko er udvalgte gloser skrevet nederst på siderne. Dem fjernede jeg. I Ekko er der

indlagt skriveøvelser, lytteøvelser og samtaleøvelser i forbindelse med de enkelte

tekster. Dem fjernede jeg også, da de ikke findes i Glimt, og jeg gerne ville have, at de

to tekster fremstod så ens som muligt i den samlede analyse.

Glimt fandtes ikke tilgængeligt på elektronisk form, dvs. jeg måtte lave min egen

elektroniske form. Jeg brugte en gratis app til mobiltelefoner og iPads, der hedder

Genius Scan. Jeg tog billeder af bogens sider med appen, og appen omdannede dem til

PDF-filer, som jeg sendte videre til computeren. I computeren gik jeg ind på en

hjemmeside, der hedder https://www.onlineocr.net/, som kan omdanne PDF-filer til

tekst. Teksten kunne jeg flytte over i et Word dokument, hvor den skulle gennemlæses

for fejl, da det var en udfordring for programmet, hvis de affotograferede sider ikke var

helt vandrette eller hvis der var illustrationer på siderne som overlappede teksten. Jeg

medtog i min analyse al tekst i Glimt bortset fra forside, bagside, indholdsfortegnelse,

litteraturliste og siden i med forskellige praktiske oplysninger så som udgiver, ISBN og

den slags. Jeg valgte at tage forordet og indledningen med i tekstanalysen, fordi begge

dele er skrevet i et sprog og en tone som henvender sig til de elever, der er tænkt som

brugere af bogen. Til Glimt hører der et separat glosehæfte og der er derfor ingen

gloser i bogen. Glosehæftet kom ikke med i analysen. I Glimt er der ingen

skriveopgaver, par-øvelser eller samtaleøvelser. De findes på nettet som materiale til

underviseren og kom ikke med i analysen.

Efter at have fået de to bøger på elektronisk form ”rensede” jeg teksterne. Da

https://www.onlineocr.net/

42

frekvensanalysen af Ekko og Glimt skulle sammenholdes med lemmalisten eksklusivt

egennavne, stednavne og tal fjernede jeg alle egennavne, stednavne og tal, bortset fra

de tal der var skrevet med bogstaver. Dernæst fjernede jeg forskellige tegn fx

udråbstegn, spørgsmålstegn, kolon, semikolon, tankestreger, kommaer, trykstreger,

parenteser og lighedstegn. I de tilfælde hvor det gav mening, erstattede jeg tegnene

med punktum i stedet for at fjerne dem helt. Det var ikke nødvendigt i forhold til selve

frekvensanalysen, men jeg valgte at gøre det alligevel, for at kunne få et realistisk

fingerpeg om, hvor teksterne fra de to bøger lå i forhold til hinanden med hensyn til

lixtal, som jeg også synes var interessant. Det vil jeg komme ind på senere i opgaven.

Efterfølgende ”rensede” jeg teksterne for alle ord, der var på andre sprog end dansk. I

Glimt, som også indeholder tekster skrevet af færinger, grønlændere og islændinge, er

der en del ord på især grønlandsk, men også nogle stykker på islandsk og færøsk, som

jeg alle fjernede. I begge bøger, men især i Glimt, var der også en del engelske ord. Det

kan være svært at skelne mellem hvilke engelske ord, der også kan regnes som danske

ord, fordi de er blevet integreret i det danske sprog hen ad vejen. Jeg besluttede at

sætte grænsen ved hvilke engelske ord, der findes i ordbogen www.sproget.dk . Dvs.

fandtes de ”engelske” ord på www.sproget.dk, fik de lov til at blive i teksten ellers røg

de ud. Eksempler på ord, der fik lov til at blive i teksten er: firewall, bullshit og hacker.

Eksempler på ord jeg fjernede fra listen er: moves og yes.

Ord der kan skrives både med og uden tryk på skulle også have særlig opmærksomhed.

Et ord som café, der både kan skrives som café og cafe tælles i en ordfrekvensanalyse

på www.lix.se, som to forskellige ord, hvis det ene har tryk på og det andet ikke har. For

at det samme ord ikke skulle forekomme to gange, én gang med tryk og én gang uden,

fjernede jeg alle trykstregerne over ord som fx én, ét, dét, dér. Ordet café forekom både

med og uden trykstreg i tekstmaterialet og jeg besluttede at ændre dem alle til café

med trykstreg på. Der var også en del ord, der sikkert af pædagogiske grunde, var

skrevet med tankestreg mellem, hvor man rent retskrivningsmæssigt hvis materialet

var lavet til fx en voksen, modersmålstalende målgruppe nok hellere ville have undladt

stregen. Her ændrede jeg ordene til to separate ord. Dermed blev fx dna-spor til dna

spor og spaghetti-retter blev til spaghetti retter. Der var også nogle ord i teksterne,

som ikke er egennavne, men alligevel ikke optræder i ordbogen. Det var fx barbiedukke

43

og lego. Dem fjernede jeg. Der var ord som forekommer i ordbogen med bindesteger,

og de fik lov til at blive i teksten med bindestreger, det var fx cd-rom-drev og t-shirt. Der

var også nogle ord i teksterne som var ”hjemmestrikkede ord” som fx tillægsordet

sonnergaardsk, som fik lov til at blive. I teksten var der også e-mailadresser og

henvisninger til hjemmesider. De røg ud. Der var titler på priser fx De Gyldne Laurbær,

de røg ud. Endelsen -erne som i fx 1990erne røg ud for at følge eksemplet på hvad der

er medtaget og undladt på den eksklusive lemmaliste. 16-årig fik lov til at blive i tråd

med den eksklusive lemmaliste, hvor man lod betydningsmættede orddele, som fx -

årige indgå og lod ikke-betydningsmættede orddele som -erne (som i fx 1980erne)

falde ud. Så var der sammenskrivninger som fx børne- og ungdomslitteratur. Dem

omskrev jeg til børn og ungdomslitteratur. Som det ses af ovenstående, var der en hel

del valg om hvilke ord der skulle med i tekstmaterialet, og hvilke der ikke skulle med.

Set i bakspejlet ville det måske have været klogere at lade barbiedukke og lego blive på

listen og sonnergaardsk falde ud, men i det store billede har det ikke afgørende

betydning for resultatet.

Da de ”færdigrensede” tekster fra Ekko og Glimt lå klare analyserede jeg dem både

hver for sig og sammen. Analysen af den sammenklippende tekst bestående af både

Ekko og Glimt, er efterfølgende omtalt som fælleslisten Ekko/Glimt. Jeg analyserede

teksterne ved at køre dem igennem frekvensanalysatoren på www.lix.se .

Ekko Glimt Fælleslisten Ekko/Glimt

Samlet antal ord 29.130 16.388 45.518

Antal forskellige ord 4.835 3.128 6.524

Hvor mange ord der kun forekommer én gang

(4835-1988) = 2847 (3128-1249) = 1879 (6524-2758) = 3766

Procentdel af ord med kun én forekomst

(2847/4835) *100 = 59%

(1879/3128) *100= 60%

(3766/6524) *100=58%

Lixtal 29 27 28

Tabel 5 Resultater af tekstanalyse af Ekko og Glimt

Umiddelbart er det overraskende hvor mange ord, der kun forekommer én gang i

teksterne. I alle tre tilfælde, dvs. både i Ekko og Glimt hver for sig og på fælleslisten for

Ekko/Glimt er andelen på omkring 60 pct. I den sammenhæng skal man huske på, at

44

tallene i ovenstående tabel stammer fra en frekvensanalyse, ikke en lemmaliste, dvs. at

ordene i princippet godt kan forekomme mere end en gang i forskellige bøjningsformer,

men alligevel optræde på listen som om de kun forekommer en enkelt gang, hvis ordet

kun forekommer en gang i hver bøjningsform.

En teksts lixtal, som er en forkortelse af læsbarhedsindekset, fortæller noget om, hvor

let eller svær en tekst er at læse.

Lixtal for læsestof kategoriseres i fem kategorier.

<30: meget letlæst, børnebøger

30-40: letlæst, skønlitteratur, populære magasiner

40-50: middelsvær, normal avistekst

50-60: svær, den normale værdi for officielle tekster

>60: meget svær, bureaukratisk sprog

(www.lix.se)

Lixtallet udregnes ved at lægge gennemsnitlig meningslængde (dvs. antal ord delt med

antal sætninger) sammen med andelen af lange ord (dvs. antal ord med flere end 6

bogstaver delt med det samlede antal ord og gange med 100). Som ses af tabellen

ligger både Ekko og Glimt på knap 30, hvilket betyder, at de begge kategoriseres

som ”meget letlæst/børnebøger”. Det er i sig selv ikke bemærkelsesværdigt, men det

er imidlertid bemærkelsesværdigt, at Ekko, som henvender sig til 10. klasse, har et lixtal

på 29, der er højere end Glimts lixtal, som kun er på 27, set i det lys, at Glimt er

henvendt til et højere skoletrin end Ekko.

Som også ses af tabellen er Ekko næsten dobbelt så lang, dvs. består af næsten dobbelt

så mange ord som Glimt. På den baggrund kan man sige, at ordforrådet fra Ekko er

overrepræsenteret i den fælles frekvensanalyse i forhold til Glimt. Det afspejler på sin

vis virkeligheden fint, idet eleverne som er blevet testet i denne undersøgelse for langt

de flestes vedkommende, har gået et helt skoleår i 10. klasse og på testtidspunktet kun

har deltaget i danskundervisning i gymnasiet i to til tre måneder eller mindre end et

semester.

45

Da den fælles frekvensanalyse af Ekko og Glimt lå klar, kunne jeg begynde at

sammenholde den med lemmalisten. Det krævede flere forsøg at få et brugbart

resultat. Udgangspunktet var, at jeg gerne ville finde 50 testord, som var jævnt fordelt

over de fem første hyppighedsniveauer på lemmalisten, dvs. jeg ville finde ti ord fra

hvert 1000 ordniveau. Jeg ville gerne have ordene jævnt fordelt indenfor de enkelte

1000 ordniveauer, således, at de ikke alle sammen kom fra de første 100 ord i niveauet

eller de sidste 100 ord i niveauet. Samtidig var mit mål at have en jævn fordeling af

testordene i forhold til ordklasser. Dvs. at da fx navneord udgør 60 procent af ordene i

2000 ordniveauet, bestræbte jeg mig på, at 60 procent af testordene i 2000

ordniveauet på min liste også var navneord.

Analyse af ordklasser

For at undersøge hvordan forholdet var mellem de enkelte ordklasser i de forskellige

1000 ordniveauer analyserede jeg ordtyperne på lemmalisten. Det gjorde jeg ved hjælp

af Excel. Konklusionen på min analyse blev, at fordelingen mellem de enkelte ordklasser

skulle være som ses i tabellen nedenfor. Tallene angiver hvor mange ord fra hver

ordklasse, der skal repræsenteres i hvert 1000 ordniveau under forudsætning af at

hvert 1000 ordniveau skulle repræsenteres af ti ord.

Ordtype 1000 2000 3000 4000 5000

A, adjektiver 2 2 2 2 2

D, adverbier 1 1 - - -

NC, substantiver 4 5 6 6 6

V, verber 2 2 2 2 2

T, præpositioner 1 - - - -

Tabel 6 Ordniveau 1000 til 5000 analyseret efter ordklasser

Jeg undersøgte fordelingen mellem funktionsord og indholdsord for alle fem 1000

ordniveauer hver for sig. Funktionsord er ifølge www.sproget.dk; artikler, pronominer

(P), konjunktioner (C) og præpositioner (T). Indholdsord er ifølge www.sproget.dk;

verber (V), substantiver (NC), adjektiver (A) og adverbier (D). Bogstaverne i parentes

46

refererer til kategoriernes navne på engelsk. Jeg valgte at bruge dem, da ordene er

markerede på den måde på lemmalisten. I det første 1000 ordniveau udgør

funktionsordene 8,7 pct. Det valgte jeg at runde op til 10 pct. som altså svarer til, at der

er ét af de ti testord i det første 1000 ordniveau, der repræsenterer funktionsordene.

Funktionsordene er som sagt pronominer (P), konjunktioner (C) og præpositioner (T),

og da præpositionerne (T) udgør den største gruppe af de tre, valgte jeg, at det ene

funktionsord, der skulle med i testen skulle være en præposition. I de øvrige fire 1000

ordniveauer udgør funktionsordene fra 1,7 til 0,5 pct. og blev derfor ikke

repræsenterede blandt de ti ord fra hvert 1000 ordniveau.

Udvælgelsen af 50 testord

Jeg måtte eksperimenter lidt for at finde en passende måde at udvælge ordene på. Mit

udgangspunkt var, at jeg gerne ville have ti ord som repræsentanter for hvert 1000

ordniveau. Først forsøgte jeg mig med bare at vælge hvert 100. ord på lemmalisten,

dvs. ord nummer 100, 200, 300, 400, 500 osv. op til 5000. Det viste sig hurtigt, at det

ikke kunne lade sig gøre, da over halvdelen af ordene fra lemmalisten ikke fandtes på

fælleslisten for Ekko/Glimt.

Mit næste forsøg gik ud på at udvide det antal ord jeg søgte på, så jeg for at finde

ordet, der skulle repræsentere ord nummer 100, ledte mellem ord nummer 91 til 100

på lemmalisten. Ved ordet som skulle repræsentere ord nummer 200 ledte jeg mellem

ord nummer 191 til 200 osv. I det forsøg lykkes det mig nogenlunde at finde ord på

lemmalisten som også fandtes på fælleslisten for Ekko/Glimt. Problemet var, at mange

af ordene kun forekom én enkelt gang på fælleslisten for Ekko/Glimt, hvilket jeg ikke

fandt tilfredsstillende. Jeg ville gerne teste ordforråd, som eleverne forventes at kende

til, og jeg kunne ikke stå inde for, at ord der kun forekommer én enkelt gang på en

fælles frekvensliste over ord brugt i to undervisningsbøger, som de færreste af eleverne

sandsynligvis har læst fra ende til anden, kunne betegnes som ”kendt ordforråd”.

Jeg lavede derfor et tredje forsøg med udvælgelsen af testord, hvor jeg i stedet for at

lade tallene råde, om man så må sige, i stedet opstillede kriteriet for udvælgelsen af

ordene. Kriterierne lød som følger: Jeg ville kun have ord med i testen, der forekom

47

mindst fem gange på fælleslisten for Ekko/Glimt. Jeg ville fortsat have vandtætte

skodder mellem de fem 1000 ordniveauer, og jeg ville forsøge at have ordene jævnt

fordelt ud over de enkelte niveauer, så alle ordene i fx 2000 ordniveauet ikke var hentet

fra omkring 2000 til 2100, men også ord fra 2200, 2300, 2400 og op til 2999. Derudover

skulle ordklasserne være repræsenteret i samme forhold, som fordelingen er mellem

dem i de enkelte 1000 ordniveauer. I dette tredje forsøg lykkes det mig at få lavet en

liste med 50 testord, som jeg kunne stå inde for. Se Tabel 9 De 50 testord i Bilag.

I første udkast havde jeg ordet novelle, som er nr. 3950 på lemmalisten, med på listen

over testord. Det endte imidlertid med, at jeg erstattede novelle med ordet gymnastik,

fordi novelle af testpersonerne kunne forveksles med det engelske ord novel, og det

kunne være svært at vurdere om testdeltagerne kunne afskille de to ords betydning, da

de har betydningssammenfald.

Ordet interesseret er det eneste ord, der ikke forekommer mindst fem gange på

fælleslisten for Ekko /Glimt. Jeg brugte lang tid på at søge efter et adjektiv i 4000

ordniveauet som forekom mindst fem gange, men uden held. Til gengæld optræder

interesseret udover de tre gange, hvor det optræder på fælleslisten over Ekko/Glimt

også som afledning én gang, nemlig uinteresseret og som verbum i nutid interesserer

én gang og som verbum i navneform interessere én gang og som navneord i flertal fire

gange; interesser. Ordet forekommer i alt syv gange i forskellige afledninger og i andre

ordformer foruden de tre gange, hvor det optræder som adjektiv.

En af de store udfordringer i valg af testord, især i de første 1000 ordniveauer var, at jeg

ville forsøge at undgå testord, som tilhører mere end én ordklasse. Det betød, at jeg

blev nødt til at kassere mange gode testord, som ellers havde høj frekvens på

fælleslisten for Ekko/Glimt. Det var ord som fx køb, som både kan være et substantiv i

ental og et verbum i bydeform. Eller unge, som både kan være et substantiv i ental og

et andet substantiv i flertal. Eller verbet at ringe og navneordet i flertal ringe. Eller

navneordet en bakke og udsagnsordet at bakke. Eller navneordet varme og verbet

varme. Eller navneordet plage og verbet plage.

En anden type ord, som måtte udelukkes, var de såkaldte ”falske venner”. I 4000

48

ordniveauet var det svært at finde substantiver. Jeg fandt ordet sodavand, som havde

otte forekomster på fælleslisten for Ekko/Glimt, men da ordet ikke har samme

betydning på dansk og islandsk og muligheden for at undersøge om testdeltagerne

kendte forskellen på ordets betydning på dansk og islandsk ikke var til stede, droppede

jeg ordet.

I 4000 ordniveauet var det svært at finde adjektiver. Ordet sej, som har høj forekomst

på fælleslisten for Ekko/Glimt, er både et adjektiv og et navneord. Jeg valgte at bruge

sej af mangel på bedre, da jeg ikke regnede med at der var nogen testdeltagere, der

kender navneordets betydning, og det derfor ikke ville forstyrre dem i testsituationen.

Afkortning til 30 testord

Efter jeg havde udvalgt de 50 testord, udformede jeg selve testen på hjemmesiden

www.onlineundersoegelse.dk. Den del af processen vil jeg beskrive nærmere senere i

afsnittet, men det korte af det lange var, at jeg var bekymret over, om testen var blevet

for lang til, at eleverne kunne tage den på én lektion, og om de i det hele taget havde

udholdenhed til sådan en lang test. Jeg fik tre personer til at afprøve testen, og de gav

alle tre udtryk for, at de syntes testen var rigelig lang. En af de lærere, som havde sagt

ja til at lade sine elever deltage i testen udtrykte også bekymring over testens længde.

Jeg overvejede at klippe ti testord af, men var fortsat i tvivl, om den var for lang. 35

testord havde også været en mulighed, men jeg ville gerne have et lige antal testord i

hvert 1000 ordniveau, for på den måde at holde muligheden for at analysere testens

resultater i 500 ordniveauer åben, hvis det skulle vise sig at give mere mening. Derfor

valgte jeg i samråd med min vejleder at forkorte testen til bare 30 testord. I

afkortningen af testen tog jeg hensyn til, at ordklasserne fortsat skulle repræsenteres i

forhold til deres andel i de enkelte 1000 ordniveauer og jeg sørgede for, at af de seks

testord, der nu repræsenterede hvert 1000 ordniveau, var fordelingen mellem dem

således, at der var tre testord fra den første halvdel og tre testord fra den senere

halvdel af hvert 1000 ordniveau. Således blev fordelingen mellem ordklasserne på de

seks ord, der repræsenterer hvert 1000 ordniveau som ses i tabellen.

49

Ordtype <1000 6 ord 2000 6 ord 3000 6 ord 4000 6 ord 5000 6 ord

A, adjektiver 16,3% 1 17,3% 1 18% 1 18,7 1 17 1

D, adverbier 10,5% 1 5,8% 0 3,3% 0 2,7 0 2,5 0

NC, substantiver

40,8% 2 52,1% 3 55,2% 3 54,6 3 61,6 4

V, verber 23,2% 1 23,1% 2 22,2% 2 23,3 2 18,3 1

Funktionsord 8,7% 1 1,7% 0 1,2% 0 0,5 0 0,5 0

Tabel 7 De 30 testord fordelt på ordklasser og 1000 ordniveauer

Da jeg skulle forkorte testen, forsøgte jeg efter bedste evne at ”komme af med” de

testord, som jeg var mindst tilfreds i den oprindelige udgave af testen fx fordi de ikke

forekom specielt ofte på fælleslisten for Ekko/Glimt. Listen med de 30 testord kom til at

se således ud.

Nr. på lemma 10.000 listen

Testordet Ord-klasse

Laveste forekomst på fælleslisten Ekko/Glimt

Først forekomne ordform på fælleslisten

Antal forekomster på fælleslisten Ekko/Glimt *

97 sammen D 63 sammen 96

299 person NC 580 person 12+

397 igennem T 616 igennem 9

599 mad NC 196 mad 38+

784 elske V 194 elsker 31+

896 sjov A 291 sjovt 29+

1086 snakke V 328 snakke 33+

1296 vindue NC 529 vinduet 18+

1463 male V 1057 male 5+

1521 kød NC 524 kød 10+

1971 sur A 973 sur 10+

2000 veninde NC 626 veninde 18+

2023 hyggelig A 591 hyggeligt 9+

2123 æg NC 819 æg 6+

2389 slukke V 983 slukker 10

2591 idræt NC 667 idræt 7+

2751 tørre V 1427 tørre 5+

2788 eksamen NC 566 eksamen 9+

3038 brække V 2682 brækker 5+

50

3050 pludselig A 273 pludselig 19

3284 el NC 396 el 13+

3596 kravle V 1872 kravler 6

3732 dagbog NC 673 dagbog 7

3879 søskende NC 1028 søskende 7+

4021 morgenmad NC 724 morgenmad 9

4038 badeværelse NC 651 badeværelset 7+

4334 interesseret**

A 1444 interesseret 3+

4586 lektie NC 438 lektier 12

4665 kysse V 743 kyssede 16+

4870 gymnastik NC 683 gymnastik 7+

Tabel 8 De 30 testord

Testens praktiske udformning

I den praktiske udformning af testen stod valget mellem en test på papir eller en

elektronisk test. Fordelen ved at teste på papir er, at man undgår stress over om

elektronikken strejker i testsituationen, og man undgår bekymringer om tab af data i

tilfælde af at anden part skulle få adgang til programmet. Fordelen ved en elektronisk

test er, at det er let at få overblik over resultaterne, og man til dels undgår at tælle og

føre ind i Excel for at bearbejde resultaterne. Jeg valgte at bruge programmet

www.onlineundersoegelse.dk, som viste sig at være meget let at anvende, og den

færdige test kom efter min mening til at fremstå professionel og lettilgængelig.

Eleverne kunne tage testen enten på deres mobiltelefon, iPad eller computer.

Testen skulle være anonym, hvilket var muligt at sikre ved at indstille programmet

således, at det ikke var muligt at spore testpersonerne via ip-adresserne. Jeg ville

imidlertid gerne give testpersonerne mulighed for at se deres eget resultat i testen,

men da den skulle være anonym, kunne jeg ikke bede om navn. Derfor indsatte jeg

forrest i testen en mulighed for at skrive et dæknavn. I den praktiske udførelse af testen

opfordrede jeg eleverne til at bruge muligheden for at bruge dæknavnet, hvis de var

interesserede i resultatet af testen. Der var to grunde til, at jeg gerne ville give eleverne

mulighed for at få adgang til deres resultat i testen. Den første og vigtigste var, at det

syntes jeg, at jeg skyldte dem, når de nu brugte tid på at tage en test, som jeg havde

udarbejdet primært for egen vindings skyld. Den anden grund var, at jeg forventede, at

http://www.onlineundersoegelser.dk/

51

det var lettere at motivere dem, hvis de havde mulighed for at se resultatet.

Testen indledes med muligheden for at anføre et dæknavn og fire baggrundsspørgsmål.

Baggrundsspørgsmålene var først og fremmest tænkt som en mulighed for at få indblik

i hvilken baggrund testdeltagere havde i forhold til dansk, men også for at identificere

testdeltagere som har boet i Danmark eller har familiære relationer der gør, at deres

danskkundskaber ikke kan regnes til normalen og derfor evt. ikke skulle tælles med i

undersøgelsens endelige resultat. I selve testen blev spørgsmålene stillet på islandsk.

Den islandske version af spørgsmålene ses i fodnoten.11 Spørgsmålene lød som følger:

Dæknavn... (må undlades)

Hvilket køn er du? Pige/dreng/andet

I hvilken klasse begyndte du at lære dansk? I 5. klasse/6. klasse/7. klasse/andet

Har du gået i grundskole i Danmark? Nej/ja, hvis ja, hvor mange år?

Har du forælder/stedforælder eller værge som har dansk som modersmål? Nej/ja

Selve testen bestod af de 30 testord, hvortil der til hvert ord blev stille fem spørgsmål. I

selve testen blev spørgsmålene stillet på islandsk. Den islandske version af

spørgsmålene som blev brugt i undersøgelsen ses i fodnoten.12

I. Jeg kan ikke huske at have set dette ord før

II. Jeg har set dette ord før, men jeg kan ikke huske hvad det betyder.

III. Jeg har set dette ord før, og jeg tror det betyder__________ (synonym eller

oversættelse)

IV. Jeg kender dette ord, det betyder__________ (synonym eller oversættelse)

V. Jeg kan bruge dette ord i en sætning______________ (skriv en sætning)

11 Dulnefni... (má sleppa) Hvaða kyn ertu? Stelpa/strákur/annað

Í hvaða bekk byrjaði þú að læra dönsku? Í 5. bekk/6. bekk/7. bekk/annað Hefur þú verið í grunnskóla í Danmörku? Nei/ja - ef já, hversu mörg ár? Hefur þú foreldri, stjúpforeldri eða foráðamann sem hefur dönsku sem móðurmál? Nei/já. 12 Ég man ekki eftir að hafa séð orðið áður (rétt/rangt) Ég hef séð orðið áður, en ég veit ekki hvað það þýðir (rétt/rangt) Ég hef séð orðið áður og held að það merki... (svaraðu á íslensku) Ég þekki orðið. Það merkir... (svaraðu á íslensku) Ég get notað orðið í setningu... (skrifaðu setningu á dönsku)

52

I undersøgelser af ordforråd bør man skelne mellem receptivt og produktivt ordforråd.

Receptivt ordforråd er ordforråd som testdeltageren kan forstå, når han/hun læser

ordet eller lytter til ordet. Produktivt ordforråd, er ordforråd som testdeltagerne selv

kan ”producere sprog med”, dvs. ordforråd som han/hun kan bruge aktivt, dvs. bruge

verbalt eller skriftligt i en sætning.

Umiddelbart er det langt lettest at vurdere testdeltageres receptive ordforråd fordi

man ”bare” skal beslutte sig for kriterierne for, hvornår man vurderer et ord som

bekendt og hvornår man vurderer det som ubekendt. Når man undersøger produktivt

ordforråd skal testdeltageren i en eller anden grad producere sprog, dvs. skrive eller

sige en sætning for at demonstrere sit kendskab til og sin kontrol over testordet. Når

det kommer til vurdering af produktivt ordforråd er det også mere kompliceret end

vurdering af receptivt ordforråd, fordi testadministratoren skal vurdere i hvor høj grad

han/hun mener, at testdeltageren udviser kontrol over testordet. En sådan vurdering vil

altid i en eller anden grad blive subjektiv, trods alle gode intentioner om at være

objektiv.

Resultater

Jeg forelagde testen på tre forskellige gymnasier i perioden fra den 25. oktober til den

13. november 2019. Det første gymnasie, jeg besøgte, var Fjölbrautaskóli Suðurlands

(FSu) på Selfoss, hvor jeg testede to danskhold. Dernæst kom turen til Menntaskólinn

við Hamrahlíð (MH) i Reykjavik, hvor jeg ligeledes testede to forskellige danskhold. Til

slut besøgte jeg Fjölbreytaskólinn í Breiðholt (FB) også i Reykjavik, hvor jeg testede ét

danskhold. Samtlige hold, som jeg testede på, var hold, der blev undervist i obligatorisk

dansk på gymnasieniveau. Jeg indledte mit besøg med at vise og forklare hvordan

testen virkede, hvorefter testpersonerne gik i gang med at udføre selve testen. Nogle

testpersoner var utrolig hurtige til at gennemføre testen, hvilket stressede mig, fordi

jeg var bange for, at de ikke for alvor prøvede at gøre deres bedste. Ved gennemgangen

af testresultaterne viste det sig imidlertid ikke at have resulteret i direkte ubrugelige

prøver. De testdeltagere der sad i længst tid brugte alt i alt, inklusiv den forklaring jeg

startede med at give, 30 minutter på at gennemføre testen.

53

I alt deltog 104 gymnasieelever i undersøgelsen, men der var kun 96 deltagere der

gennemførte hele undersøgelsen. I det følgende vil jeg kun forholde mig til og omtale

de 96 testdeltagere som gennemførte undersøgelsen. Det er muligt at få adgang til al

data som ligger til grund for undersøgelsen ved at gå ind på:

https://www.onlineundersoegelse.dk/results/bed4fde-1bc9b9c.

Det første baggrundsspørgsmål var egentlig ikke et spørgsmål, men en mulighed for

testdeltagerne til at indsætte et dæknavn således, at han/hun efterfølgende kunne få

sit resultat af testen at se, selvom testen var anonym. Af de 96 deltagere var der 49,

dvs. godt halvdelen, der valgte at benytte sig af muligheden for brug af dæknavn. Efter

min opfattelse er det, at testdeltagerne er interesserede i deres eget resultat et tegn

på, at de tager testen alvorligt og vil gøre deres bedste, hvilket er med til at gøre det

samlede resultat af undersøgelsen mere pålideligt.

Det andet baggrundsspørgsmål var relateret til køn. Der var tre svarmuligheder;

dreng/pige/andet. Der var 37 drenge og 59 piger, der deltog i testen. Dvs. 39 pct. af

testdeltagerne var drenge og 61 pct. af testdeltagerne var piger. Spørgsmålet var først

og fremmest medtaget i undersøgelse for at se, om der var en tendens til, at det ene

køn fik bedre resultat end det andet.

Det tredje baggrundsspørgsmål angik, hvornår testdeltagerne påbegyndte

danskundervisning i grundskolen. Min fornemmelse var, da jeg var ude på skolerne for

at teste, at testdeltagerne i nogle tilfælde havde svært ved at huske det. Ifølge de

oplysninger, som testdeltagerne gav påbegyndte den største del af dem, dvs. 45 pct. af

dem danskundervisningen i 7. klasse. 28 pct. påbegyndte i 6. klasse, 20 pct. i 5. klasse

og syv pct. brugte svarmuligheden ”andet”, som i nogle tilfælde måske dækker over, at

de ikke kan huske hvornår de påbegyndte danskundervisningen i grundskolen. Alt i alt

viser resultatet, at det mest almindelige er, at danskundervisningen påbegyndes i 7.

klasse.

Det fjerde baggrundsspørgsmål gik på, om testpersonerne har gået i grundskole i

Danmark. Der er fem af de i alt 96 testdeltagere, dvs. 5 pct., der angiver at have gået i

skole i Danmark. Én havde gået i skole i Danmark i et halvt år, tre havde gået i skole i

https://www.onlineundersoegelse.dk/results/bed4fde-1bc9b9c

54

Danmark i 4 år og én testdeltager i 7 år. Om det havde betydning for testdeltagernes

resultat, afhænger af hvor gamle testdeltagerne var, da de gik i skole i Danmark, og

hvor gode de har været til at holde danskkundskaberne ved lige. Jeg har brugte

oplysningerne i det afsnit, hvor jeg kommer ind på hvad der karakteriserer de

testpersoner der scorede højest i undersøgelsen.

Det femte og sidste baggrundsspørgsmål drejede sig om, om testpersonerne har en

forælder, stedforælder eller værge, der har dansk som modersmål. Her svarer fire ud af

96, eller det der svarer til fire pct. af testdeltagerne, at det har de. Om det har

betydning for testdeltagernes danskkundskaber afhænger først og fremmest af, om der

bliver talt dansk i hjemmet, da der desværre findes forældre, der ikke taler sit eget

modersmål med sine børn. Oplysningerne om, om testdeltagerne har forældre med

dansk som modersmål kommer jeg ligeledes ind på i afsnittet, hvor jeg behandler hvad

der karakteriserer de testdeltagere, der scorede højest i undersøgelsen.

Receptivt kendskab til de 30 testord

VKS forholder sig både til testdeltagernes receptive og produktive ordforråd. Jeg vil

behandle testdeltagernes receptive og produktive ordforråd hver for sig og begynde

med testdeltagernes receptive ordforråd. Da VKS består af fem spørgsmål til hvert

testord, havde jeg nogle forskellige muligheder for vurdering af, hvornår et testord var

bekendt eller ubekendt. De to første spørgsmål lader testdeltagerne lave en slags

selvrapportering om deres receptive kendskab til testordet. Jeg vil behandle

testdeltagernes svar på spørgsmål et og to under afsnittet om testdeltagernes

produktive kendskab til testordene.

Mit udgangspunkt var at vurdere et testord som bekendt, hvis testpersonen havde

oversat ordet korrekt til islandsk enten i spørgsmål tre eller fire. Da jeg gennemgik

svarene, viste det sig imidlertid, at nogle testdeltagere havde forstået opgaven sådan,

at de ikke behøvede at svare på hverken spørgsmål tre eller fire, hvis bare de svarede

på spørgsmål fem. Det endte derfor med, at jeg valgte at tælle ord som bekendte, hvis

de enten var oversat korrekt eller sætningen overbevisende viste, at eleven havde

kendskab til ordbetydningen.

55

Testens resultater kan vurderes både ud fra hvor mange testdeltagere der genkendte et

givent testord fra et givent 1000 ordniveau, men det kan også vurderes ud fra hver

enkelt deltagers scoring. Jeg vil starte med at se på hvilke scoring de enkelte testord fik.

Nedenstående søjlediagram viser testdeltagernes receptive kendskab til de enkelte

testord. Se Error! Reference source not found. i Bilag.

Figur 1 Testdeltagernes receptive kendskab til de enkelte testord

Det eneste ord, som samtlige testdeltagere kendte, var ordet person, som er af latinsk

oprindelse (www.sproget.dk) og også bruges på engelsk. Derudover ligger det islandsk

ord persóna også tæt på det dansk/engelske ord person. Man kan sige, at

testdeltagerne i tilfældet med testordet person kan hente hjælp både fra deres

kendskab til engelsk og fra eget modersmål. Ordet tilhører det første 1000 ordniveau.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

gymnastik

kysse

lektie

interesseret

badeværelse

morgenmad

søskende

dagbog

kravle

el

pludselig

brække

eksamen

tørre

idræt

slukke

æg

hyggelig

veninde

sur

kød

male

vindue

snakke

sjov

elske

mad

igennem

person

sammen

Andel af testdeltagere der havde receptivt kendskab til testordet

Test

ord

56

Der var to ord i testen der scorede 99 pct. i undersøgelsen. Det er ordet sammen, også

fra det første 1000 ordniveau, som minder en del om det islandske ord saman, men

samtidig også det ord der har den suverænt højeste forekomst blandt testordene på

fælleslisten Ekko/Glimt, hvor det har hele 96 forekomster. Det testord der har næstflest

forekomster på fælleslisten for Ekko/Glimt er ordet mad, som har 36 forekomster. Det

andet ord, der får 99 pct. er elske, som minder om det islandske ord elska og har 31

forekomster på Ekko/Glimt fælleslisten. Elske kommer, som de to andre topscorer

person og sammen, ligeledes fra det første 1000 ordniveau.

Ordene kysse og morgenmad får begge en score på 98 pct. og har derudover også det

til fælles, at de begge kommer fra det femte 1000 ordniveau. Kysse, minder om det

islandske kyssa og har 16 forekomster på Ekko/Glimt fælleslisten. Morgenmad har ni

forekomster på fælleslisten for Ekko/Glimt, og det minder om det islandske ord

morgunmatur, men jeg vil tro, at det der har største betydning for hvor høj en score

det får er, at det er et let gennemskueligt sammensat ord bestående af de to

højfrekvente ord morgen, som er nummer 354 på lemmalisten, og mad, som er

nummer 599 på lemmalisten. Set i bagklogskabens klare lys kan man sætte

spørgsmålstegn ved, om morgenmad er et velvalgt testord af de to grunde, at ordet

mad indgår som et testord et andet sted i testen og af den grund at morgenmad er et

let gennemskueligt sammensat ord bestående af to højfrekvensord. Testordet dagbog

fra det fjerde 1000 ordniveau har samme svaghed, at det er let gennemskueligt og

sammensat af de to højfrekvensord; dag, som er nummer 61 på lemmalisten, og bog,

som er nummer 191 på lemmalisten.

I øvrigt var der en tendens til, at testdeltagernes kendskab til engelsk i nogle tilfælde

forstyrrede dem eller påvirkede deres score i ordforrådstesten negativt. Det skyldes

nok til dels, at testordene blev præsenteret udenfor kontekst. Der var således fire

testdeltagere der oversatte det danske ord mad, som om det var det engelske ord mad

og derfor oversatte ordet til det islandske ord reiður, som betyder vred eller gal. Det

samme problem havde en del af testdeltagerne med testordet male, som hele atten

testdeltagere oversatte til ord, der er relaterer til det at være hankøn, dvs. de svarede

maður, karlkyn eller strákur. Man kan sige, at de to testord male og mad i en testtype

57

som VKS, hvor ordene forekommer ude af kontekst, ikke fungerer optimalt for

testpersoner, der både lærer engelsk og dansk som fremmedsprog. Ordet sjov

oversatte og anvendte én enkelt testdeltager i den engelske/danske betydning show.

Det, at de to sprog islandsk og dansk ligger tæt op ad hinanden, var i nogle tilfælde en

fordel for testdeltagerne, som bl.a. kom til udtryk i forbindelse med testordene kysse

og elske. Af og til var der dog også en tendens til, at det førte testdeltagerne på

vildspor. Testordet vindue blev i seks tilfælde oversat til vindur, det islandske ord for

vind.

Et andet testord, som testdeltagerne behandlede bemærkelsesværdigt, var ordet

interesseret fra 5000 ordniveauet, som er specielt på den måde, at det var det eneste

testord, der ikke opfyldte kravet om at forekomme mindst fem gange på fælleslisten for

Ekko/Glimt. Jeg valgte at medtage det som testord alligevel, fortrinsvis af mangel på

bedre, da jeg ikke kunne ikke finde andre adjektiver. Jeg mener godt, at jeg kan forsvare

brugen af interesseret, fordi det foruden de tre forekomster som adjektiv på

fælleslisten for Ekko/Glimt også forekommer som afledning én gang, nemlig

uinteresseret, som verbum i nutid interesserer én gang, som verbum i navneform

interessere én gang og som navneord i flertal fire gange; interesser. Alt i alt optræder

ordet syv gange i forskellige afledninger og i andre ordformer foruden de tre gange,

hvor det optræder som adjektiv. Det der var bemærkelsesværdigt ved ordet

interesseret er, at 90 pct. af testdeltagerne kender det, selvom det ikke ligner det

islandske ord áhuga. Ordet interesse kommer oprindeligt fra latin (www.ordnet.dk) og

minder om det engelske ord interest. De oversættelser som testdeltagerne lavede af

ordet interesseret var forskellige afledninger af det islandske ord áhugi. De fleste

svarede áhugamál, áhugasamt og áhugasamur. Jeg besluttede mig for, at alle svar som

var afledninger af áhugi talte som rigtige, fordi testdeltagerne efter min bedste

overbevisning ville have afkodet ordet korrekt, hvis de havde set ordet i kontekst, og

alle svar som var afledt af ordet áhugi viste, at de har kendskab til kernebegrebet.

Efter at have set på topscorerne blandt de 30 testord, er det også interessant at se på,

hvilke ord der blev bundskraberne, dvs. dem som færrest testdeltagere havde kendskab

til. Helt i bunden har vi ordet el fra det fjerde 1000 ordniveau, som kun to pct., dvs. to

58

af testdeltagerne havde kendskab til. Ordet el forekommer tretten gange på fælleslisten

for Ekko/Glimt og er egentlig en afkortelse fra svensk af ordet elektricitet

(www.sproget.dk). Mit gæt er, at der var flere testdeltagere, der ville have oversat

ordet rigtigt, hvis testordet havde været elektricitet, som stammer fra græsk og er

kommet ind i det danske sprog via fransk og ligeledes findes i det engelske sprog. Jeg er

også overbevist om, at testdeltagerne ville have scoret højere på ordet el, hvis det var

forekommet i kontekst.

En anden bundskraber var ordet brække fra det fjerde 1000 ordniveau, som kun 15 pct.

eller 14 testdeltagere havde kendskab til. Ordet forekommer fem gange på den fælles

frekvensliste for Ekko/Glimt, som ikke er et overvældende stort antal gange. Ordet

tørre fra det tredje 1000 ordniveau minder om brække. Også et verbum, men fra det

tredje 1000 ordniveau og også kun med fem forekomster på fælleslisten fra Ekko/Glimt.

Ordet tørre er der 21 testdeltagere der kender, hvilket svarer til 22 pct.

Alt i alt kan man sige, at det var en ulempe for eleverne, at testordene ikke forekom i

kontekst og at det oftest var en fordel, hvis testordet mindede om et tilsvarende eller

sammenligneligt islandsk eller engelsk ord, men at det i visse tilfælde også kunne være

en ulempe.

De enkelte testdeltageres score

Hvis vi ser på testordene som en samlet mængde havde testdeltagerne i gennemsnit

kendskab til 19 ud af de 30 testord, dvs. de havde et receptivt kendskab til knap 2/3 af

testordene. Et andet aspekt af resultatet af undersøgelsen af det receptive ordforråds

størrelse er, hvordan fordelingen er mellem de enkelte elever. Om flertallet lå på et

niveau hvor de havde kendskab til cirka 2/3 af testordene eller om der evt. var en stor

gruppe testdeltagerer, der havde et meget omfangsrigt receptivt ordforråd og en

tilsvarende stor gruppe der havde et ret begrænset receptivt ordforråd, hvilket

tilsammen gav et gennemsnit på 2/3. Hvordan fordelingen var imellem de enkelte

testdeltageres score ses i nedenstående søjlediagram. SeTabel 11 Testdeltagernes

samlede score i testen i Bilag.

59

Figur 2 Fordelingen af testdeltagernes samlede score

Hvis man ser på hvad der karakteriserer de tre testpersoner der scorede højest, som fik

29 ud af 30 rigtige, hvilket svarer til 97 pct. rigtige, så kan man se, at den ene

[62287434] er en dreng, der påbegyndte danskundervisningen i 7. klasse og hverken

har gået i skole Danmark eller har forældre med dansk som modersmål. Den anden

[62033125] er en pige, der påbegyndte danskundervisningen i 5. klasse, og hun havde

heller ikke gået i skole i Danmark eller havde forældre, der havde dansk som

modersmål. Den tredje med 29 rigtige [62795634] er ligeledes en pige, der påbegyndte

danskundervisningen i 7. klasse også uden relationer til Danmark.

Den fjerde topscorer med 28 ud af 30 rigtige, dvs. 93 pct. rigtige [62035609] er en

dreng, der svarede andet til, hvornår han begyndte at lære dansk, ikke har gået i skole i

Danmark, men til gengæld angiver at have en forælder med dansk som modersmål. Alt

i alt kan man sige, at de fire topscorer ikke har andet tilfælles, end at ingen af dem har

gået i skole i Danmark. Begge køn er repræsenteret ligeligt, dvs. to af hver, én

påbegyndte danskundervisningen i 5. klasse, to i 7. klasse og én angiver muligheden

andet.

Dernæst er det naturligt at se på hvad der karakteriserer dem, der scorer lavest i

testen. Ingen af de fem med den laveste score havde gået i skole i Danmark eller havde

0

1

2

3

4

5

6

7

8

9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

An

tal t

estd

elta

gere

Antal ord som testdeltagerne havde receptivt kendskab til

60

en forælder med dansk som modersmål. Testpersonen med den laveste score

[62287478] fik fire ud af 30 rigtige, dvs. 13 pct. rigtige. Det er en dreng, som

påbegyndte danskundervisningen i 7. klasse. Der var én testdeltager, der fik otte

rigtige, som svarer til 27 pct. [62035597], som også er en dreng, der angiver andet til

hvornår han påbegyndte danskundervisningen. Der var tre [62287431] [62287447]

[62287419] testdeltagere, som alle er drenge, der fik ni rigtige, svarende til 30 pct. To af

drengene havde påbegyndt danskundervisningen i 7. klasse, den tredje svarede andet.

Udover at de fem lavest scorende allesammen er drenge, der ikke har gået i skole i

Danmark eller har forældre med dansk som modersmål, har de tre af dem det til

fælles, at de påbegyndte danskundervisningen i 7. klasse og de sidste to svarede andet.

Efter at have konstateret at de fem lavest scorende i undersøgelsen alle er drenge

besluttede jeg at undersøge om, der var en generel tendens til at drengene i

undersøgelsen scorede lavere end pigerne. Nedenstående søjlediagram viser

henholdsvis drenge og pigers relative score. Se Tabel 12 Testdeltagernes samlede score

i testen opdelt efter køn i Bilag.

Figur 3 Testdeltagernes samlede score i testen opdelt efter køn

Testen indeholdt som tidligere nævnt 30 testord og testdeltagere havde i gennemsnit

kendskab til 19 af testordene, dvs. omkring 2/3 af testordene. Ved aflæsning af

ovenstående tabel ses, at når man sammenligner det samlede resultat for drenge med

det samlede resultat for pigerne i relativ procent, dvs. i forhold til hvor mange

henholdsvis drenge og piger der deltog i undersøgelsen, er der en tendens til, at

0%

2%

4%

6%

8%

10%

12%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Rel

ativ

pro

cen

t af

tes

tdel

tage

re

Antal ord som testdeltagerne havde receptivt kendskab til

Drenge Piger

61

drengene generelt scorer lavere end pigerne. Hvis vi ser på hvor mange af

testdeltagerne, der har kendskab til 1/3 af testordene eller færre, dvs. har kendskab til

ti eller færre af de 30 testord, er tallet 14 pct. for drengenes vedkommende og 2 pct.

for pigernes vedkommende. Ser vi på hvor mange testdeltagere, der havde kendskab til

2/3 af testordene, dvs. har kendskab til højest 20 af de 30 testord eller færre er tallet

68 pct. for drengene og 53 pct. for pigerne. Der er altså en tendens til, at pigerne

generelt klarer testen bedre end drengene, men det er samtidig vigtigt at huske på, at

det er en forholdsvis lille undersøgelse med kun 96 deltagere. En anden ting man kan

overveje er, om pigerne generelt er mere samvittighedsfulde end drengene, og derfor

er villige til at lægge et større stykke arbejde end drengene i en ordforrådstest, som

ikke betyder noget for deres karakter i dansk. Der er selvfølgelig også den mulighed, at

pigerne generelt har et større ordforråd på dansk end drengene har.

Set med en sprogundervisers briller er det også interessant hvilke 1000 ordniveauer de

testord som testdeltagrene havde kendskab til repræsenterer.

Relative score på 1000 ordniveauerne

De 30 testord repræsenterer som tidligere nævnt de fem første 1000 ordniveauer. Der

er seks testord, der repræsenterer hvert 1000 ordniveau. Jeg vil i det følgende kigge på,

hvordan testdeltagerne scorede i de enkelte niveauer for sig. Nedenstående

søjlediagram viser den samlede testdeltagergruppes relative scoring på hvert af de fem

1000 ordniveauer. Se Tabel 13 Testdeltagernes relative score på 1000 til 5000

ordniveauerne i Bilag.

62

Figur 4 Testdeltagernes relative score på 1000 til 5000 ordniveauerne

Som det ses af søjlediagrammet, scorer testdeltagerne som forventet højest på det

første 1000 ordniveau, mindre i det andet 1000 ordniveau og andelen af rigtige falder

stødt frem til det femte 1000 ordniveau, hvor scoringen er nærmest lige så høj som i

det første 1000 ordniveau. Det er ingen overraskelse, at scoringen er højest, dvs.

elevernes kendskab er størst til det første 1000 ordniveau og at kendskabet derefter er

faldende. Overraskelsen er, at kendskabet stiger igen omkring 5000 ordniveauet og

faktisk er højere på 5000 ordniveauet end på 2000 ordniveauet. Her spiller valget af

testord måske en rolle for hvilket resultat undersøgelsen giver. Seks testord som

repræsentanter for hvert niveau er ikke meget.

Testdeltagernes score på de enkelte 1000 ordniveauer kan tolkes på flere måder. En

score på 78 pct. i det første 1000 ordniveau er ikke overvældende. Her havde jeg nok

forventet en score på mellem 90 og 100 pct. På samme måde havde jeg forventet en

højere score på det andet 1000 ordniveau, hvorimod testdeltagernes score på

henholdsvis 51 pct. og 41 pct. i det tredje og fjerde 1000 ordniveau ikke overrasker mig

synderligt. Hvis man ser på de enkelte testords score på det første 1000 ordniveau, kan

man se at ordet igennem kun scorer 24 pct. Dvs. at der er under 1/4 af testdeltagerne,

der demonstrerer receptivt kendskab til ordet. Hvis man fraregner ordet igennem fra

den samlede score i procent i det første 1000 ordniveau, dvs. udregner den som

(428/480) *100 i stedet for (451/576) *100 får man en score på 89 pct. i stedet for 78

1000 2000 3000 4000 5000

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

Ordniveauer

Rel

ativ

sco

re i

pro

cen

t

63

pct. i det første 1000 ordniveau, hvilket viser, at valget af testord kan have afgørende

betydning for resultatet af undersøgelsen. Dette gør sig i særlig grad gældende i en

undersøgelsen som denne, hvor der er få testord, hvormed hvert testord kommer til at

vægte meget i det samlede resultat.

På samme måde har det sandsynligvis også betydning for testresultatet, at de to

testord morgenmad og kysse, har de tidligere nævnte svagheder som testord, i forhold

testdeltagernes score i det femte 1000 ordniveau. Hvis man fraregner morgenmad og

kysse fra resultatet i det femte 1000 ordniveau, dvs. udregner det som (254/384) *100 i

stedet for (442/576)*100 får man en score på den femte 1000 ordniveau på 66 pct. i

stedet for 77 pct. Et resultat på 66 pct. i det femte 1000 ordniveau er stadig en stigning

i forhold til 3000 og 4000 ordniveauerne, men ikke nær så drastisk. Spørgsmålet er, om

det giver mening at ændre på resultatet ved at fraregne bestemte testord, som af den

ene eller anden grund ikke har fungeret optimalt. Det giver måske snarere mening at se

testens resultater som en tendens eller et fingerpeg om at noget forholder sig på en

bestemt måde.

En anden side af sagen er, hvilken spredning der er i størrelsen af testpersonernes

ordforråd, dvs. er der en stor gruppe der scorer omkring middelscoren på 19 ud af 30,

eller har vi at gøre med en forholdsvis stor gruppe der scorer lavt og en forholdsvis stor

gruppe der scorer højt kombineret med mere eller mindre ikke-eksisterende

midtergruppe. Hvis vi ser på hvor stor en andel af testdeltagerne der befinder sig i

feltet mellem en score på plus eller minus fem fra 19, dvs. score mellem 14 og 24 så

udgør den gruppe 72 af de 96 testdeltagere, dvs. 75 pct. af testdeltagerne. Hvis vi

indskrænker feltet til en score på plus eller minus tre fra 19, dvs. score mellem 16 og 22

er tallet 49 af 96, dvs. 51 pct. af testdeltagerne. Det resultat peger på, at vi har en

forholdsvis stor midtergruppe.

Scoring i 1000 ordniveauerne

I dette afsnit vil jeg kigge på, hvor stor en del af testdeltagerne, der har kendskab til

henholdsvis 1000, 2000, 3000, 4000 og 5000 ordniveauet. Her er tallene baseret på, at

testdeltagerne skal have nået de foregående niveauer for at nå et bestemt niveau. Dvs.

64

at de fx skal have nået både første andet og tredje 1000 ordniveau for at opnå en score

på 3000. Som jeg kom ind på i afsnittet om testdeltagernes score på de enkelte testord,

så var der visse testord, som voldte en stor del af testdeltagerne problemer. I visse

tilfælde skyldtes problemerne testens design, dvs. det at testordene blev præsenteret

udenfor kontekst. Eksempler på testord der voldte mange testdeltagere problemer er

fx testordet male, som 18 ud af 96 testdeltagere oversatte til ord, der relaterede til det

at være hankøn, som er den engelske betydning af ordet male. For at give en smule

rabat, eller rette op på, at visse testord var forbundet med problemer i undersøgelsen,

har jeg i det følgende lavet optællingen på den måde, at testpersonerne regnes for at

have fuldt kendskab til de enkelte 1000 ordniveauer, hvis de har fem eller seks ud af de

seks testord i hvert niveau rigtige. Se Tabel 14 Testdeltagernes kendskab til 1000

ordniveauerne i Bilag.

Figur 5 Testdeltagernes kendskab til 1000 ordniveauerne

Søjlediagrammet viser, at forudsat vi regner det at have mindst fem rigtige ud af seks,

er der 41 pct. af testdeltagerne, der ikke engang havde tilstrækkeligt receptivt

kendskab til det første 1000 ordniveau. 20 pct. af testdeltagerne havde fuldt kendskab

til det første 1000 ordniveau i dansk. Dvs. at ca. 60 pct. af testdeltagerne havde

udelukkende tilstrækkeligt receptivt kendskab til det første 1000 ordniveau eller

mindre end det. Det er ikke et overvældende resultat, når man tænker på, at

testdeltagerne på testtidspunktet med enkelte undtagelser, er blevet undervist i dansk i

mindst fire år i grundskolen og nogle måneder i gymnasiet. Hvis man vender tallene på

0%5%

10%15%20%25%30%35%40%45%

Pro

cen

tdel

af

test

del

tage

rne

De fem tusind ordniveauer

65

hovedet kan man glæde sig over, at der trods alt er ca. 40 pct. af eleverne, der har

kendskab både første og andet 1000 ordniveau eller mere end det.

Produktivt ordforråd

Med hensyn til at vurdere hvilket dybdekendskab testdeltagerne havde til testordene

var udfordringen at skabe overblik over resultatet. Hvis vi ser på den omfattende kritik

som Bruton (2009) gav af VKS kan man opdele kritikken i to hovedkritikpunkter, som

har haft betydning for hvordan jeg i det følgende har valgt at tolke undersøgelsens

resultater.

Det ene hovedkritikpunkt angår selve pointskalaen. Bruton mener, at den er

problematisk udformet af flere grunde. For det første fordi der i kategori tre, hvor man

giver point for korrekt oversættelse af testordet, ikke er nogen mulighed for

differentiering, dvs. testdeltagerne får lige mange point uanset, om han/hun svarer helt

præcist eller mere generelt. Det er ifølge Bruton ligeledes problematisk, at de første

fire point kun angår receptivt ordforråd og det sidste femte point kun angår produktivt

ordforråd. Derudover mener Bruton, at det er problematisk, at der sker en

sammenblandingen af vurderingen af receptivt og produktivt ordforråd, da scoren fem

er et udtryk for begge dele. Han mener, det er problematisk at der kun er ét points

forskel på, om man kan oversætte eller finde et korrekt synonym til et testord eller om

man ikke kan. Og på samme måde kun ét points forskel på, om man kan bruge ordet

semantisk korrekt eller om man kun kan oversætte eller finde synonym. Dette ene

hovedkritikpunkt som Bruton anfører kan jeg godt følge, men i mine øjne er det at

teste dybdekendskab af ordforråd ekstremt kompliceret. I mangel af et bedre

testværktøj, har jeg valgt i min vurdering af testpersonernes dybdeviden at bruge den

pointskala som Paribakht and Wesche (1997) foreslår med det i mente, at den har de

svagheder som Bruton anfører.

Det andet hovedkritikpunkt, som Bruton (2009) påpeger, er i relation til hvordan man

omsætter testresultaterne fra VKS til statistik. Kritikken fra Bruton går på, at lignende

resultater i total score kan dække over vidt forskellige kombinationer af svar. Og her er

muligvis det største kritikpunkt fordi Bruton ikke mener, at testdeltagernes scoring i

66

testen eller nogen form for gruppering af scoringer i testen giver mening. Bruton

mener, at testen fejler netop på det punkt som var VKS hovedformål, nemlig at

rapportere om udvikling i testdeltagernes dybdekendskab til testordene. Bruton mener,

at total score pr. deltager kun potentielt giver mening. Bruton mener ligeledes, at det

er meningsløst at udregne totalscore pr. Ord, da det ville give en tvetydig relativ værdi.

Det samme gør sig gældende med hensyn til at udregne total score pr. testdeltager

eller testdeltagergruppe. Det ville i alle tilfælde give et svar, som kan dække over et utal

af kombinationsmuligheder. Bruton konkluderer, at VKS i bedste fald kan anvendes til at

vurdere udvikling pr. kategori over tid.

Jeg kan godt følge den kritik Bruton (2009) giver VKS, men vil på den anden side heller

ikke helt forkaste ideen om, at VKS kan give et indblik i testdeltagernes dybdekendskab

til testordene. Det Bruton anfører som værende det VKS er bedst til, nemlig at følge

udviklingen i testdeltagernes dybdekendskab til testordene over tid, var ikke muligt og

heller ikke hensigten med undersøgelsen i denne opgave. Min hensigt var at undersøge

og give et øjebliksbillede af eleverne i den obligatoriske danskundervisnings kvalitative

og kvantitative ordforrådsviden. Det jeg har valgt at gøre for at få et overblik over

testdeltagernes dybdeviden om testordene er, at jeg har udvalgt ét testord fra hvert

1000 ordniveau og analyseret testdeltagernes svar med de fem points kategorier der

tilhører VKS, for på den måde at skabe overblik over, hvilken grad af dybdeviden

testdeltagerne havde til testordet. Med andre ord, jeg har valgt ét ord fra hvert 1000

ordniveau og undersøgt hvor mange gange det fik henholdsvis et, to, tre, fire eller fem

point for testdeltagernes svar.

Det ord jeg valgte at undersøge fra det første 1000 ordniveau, var ordet sammen. Jeg

havde seks ord at vælge mellem; sammen, person, igennem, mad, elske og sjov. Min

umiddelbare idé var at undersøge testpersonernes dybdeviden for det ord i hvert 1000

ordniveau, der havde fået højest score i den receptive del af testen. Grunden til, at jeg

helst ville undersøge det ord som flest testdeltagere kendte til i hvert 1000 ordniveau

var, at desto flere testpersoner der kendte til ordet, desto større spredning havde jeg

mulighed for at se i svarene. Hvis jeg fx havde valgt at undersøge testdeltagernes

dybdeviden om ordet el fra det fjerde 1000 ordniveau, som kun to testdeltagere kendte

receptivt, ville det være svært at beskrive en tendens. I det første 1000 ordniveau var

67

det ord med den højeste score, som samtidig er det eneste ord i undersøgelsen som

samtlige testdeltagere kendte receptivt, imidlertid ordet person, som også findes på

engelsk. Da ordet findes på engelsk, ville jeg måske ikke helt kunne regne med

resultatet, fordi jeg ikke kunne være sikker på, om elevernes dybdeviden om ordet

person på engelsk ville smitte af på deres dybdeviden om ordet på dansk. De to øvrige

ord i det første 1000 ordniveau, som scorede højest, var ordene sammen og elske. Elske

minder om det islandske ord elska, og kunne derfor smitte af på testdeltagernes

dybdekendskab til ordet på islandsk, hvorfor valget faldt på testordet sammen, som

også er det mest højfrekvente ord i hele undersøgelsen, da det er nr. 97 på

lemmalisten. Se Tabel 15 Testdeltagernes dybdekendskab til testordet; sammen i Bilag.

Testpersonernes scoring på adverbiet sammen ses i nedenstående søjlediagram.

Figur 6 Testdeltagernes dybdekendskab til testordet; sammen

Der var 95 testdeltagere, dvs. 99 pct. af testdeltagerne viste receptivt kendskab til

ordet ved at oversætte det korrekt til islandsk. Det stemmer ikke helt med

selvrapporteringen, hvor 8 pct. svarer, at de ikke kan huske at have set ordet før, og 6

pct. svarer, at de kan huske at have set ordet før, men ikke kan huske hvad det betyder.

I 2000 ordniveauet kunne jeg vælge mellem de seks testord: snakke, vindue, male, kød,

sur og veninde. Den absolutte topscorer på 2000 ordniveauet er verbet snakke, som 89

testdeltagere, dvs. 93 pct. af testdeltagerne havde receptivt kendskab til. På

andenpladsen kom ordet vindue, som 73 testdeltagere, dvs. 76 pct. havde kendskab til.

Se Tabel 16 Testdeltagernes dybdekendskab til testordet; snakke i Bilag.

Testpersonernes scoring på verbet snakke ses i nedenstående søjlediagram.

0

10

20

30

40

50

60

70

80

1 2 3 4 5

An

tal t

estd

elta

gere

Score på fempointsskalaen

68

Figur 7 Testdeltagernes dybdekendskab til testordet; snakke

Der var 89 testdeltagere, dvs. 93 pct. der viste receptivt kendskab til ordet ved at

oversætte det korrekt til islandsk. Det stemmer fint overens med selvrapporteringen,

hvor én pct. svarer, at de ikke kan huske at have set ordet før, og seks pct. svarer, at de

kan huske at have set ordet før, men ikke kan huske hvad det betyder.

Hvis man sammenligner scoringsfordelingen mellem de to ord sammen og snakke kan

man se, at flertallet af testpersonerne scorer fem point ved ordet sammen. Den anden

store gruppe scorer tre point. Groft sagt kan man sige, at der var to typer af

dybdekendskab til ordet sammen. Der var dem der kun kunne oversætte ordet, og der

var dem der kunne bruge det semantisk og grammatisk korrekt i en sætning. Ved ordet

snakke er der sammenlignet med ordet sammen langt flere testpersoner der scorer

fire. Det skyldes, at verbet snakke kan bøjes i modsætning til adverbiet sammen. Dvs.

at de testpersoner der viste, at de kunne bruge ordet snakke i en sætning for de flestes

vedkommende gjorde det semantisk korrekt, men de bøjede ordet forkert, hvorfor de

alligevel kun scorede fire. Et typisk svar der fik fire point, var sætninger, der lød i

retning af ”jeg snakke med mine venner”. Set med den viden i baghovedet, at de fleste

af dem der scorede fire ved ordet snakke gjorde det, fordi de bøjede ordet forkert, er

der ikke den store forskel på testdeltagernes dybdeviden om de to ord sammen og

snakke.

I det tredje 1000 ordniveau er der ligeledes seks testord, som jeg kan vælge at

undersøge testpersonernes dybdeviden om; hyggelig, æg, slukke, idræt, tørre og

eksamen. Ordet hyggelig er topscoren med 82 testpersoner, dvs. 85 pct. der har

0

5

10

15

20

25

30

35

40

45

50

1 2 3 4 5

An

tal t

estd

elta

gere


69

receptivt kendskab til ordet og eksamen kommer på andenpladsen med scoren 68, dvs.

71 pct. Da hyggelig både er topscorer og det eneste adjektiv blandt topscorerne valgte

jeg at undersøge det. Se Tabel 17 Testdeltagernes dybdekendskab til testordet; hyggelig

i Bilag. Testpersonernes scoring på adjektivet hyggelig ses i nedenstående

søjlediagram.

Figur 8 Testdeltagernes dybdekendskab til testordet; hyggelig

Der var 82 testdeltagere, dvs. 85 pct. der viste receptivt kendskab til ordet hyggelig ved

at oversætte det korrekt til islandsk. Det stemmer ikke helt overens med

selvrapporteringen, hvor seks pct. svarer, at de ikke kan huske at have set ordet før, og

19 pct. svarer, at de kan huske at have set ordet før, men ikke kan huske hvad det

betyder. Testdeltagerne lavede typisk den fejl i deres sætninger, at de ikke bøjede

adjektivet hyggelig korrekt. De skrev typisk ”det er hyggelig hjemme”. På den måde

ligner fejltypen ved testordet hyggelig fejltypen ved testordet snakke, som også ses når

man sammenligner søjlediagrammet over testdeltagernes scoringer på de to ord.

I det fjerde 1000 ordniveau er testordene; brække, pludselig, el, kravle, dagbog og

søskende. De to topscorer er dagbog og søskende begge med scoren 87, dvs. 91 pct. Da

dagbog som tidligere nævnt minder om det islandske ord dagbog og i øvrigt er

sammensat af to højfrekvente navneord, valgte jeg at undersøge ordet søskende. Ordet

søskende har imidlertid den ulempe, at det kun findes i plural, dvs. testpersonerne har

ikke mulighed for at demonstrere viden, eller mangler på samme, om bøjningen af

ordet, hvilket giver mindre mulighed for difference i svarene. Et argument der tæller for

0

5

10

15

20

25

30

35

40

45

50

1 2 3 4 5

An

tal t

estd

elta

gere


70

at vælge søskende er, at navneordene udgør den største del af testordene, hvorfor det

giver mening at undersøge testdeltagerens dybdeviden om netop et navneord. Se Tabel

18 Testdeltagernes dybdekendskab til testordet; søskende i Bilag. Testpersonernes

scoring på navneordet søskende ses i nedenstående søjlediagram.

Figur 9 Testdeltagernes dybdekendskab til testordet; søskende

Der var 87 testdeltagere, dvs. 91 pct. der viste receptivt kendskab til ordet søskende

ved at oversætte det korrekt til islandsk. Hvis vi sammenligner det med

selvrapporteringen, angav fem pct. af deltagerne, at de ikke kunne huske, at de havde

set ordet før, og otte pct. angav, at de havde set ordet før, men ikke kunne huske hvad

det betyder. De tal stemmer nogenlunde overens med, at 91 pct. af testdeltagerne

demonstrerede kendskab til ordet, hvis vi antager, at der er overlap mellem dem der

svarer positivt til, at de ikke kan huske at have set ordet før, og dem der kan huske at de

har set ordet før, men ikke kan huske hvad det betyder.

I det femte 1000 ordniveau er testordene; morgenmad, badeværelse, interesseret,

lektie, kysse og gymnastik. Morgenmad og kysse er topscorer begge med 94

testdeltagere, dvs. 98 pct., der har receptivt kendskab til ordene. Som tidligere nævnt

har morgenmad den ulempe som testord, at det er sammensat af to højfrekvente

navneord og ligesom kysse minder det om det tilsvarende ord på islandsk. Da

navneordene udgør den største ordgruppe på lemmalisten, og i alle 1000 ordniveauer,

bortset fra det første udgør over 50 pct. af ordene vil jeg gerne undersøge

0

5

10

15

20

25

30

35

40

45

50

1 2 3 4 5

An

tal t

estd

elta

gere


71

testdeltagernes dybdeviden om endnu et navneord. Badeværelse er ligesom

morgenmad et sammensat ord, hvilket muligvis kan påvirke resultatet, hvilket lod mig

tilbage med testordet lektie, som kun 34 testdeltagere, dvs. 35 pct. havde receptivt

kendskab til. Se Tabel 19 Testdeltagernes dybdekendskab til testordet; lektie i Bilag.

Testpersonernes scoring på navneordet lektie ses i nedenstående søjlediagram.

Figur 10 Testdeltagernes dybdekendskab til testordet; lektie

Der var 34 testdeltagere, dvs. 35 pct. der viste receptivt kendskab til testordet lektie.

Hvis vi sammenligner tallene med selvrapporteringen ser vi, at 42 pct. angiver, at de

ikke har set ordet før og 32 pct. angiver, at de har set det før, men ikke kan huske hvad

det betyder. De oplysninger passer ikke rigtigt sammen, med mindre vi forudsætter, at

der er overlap mellem dem, der siger de ikke har set ordet før og dem der siger de har

set ordet før, men ikke kan huske hvad det betyder.

Opsummerende kan man sige om testdeltagernes produktive ordforråd, at den score

testdeltagerne fik i de enkelte testord afhang af, om ordet kunne bøjes eller ikke.

Adverbiet sammen fra det første 1000 ordniveau kan ikke bøjes og 67 af de 96

testdeltagere, dvs. 70 pct. af testdeltagerne scorede fem på det testord. Den samme

tendens gør sig gældende for testordet søskende, som heller ikke kunne bøjes. Her er

der ligeledes flest testdeltagere der scorer fem, eller 44 af 96 testdeltagere, hvilket

svarer til 46 pct.

0

5

10

15

20

25

30

35

40

45

1 2 3 4 5

An

tal t

estd

elta

gere


72

Ser man på testordet lektie fra det femte 1000 ordniveau, kan man tydeligt se en

forskel i scoren i forhold til de andre testord. Her befinder 39 testdeltagere sig i

kategori et og 24 testdeltagere befinder sig i kategori to. Både kategori et og to

repræsenterer, at testdeltageren ikke kender ordets betydning. Dvs. at sammenlagt er

der 63 af de 96 testdeltagere, dvs. 66 pct. der angiver ikke at have kendskab til

betydningen af testordet lektie. Det er et højt tal sammenlignet med de fire øvrige

testord, som jeg undersøgte i forbindelse med elevernes dybdekendskab til ordet, men

tallet afspejler udmærket, at der i den receptive del af testen var 35 pct. af

testdeltagerne, der viste receptivt kendskab til ordet.

Med hensyn til den del af testen der omhandler testdeltagernes selvrapportering,

kommer det til udtryk i, om de vælger at svare et eller to, dvs. om de angiver, at de ikke

har set ordet før eller om de har set ordet før, men ikke ved hvad det betyder. Det

kommer ligeledes til udtryk i, om de vælger at svare på spørgsmål tre eller fire, eller

svarer på dem begge eller ikke svarer på nogen af dem og i stedet bruger ordet korrekt

i spørgsmål fem. Alt i alt var der så mange overlap i testdeltagernes svar, at jeg ikke

mener at kunne bruge svarene til at drage nogen konklusion af den del af testen. Om

det skyldes, at min instruktion af testdeltagerne har været mangelfuld eller om det

skyldes at selve testen ikke er designet optimalt er svært at svare på.

Opsummering af testresultater

Samlet set kan man sige, at resultaterne af undersøgelsen blev anskuet fra forskellige

vinkler i ovenstående afsnit. Først så jeg på hvilke af de 30 testord flest testdeltagere

havde receptivt kendskab til, og hvordan testdeltagernes relative score var på de fem

forskellige 1000 ordniveauer. Dernæst så jeg på, hvor stor en del af testdeltagerne der

havde kendskab til henholdsvis første, første og andet 1000 ordniveau op til og med

5000 ordniveauet. Efterfølgende så jeg på de enkelte testdeltagere og hvad der

karakteriserede dem der scorede højest og lavest og hvordan scoringsfordelingen var

indenfor gruppen. Afslutningsvis så jeg på testdeltagernes dybdekendskab til

testordene.

Først kiggede jeg på bredden af den samlende gruppe testdeltageres ordforråd. Dvs.

hvilke af de 30 testord havde flest testdeltagere receptivt kendskab til. Her var

73

resultatet, at testdeltagerne som gennemsnit havde receptivt kendskab til 19 af de 30

testord, dvs. de havde receptivt kendskab til knap 2/3 af testordene. De ord som

næsten alle testdeltagere havde kendskab til, dvs. mellem 98 og 100 pct. af

testdeltagerne, var ordene sammen, elske og person fra det første 1000 ordniveau

samt kysse og morgenmad fra det femte 1000 ordniveau.

Efterfølgende kiggede jeg på de enkelte testdeltagere hver for sig. Hvad karakteriserede

dem der scorede højest i testen og hvad karakteriserede dem der scorede lavest. Her

var resultatet, at dem der scorede højest, var karakteriseret ved at være en ligelig

fordeling mellem drenge og piger, én påbegyndte danskundervisningen i 5. klasse, to i

7. klasse og én angiver muligheden andet. Ingen af dem havde gået i skole i Danmark,

men den testdeltager som kom på fjerde pladsen angav at have en forælder, der har

dansk som modersmål.

De fem testdeltagere der scorede lavest i undersøgelsen var karakteriseret ved alle

sammen at være drenge, der ikke har gået i skole i Danmark eller har forældre med

dansk som modersmål. Tre af dem har det til fælles, at de påbegyndte

danskundervisningen i 7. klasse og de sidste to svarede andet.

Hvad angår hvor stor spredningen der er på størrelsen af testdeltagernes ordforråd, er

der en forholdsvis stor gruppe, der scorer omkring middelscoren på 19 ud af 30. Hvis vi

ser på hvor stor en andel af testdeltagerne der befinder sig i feltet mellem en score på

plus eller minus fem fra gennemsnittet på 19 udgør de 75 pct. af testdeltagerne. Det

resultat peger på, at vi har en forholdsvis stor midtergruppe.

Hvad angår hvor stor en del at testdeltagerne, der ikke havde kendskab til det første

1000 ordniveau, var tallet 41 pct. Der var 20 pct. af testdeltagerne der udelukkende

havde kendskab til det første 1000 ordniveau. Der var 19 pct. af testdeltagerne, der

havde kendskab til både første og andet 1000 ordniveau. Der var 14 pct. af

testdeltagerne, der havde kendskab til første, andet og tredje 1000 ordniveau. Ingen

testdeltagere havde udelukkende kendskab til første, andet, tredje og fjerde niveau,

men til gengæld var der 7 pct. af testdeltagerne, der havde kendskab til både, første,

anden, tredje, fjerde og femte 1000 ordniveau. Lidt forsimplet kan man sige, at ca. 60

74

pct. af testdeltagerne udelukkende har styr på det første 1000 ordniveau eller mindre

end det.

Hvad angår undersøgelsen af testdeltagernes dybdekendskab til testordene, ser man,

at testdeltagernes score afhænger af to ting. For det første hvor stor en del af

testdeltagerne der har receptivt kendskab til ordet, som igen hænger sammen med

hvilket 1000 ordniveau ordet tilhører, da testdeltagerne generelt havde et større

receptivt kendskab til ordene i de første 1000 ordniveauer. Det andet der er afgørende

for, hvordan scoringsfordelingen er mellem de fem kategorier afhang af, om ordet

kunne bøjes eller ikke. Hvis ordet ikke kunne bøjes, var der en større andel af eleverne,

der kunne producere en semantisk og grammatisk korrekt sætning med ordet. Hvis

ordet kunne bøjes, hvorved der kunne opstå fejl i bøjningen, var der risiko for, at

testdeltageren kun ville få fire point i stedet for fem, selvom han/hun havde brugt

ordet i en sætning.

Sammenligner man testdeltagernes selvrapportering om deres kendskab til testordene

med scoringerne i dybdekendskabsdelen er der i visse tilfælde et vist sammenfald

mellem hvad testdeltagerne selv angiver og hvad de siden demonstrerer i spørgsmål

tre til fem. I andre tilfælde var der ikke signifikant sammenfald. Af den grund mener jeg

ikke at kunne drage nogen egentlig konklusion angående testdeltagernes

selvrapportering andet end, at det er tvivlsomt om man kan regne med den.

Der er en generel tendens i testresultaterne til overlap mellem de fem kategorier. Dvs.

at testdeltagerne fx både svarer ja til spørgsmål et; jeg kan ikke huske at have set dette

ord før og samme testdeltager svarer måske også ja til spørgsmål to; jeg har set dette

ord før, men jeg kan ikke huske hvad det betyder. Det er modstridende at svare ja til

både spørgsmål et og to. På samme måde er der en del testdeltagere der svarer både

på spørgsmål tre; jeg har set dette ord før, og jeg tror det betyder... og fire; jeg kender

dette ord, det betyder... De testdeltagere der har svaret på både tre og fire har sikkert

gjort det for at være pligtopfyldende, men idet de svare på begge spørgsmål, mister jeg

som testadministrator muligheden for at differentiere mellem om testdeltagrene tror

de kender testordet eller ved de kender testordet. Derudover var der også eksempler

på testdeltagere, der udelukkende svarede på spørgsmål fem; jeg kan bruge dette ord i

75

en sætning... De testdeltagere der udelukkende svarede på spørgsmål fem, dvs.

anvendte testordet i en sætning på dansk, gjorde det til gengæld generelt med en

sådan overlegenhed, at man som testadministrator ikke var i tvivl om, at de havde

kendskab til og kontrol over brugen af testordet.

76

Diskussion

Jeg er særligt godt tilfreds med det baggrundsarbejde jeg fik lavet forud for

udvælgelsen af testordene, dvs. den del hvor jeg lavede frekvensanalyse af

undervisningsbøgerne Ekko og Glimt og sammenkørte den fælles frekvensliste af de to

bøger med lemmalisten. Det var ærgerligt, at jeg blev nødt til at forkorte testens

længde fra 50 ord til bare 30 ord, men rent praktisk var det en god beslutning, da

testen ellers ville have været for lang for testdeltagerne at gennemføre. Hvis jeg havde

brugt den udgave af testen som havde 50 testord ville det sandsynligvis have medført,

at en endnu større del af testdeltagerne ikke ville have gennemført testen, eller at de

ville have gjort det halvhjertet bare for at få det overstået, hvilket ville have gjort

resultatet mindre pålideligt. I. S. P. Nation (2013) henviser til at en god ordforrådstest

indeholder mange testord og anfører, at 30 testord sandsynligvis er minimum antal for

en pålidelig ordforrådstest, hvormed testen der blev brugt i denne undersøgelse lige

præcis opfylder kravene.

I udvælgelsen af testordene er der som tidligere nævnt nogle ord, som jeg efter at have

set undersøgelsens resultater måske burde have fravalgt. Et ord som person, der er

sammenfaldende med det engelske ord person og minder meget om det islandske ord

persóna var det eneste ord som samtlige testdeltagere havde receptivt kendskab til.

Alligevel er testordet person ikke et af de testord, som jeg ”fortryder” om man så at

sige, fordi det afspejler virkeligheden som den er, forstået på den måde, at der er en

mængde af ord, som minder om hinanden eller er sammenfaldende mellem enten

engelsk og dansk eller mellem dansk og islandsk. Af testord der minder om hinanden

på dansk og islandsk kan nævnes elske, sammen og kysse, men dem mener jeg heller

ikke, at der er grund til at sætte spørgsmålstegn ved som gode testord. Derimod kan

der måske sættes spørgsmålstegn ved de tre testord, som er sammensatte navneord;

dagbog, badeværelse og morgenmad, fordi det evt. kan påvirke resultatet, at ordene er

nemt gennemskuelige sammensatte navneord, og de ord som testordene er

sammensatte af, er navneord, som ligger meget højt på lemmalisten, og de derfor ikke

kan ses som ”ægte repræsentanter” for det 1000 ordniveau, som de befinder sig på.

Under alle omstændigheder burde testordet morgenmad måske ikke have været med i

testen, fordi ordet mad optræder som testord andetsteds i testen, hvorved

77

testdeltagerne kan få dobbelt point eller halvanden gange point for det samme testord

under forudsætning af, at de oversætter ordet ens i begge tilfælde.

Hvad angår testordene mad og male, hvor især male voldte en stor del af

testdeltagerne problemer, da de oversatte ordet til den engelske betydning hankøn, så

er det nok desværre en af de svagheder VKS har, at den præsenterer testordene

udenfor kontekst. Jeg må ærligt indrømme, at jeg ikke havde forudset, at de to ord ville

kunne blive opfattet af eleverne i engelsk betydning. Og hvis ordene var blevet

præsenteret i kontekst, var det givetvis ikke sket. Jeg overvejede i udarbejdelsen af

testen, om jeg skulle angive testordets ordklasse i parentes efter ordet, men besluttede

ikke at gøre det, da jeg var bange for, at det ville forvirre unødigt.

Hvad angår brugen af VKS som testtype er min mening, at den med fem spørgsmål til

hvert testord, er uforholdsmæssig omfattende i forhold til resultatet. Det skal forstås på

den måde, at det er ret omfattende, at testdeltagerne bliver stillet over for fem

spørgsmål til hvert eneste testord, når det så efterfølgende viser sig, at det kun er en

del af svarene på de fem spørgsmål, der giver et reelt billede af testdeltagerens

kendskab til testordet. Her henviser jeg til, at der i resultatet af min undersøgelse ikke

kom noget brugbart resultat ud af selvrapporteringen i spørgsmål et og to, da der var

for mange overlap. Det samme gjorde sig gældende med spørgsmål tre og fire, hvor jeg

heller ikke kunne drage nogle slutninger ud fra om testdeltagerne havde svaret på

spørgsmål tre, fire, begge to eller ingen af dem. Set i lyset af det resultat, som jeg fik af

min undersøgelse, kunne man lige så godt have nøjes med bare to spørgsmål eller

opgaver, som kunne lyde noget i retning af; oversæt ordet til islandsk hvis du kan og

skriv en sætning på dansk, hvor du bruger ordet. På den måde havde man sikkert kunne

teste flere ord på den samme mængde tid og havde sandsynligvis fået mere eller

mindre samme resultat.

Her er vi tilbage til den kritik som Bruton (2009) gav af VKS. Han henviser til, at

Paribakht and Wesche (1993) og Paribakht and Wesche (1997) slog

scoringskategorierne sammen til to, dvs. Kendt eller ubekendt i den kvantitative del af

ordforrådstesten. Det passer fint overens med de erfaringer jeg fik ved brugen af VKS

som testform.

78

Perspektivering

Undersøgelsen belyser flere aspekter af testdeltagernes ordforråd på dansk. Den

oplysning som man rent praktisk, som underviser, kan bruge til mest er resultatet, der

viser, at hele 41 pct. af testdeltagerne ikke engang havde tilstrækkeligt kendskab til det

første 1000 ordniveau og 20 pct. af testdeltagerne kun havde tilstrækkeligt kendskab til

det første 1000 ordniveau. Det vil sige, at der sidder en gruppe på godt 60 pct. at

eleverne i den obligatoriske danskundervisning, som kun har styr på det første 1000

ordniveau eller mindre end det. Der er en gruppe på knap 20 pct. som har tilstrækkeligt

receptivt kendskab til det første og andet 1000 ordniveau. Der var 14 pct. af

testdeltagerne, som havde tilstrækkeligt receptivt kendskab til det første, andet og

tredje 1000 ordniveau og syv pct. havde kendskab til alle fem 1000 ordniveauer. De

oplysninger peger rent praktisk i retning af, at det ville være gavnligt for eleverne, hvis

der ville blive gjort en målrettet indsats i forhold til, at hovedparten af eleverne, dem

der ikke allerede har det, kan få styr på de hyppigste 2000 ord på dansk. Indsatsen bør,

til at starte med, fokusere på de mest hyppige 1000 ord i dansk, og bør efterfølgende

udvides til de hyppigste 2000 ord i dansk.

Set i lyset af, at testdeltagerne på testtidspunktet har modtaget danskundervisning i

grundskolen i mindst fire år og har færdiggjort godt halvdelen af det ene semesters

obligatoriske danskundervisning i gymnasiet, er det nok hverken realistisk eller

anbefalelsesværdigt at påbegynde undervisning i ordforråd i akademisk dansk i den

obligatoriske danskundervisning i gymnasiet.

Undersøgelsens resultat, der viser at godt 60 pct. af testdeltagerne kun havde

kendskab til det første 1000 ordniveau eller mindre, kan være en del af forklaringen på

det fænomen, som jeg af og til stødte på hos mine tidligere elever. At de gav udtryk for,

at de ikke syntes, at de kunne ret meget på dansk til trods for, at de var elever, som

generelt klarede sig godt i de prøver og opgaver, som de blev bedt om at løse i

forbindelse med undervisningen. Stæhr (2013) påpeger:

Størrelsen af elevers ordforråd har vist sig at være en god indikator af deres generelle sproglige

kompetence på et fremmedsprog (Stæhr, 2013, p. 195).

79

Hvis vi sammenholder testdeltagernes mangelfulde kendskab til de første to 1000

ordniveauer, havde de elever som jeg refererede til ovenfor muligvis ret, når de gav

udtryk for, at de ikke følte, at de kunne ret meget på dansk. Grunden dertil kan være, at

de ikke har tilstrækkeligt kendskab til ordforrådet på de to hyppigste 1000 ordniveauer

på dansk.

At godt 60 pct. af testdeltagerne kun havde kendskab til det første 1000 ordniveau eller

mindre efter fire års danskundervisning i folkeskolen og nogle måneders

danskundervisning i gymnasiet tyder på, at Henriksen (2009) har ret, når hun påpeger,

at der foregår for lidt planlagt og systematisk undervisning i ordforråd, og at

sprogundervisere har en tendens at tro, at eleverne, når de er kommet ud over

begynderniveau, primært udvikler deres ordforråd ved at læse meget. En anden ting,

som Henriksen (2009) beskriver som et problem i forhold til at styrke udviklingen af

elevernes ordforråd, er noget jeg selv som underviser kan nikke genkendende til; at

man som underviser har en tendens til at vælge en tekst eller andet

undervisningsmateriale på baggrund af indholdet fordi emnet er interessant eller

relevant for elevgruppen og i den sammenhæng lader man ordforrådet komme i anden

række. Dertil kommer at man, som underviser i gennemgangen af teksten, ofte vil

fokusere på, at eleverne forstår nøgleordene i teksten, men ellers lader det være op til

dem selv at spørge, hvis der er nogle ord de ikke forstår.

Spørgsmålet er, hvordan man som underviser i dansk i gymnasiet og som

sprogunderviser i det hele taget, helt konkret kan føre den systematiske og planlagte

undervisning i ordforråd ud i livet. Heller ikke her hænger de lette løsninger på

træerne. Som Henriksen (2009) formulerer det:

Vi savner således både kriterier for udvælgelse af det relevante ordstof, samt for valg af arbejdsformer,

der målrettet fokuserer på ordforrådet (Henriksen, 2009, p. 72).

I den sammenhæng er det vigtigt at huske på, at selvom godt 60 pct. af eleverne kun

havde tilstrækkeligt receptivt kendskab til det første 1000 ordniveau eller mindre, er

der samtidig en gruppe på ca. 40 pct. som har tilstrækkeligt kendskab til både første og

andet 1000 ordniveau eller mere, og den gruppe skal også have udfordringer og

arbejde på at forbedre sit ordforråd.

80

Konklusion

Denne opgave omhandler en undersøgelse af, hvor stort et ordforråd eleverne har på

dansk, når de er i gang med den obligatoriske danskundervisning i gymnasiet. På

baggrund af den undersøgelse, som jeg lavede i forbindelse med dette speciale, er

svaret, at 41 pct. af eleverne ikke en gang har tilstrækkeligt receptivt kendskab til de

første 1000 hyppigst forekomne ord på dansk. At 20 pct. af eleverne kun har kendskab

til det første 1000 ordniveau. At 19 pct. af eleverne har tilstrækkeligt receptivt

kendskab til både det første og andet 1000 ordniveau, imens 14 pct. af eleverne har

tilstrækkeligt receptivt kendskab til både det første, andet og tredje 1000 ordniveau, og

7 pct. af eleverne har kendskab til både første, andet, tredje, fjerde og femte 1000

ordniveau. Resultatet er umiddelbart skuffende set i det lys, at eleverne på

testtidspunktet, for langt de flestes vedkommende, har modtaget undervisning i dansk

i grundskolen i mindst fire år og dertil er over halvvejs i den obligatoriske

danskundervisning i gymnasiet.

Hvis man sammenligner med oversigten, som er omtalt i afsnittet Hvor mange ord man

skal kunne over hvor mange ord man skal have kendskab til for at kunne udføre

forskellige opgaver på målsproget fx for at forstå talt sprog, for at kunne forstå en

børnefilm eller læse en roman eller en avis, er der med den størrelse af ordforråd, som

denne undersøgelse indikerer, at eleverne har, langt i land før eleverne reelt kan bruge

sproget til ret meget i praksis, hvilket er ærgerligt. Man kan dog håbe på, at man som

underviser ved at arbejde målrettet med at øge elevernes kendskab til de hyppigst

forekomne 2000 ord på dansk, kan løfte deres kundskaber markant. Hvis man skal se

på resultatet af undersøgelsen med positive øjne, som bekendt er den bedste måde at

betragte verden på, er de gode nyheder, at der trods alt var ca. 40 pct. af eleverne som

havde kendskab til de 2000 hyppigst forekomne ord eller mere på dansk.

81

Litteraturliste

Aðalnámskrá Framhaldsskóla 2011 - almennur hluti. (2012). Reykjavik, Island:

Mennta- og menningarmálaráðuneyti

Albrechtsen, D., Haastrup, K., & Henriksen, B. (2008). Vocabulary and Writing in a

First and Second Language. New York, USA: Palgrave Macmillan.

Ásdís Lovísa Grétarsdóttir, & Erna Jessen. (2009). Ekko Læsebog. Kópavogur, Island:

Námsgagnastofnun.

Auður Hauksdóttir. (2012). Dansk som fremmedsprog i en akademisk kontekst - om

islændinges behov for danskkundskaber under videreuddannelse i Danmark.

København, Danmark: Københavns Universitets Humanistiske Fakultet.

Brink, E. T. (2016). Man skal bare kaste sig ud i det... - En interviewundersøgelse af

unge i Nordens nabosprogsforståelse i praksis. København, Danmark.

Brodersen, R. B., Stefánsdóttir, B., & Monrad, J. (2015). Glimt - ny litteratur på dansk.

Reykjavik, Island: Iðnú Útgáfa.

Bruton, A. (2009). The Vocabulary Knowledge Scale: A Critical Analysis. Language

Assessment Quarterly, 6, 288–297. doi: 10.1080/15434300902801909

Coxhead, A. (2000). A new academic word list. TESOL QUARTERLY, 34(2), 213-238.

Henriksen, B. (2009). Ordforråd og ordforrådsindlæring. In A. Holmen, Lund, K. (Ed.),

Studier i dansk som andetsprog (pp. 71-106).

Henriksen, B. (2018). Fokus på ordforråd i alle sprogfag.

Hill, M., & Laufur, B. (2003). Type of task, time-on-task and electronic dictionaries in

incidental vocabulary acquisition. IRAL, 41(2), 87-106.

Hyland, K., & Tse, P. (2007). Is There an "Academic Vocabulary"? TESOL

QUARTERLY, 41(2), 35-253.

Jakobsen, A. S. (2017). From implicit norms to explicit skills - focusing on Danish

academic vocabulary. Oslo Studies in Language, 9(3), 59–76.

Jakobsen, A. S., Coxhead, A., & Henriksen, B. (2018). General and academic high

frequency vocabulary in Danish. Nordand, 13(1-2018), 64-89.

doi:10.18261/issn.2535-3381-2018-01-04

Kremmel, B. (2016). Word Families and Frequency Bands in Vocabulary Tests:

Challenging Conventions. TESOL QUARTERLY, 50(4), 976-987.

Nation, I. S. P. (2013). Learning Vocabulary in Another Language. New York, USA:

Cambridge University Press.

Nation, P. (2012). The Vocabulary Size Test:

82

https://www.wgtn.ac.nz/lals/about/staff/Publications/paul-nation/Vocabulary-

Size-Test-information-and-specifications.pdf.

Nation, P., & Beglar, D. (2007). A vocabulary size test The Language Teacher, 31(7), 9-

12.

Paribakht, T. S., & Wesche, M. (1993). Reading Comprehension and Second Language

Development in a Comprehension-Based ESL Program. TESL CANADA

JOURNAL, 11(1), 9-29.

Paribakht, T. S., & Wesche, M. (1997). Vocabulary enchancement activities and reading

for meaning in second language vocabulary acquisition. In J. Coady, Huckin, T.

(Ed.), Second Language Vocabulary Acquisition. Cambridge, United Kingdom:

Cambridge University Press.

Read, J. (2000). Assessing Vocabulary. Cambridge, United Kingdom: Cambridge

University Press.

Ruus, H. (1995). Danske Kerneord Centrale dele af den danske leksikalske norm.

København, Danmark: Museum Tusculanums Forlag.

Schmitt, N., & Schmitt, D. (2012). A reassessment of frequency and vocabulary size in

L2 vocabulary teaching. Language Teaching, 1-20.

doi:10.1017/S0261444812000018

Stæhr, L. S. (2008). Vocabulary size and the skills of listening, reading and writing.

Language Learning Journal, 36(2), 139-152. doi:10.1080/09571730802389975

Stæhr, L. S. (2009). Vocabulary Knowledge and Advanced Listening Comprehension in

English as a Foreign Language Cambridge University Press, 577– 607.

doi:10.1017/S0272263109990039

Stæhr, L. S. (2013). Tilegnelse og testning af ordforråd. In M. Byram (Ed.), Sprogfag i

forandring - pædagogik og praksis (1. ed.). Frederiksberg, Danmark:

Samfundslittaratur.

Ward, J., & Chuenjundaeng, J. (2009). Suffix knowledge: Acquisition and applications.

System, 37, 461–469. doi:10.1016/j.system.2009.01.004

Wilkins, D. A. (1972). Linguistics in language teaching. London, United Kingdom:

Edward Arnold.

www.lix.se. LIX räknare.

www.sproget.dk. Elektronisk ordbog.

https://www.wgtn.ac.nz/lals/about/staff/Publications/paul-nation/Vocabulary-Size-Test-information-and-specifications.pdf

https://www.wgtn.ac.nz/lals/about/staff/Publications/paul-nation/Vocabulary-Size-Test-information-and-specifications.pdf

83

Bilag

Nr. på lemma 10.000 listen

Ord på lemma 10.000 listen

Ord-klasse Laveste forekomst på fælleslisten Ekko/Glimt

Først forekomne ordform på fælleslisten

Antal forekomster på fælleslisten Ekko/Glimt *

97 sammen D 63 sammen 96

197 sidde V 340 sidder 29

299 person NC 580 person 12+

397 igennem T 616 igennem 9

496 rød A 762 røde 10+

599 mad NC 196 mad 38+

700 gade NC 1770 gaden 6+

784 elske V 194 elsker 31+

896 sjov A 291 sjovt 29+

1000 ejendom NC 2711 ejendommen 5+

1086 snakke V 328 snakke 33+

1196 regel NC 1142 regel 4+

1296 vindue NC 529 vinduet 18+

1371 bagefter D 457 bagefter 11

1400 mørk A 1124 mørkt 5+

1463 male V 1057 male 5+

1521 kød NC 524 kød 10+

1706 maskine NC 2220 maskine 5

1971 sur A 973 sur 10+

2000 veninde NC 626 veninde 18+

2099 tyv NC 557 tyven 17+

2023 hyggelig A 591 hyggeligt 9+

2123 æg NC 819 æg 6+

2146 lækker A 4817 lækkert 6+

2389 slukke V 983 slukker 10

2506 hud NC 1199 huden 7

2591 idræt NC 667 idræt 7+

2607 toilet NC 428 toilettet 6+

2751 tørre V 1427 tørre 5+

2788 eksamen NC 566 eksamen 9+

3038 brække V 2682 brækker 5+

3050 pludselig A 273 pludselig 19

3284 el NC 396 el 13+

84

3596 kravle V 1872 kravler 6

3732 dagbog NC 673 dagbog 7

3746 jakke NC 906 jakke 6+

3803 mest A 236 mest 23

3879 søskende NC 1028 søskende 7+

3904 cirkus NC 929 cirkus 5+

3375 venskab NC 1281 venskaber 6

4021 morgenmad NC 724 morgenmad 9

4037 sej A 1307 sej 5

4038 badeværelse NC 651 badeværelset 7+

4334 interesseret** A 1444 interesseret 3+

4565 storebror NC 646 storebror 7

4586 lektie NC 438 lektier 12

4637 soveværelse NC 768 soveværelset 6

4665 kysse V 743 kyssede 16+

4676 hviske V 1178 hviskede 5+

4870 gymnastik NC 683 gymnastik 7+

Tabel 9 De 50 testord

85

Testordets nr. på lemma 10.000 listen

Testordet Antal testdeltagere der kendte ordet

Procentdel af testdeltagere der kendte ordet

97 sammen 95 99%

299 person 96 100%

397 igennem 23 24%

599 mad 81 84%

784 elske 95 99%

896 sjov 61 64%

Niveau <1000 451 i alt (451/576)*100=78%

1086 snakke 89 93%

1296 vindue 73 76%

1463 male 34 35%

1521 kød 64 67%

1971 sur 71 74%

2000 veninde 70 73%

Niveau 1001-2000 401 i alt (401/576)*100=70%

2023 hyggelig 82 85%

2123 æg 57 59%

2389 slukke 30 31%

2591 idræt 37 39%

2751 tørre 21 22%

2788 eksamen 68 71%

Niveau 2001-3000 295 i alt (295/576)*100=51%

3038 brække 14 15%

3050 pludselig 21 22%

3284 el 2 2%

3596 kravle 26 27%

3732 dagbog 87 91%

3879 søskende 87 91%

Niveau 3001-4000 237 i alt (237/576)*100=41%

4021 morgenmad 94 98%

4038 badeværelse 64 67%

4334 interesseret** 86 90%

4586 lektie 34 35%

4665 kysse 94 98%

4870 gymnastik 70 73%

Niveau 4001-5000 442 i alt (442/576)*100=77%

Tabel 10 Testdeltagernes receptive kendskab til de enkelte testord

86

Score Testdeltagernes score

Testdeltagernes score i pct.

Testdeltagernes score opsummeret

Testdeltagernes score opsummeret i pct.

1 - - - -

2 - - - -

3 - - - -

4 1 1% 1 1%

5 - - - -

6 - - - -

7 - - - -

8 1 1% 2 2%

9 3 3% 5 5%

10 1 1% 6 6%

11 3 3% 9 9%

12 2 2% 11 11%

13 1 1% 12 13%

14 3 3% 15 16%

15 8 8% 23 24%

16 6 6% 29 30%

17 8 8% 37 39%

18 7 7% 44 46%

19 4 4% 48 50%

20 8 8% 56 58%

21 8 8% 64 67%

22 8 8% 72 75%

23 4 4% 76 79%

24 8 8% 84 88%

25 1 1% 85 89%

26 6 6% 91 95%

27 1 1% 92 96%

28 1 1% 93 97%

29 3 3% 96 100%

30 - - - -

I alt 96 - 96 100%

Tabel 11 Testdeltagernes samlede score i testen

87

Sco

re

Drenge Piger

An

tal

Pct

.

Op

sum

mer

et

Op

sum

mer

et p

ct.

An

tal

Pct

.

Op

sum

mer

et

Op

sum

mer

et p

ct.

1 - - - - - - - -

2 - - - - - - - -

3 - - - - - - - -

4 1 3% 1 3% - - - -

5 - - - - - - - -

6 - - - - - - - -

7 - - - - - - - -

8 1 3% 2 5% - - - -

9 3 8% 5 14% - - - -

10 - - - - 1 2% 1 2%

11 1 3% 6 16% 2 3% 3 5%

12 1 3% 7 19% 1 2% 4 7%

13 - - - - 1 2% 5 8%

14 3 8% 10 27% - - - -

15 3 8% 13 35% 5 8% 10 17%

16 2 5% 15 41% 4 7% 14 24%

17 2 5% 17 46% 6 10% 20 34%

18 3 8% 20 54% 4 7% 24 41%

19 3 8% 23 62% 1 2% 25 42%

20 2 5% 25 68% 6 10% 31 53%

21 2 5% 27 73% 6 10% 37 63%

22 3 8% 30 81% 5 8% 42 71%

23 1 3% 31 84% 3 5% 45 76%

24 3 8% 34 92% 5 8% 50 85%

25 - - - - 1 2% 51 86%

26 1 3% 35 95% 5 8% 56 95%

27 - - - - 1 2% 57 97%

28 1 3% 36 97% - - - -

29 1 3% 37 100% 2 3% 59 100%

30 - - - - - - - -

I alt 37 37 100% 59 59 100%

Tabel 12 Testdeltagernes samlede score i testen opdelt efter køn

88

1000 2000 3000 4000 5000

78% 70% 51% 41% 77%

Tabel 13 Testdeltagernes relative score på 1000 til 5000 ordniveauerne

1000 ordniveau Mindst 5 eller 6 rigtige Pct. der scorer 5/6 rigtige

Nåede ikke første 1000 39 41%

1000 19 20%

1000+2000 18 19%

1000+2000+3000 13 14%

1000+2000+3000+4000 0 0%

1000+2000+3000+4000+5000 7 7%

I alt 96

Tabel 14 Testdeltagernes kendskab til 1000 ordniveauerne

Score: 1 2 3 4 5

Antal testpersoner

med den score: 2 0 17 10 67

Tabel 15 Testdeltagernes dybdekendskab til testordet; sammen

Score: 1 2 3 4 5

Antal testpersoner


Tabel 16 Testdeltagernes dybdekendskab til testordet; snakke

Score 1 2 3 4 5

Antal testpersoner

med den score 6 7 18 45 20

Tabel 17 Testdeltagernes dybdekendskab til testordet; hyggelig

Score 1 2 3 4 5

Antal testpersoner

med den score 4 1 18 29 44

Tabel 18 Testdeltagernes dybdekendskab til testordet; søskende

89

Score 1 2 3 4 5

Antal testpersoner


Tabel 19 Testdeltagernes dybdekendskab til testordet; lektie

ordforråd - skemman

Documents