corpus and language learning_ndobric

7

Click here to load reader

Upload: sanja-stosic

Post on 22-Dec-2015

231 views

Category:

Documents


2 download

DESCRIPTION

CORPUS AND LANGUAGE LEARNING

TRANSCRIPT

Page 1: Corpus and Language Learning_ndobric

753

This is a contribution from Pedagoška stvarnost, Vol. 54, No. 7-8, pp. 47-58, 2008

© 2008 Savez pedagoških društava Vojvodine

This electronic file may not be altered or reproduced in any way. ________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

KORPUS I UČENJE JEZIKA

Corpus and language learning

Nikola Dobrić

Alpen-Adria Universität Klagenfurt

Abstract: The topic of this paper will be to draw attention to the existence of vast online

corpora and to investigate their structure and usability. Further on, the paper will

elaborate and exemplify the practical value for usage of such corpora on English

language classes.

Key words: corpus, online corpus, corpus approach, collocation, register

Apstrakt: Tema ovog rada će biti skretanje pažnje na postojanje velikih onlajn korpusa i

pojašnjavanje njihove strukture i upotrebe. Dalje, rad će ispitati i na primeru prikazati

praktičnu upotrebnu vrednost ovakvih korpusa u nastavi engleskog jezika.

Ključne reči: korpus, onlajn korpus, korpusni pristup, kolokacija, registar

Šta je to korpus?

Uopšteno definisano, kopus predstavlja bilo koji skup teksta na jednom mestu.

Korpus u onom značenju koje će se upotrebljavati u ovom radu predstavlja ogroman skup

prirodnog jezika, i pisanog i govornog, i obično se nalazi u digitalnom obliku u velikim

bazama podataka, u najčešćem slučaju je i dostupan putem interneta. U većini slučajeva

predstavljaju plod rada univerziteta i sličnih obrazovnih institucija. Nastaje tako što

odreñena institucija pokrene projekat sakupljanja svih mogućih instanci komunikacije i

skladišti ih u računarske baze podataka. Veliki broj ljudi učestvuje u takvom poduhvatu i

to duži period vremena. Rezultat je skup od više miliona reči iz različitih izvora i

registara: fikcije, akademskih radova, novinskih članaka, telefonskih razgovora, reklama,

predavanja, javnih govora, televizijskih intervjua, itd. Zbog takve svoje prirode korpusi

Page 2: Corpus and Language Learning_ndobric

754

predstavljaju zabeležene i sačuvane stvarne isečke jezika kakav se realno upotrebljava u

praksi i u tome, kao što će biti i predstavljeno, zapravo leži njihova važnost u

podučavanju jezika.

Postoji nekoliko tipova korpusa, a dele se po načinu tvorbe (referentni i monitorski

korpusi), po tipu korisnika jezika (izvorni i strani govornici; jednojezički i višejezički

korpusi) i po sadržaju. Ovaj poslednji kriterijum je mnogo zanimljiviji i po njemu postoje

dve vrste korpusa. Korpus može biti ili opšti, ako su u njemu zastupljeni svi postojeći

registri i varijeteti jezika u svim kontekstima upotrebe ili specijalizovan čiji opseg

zauzimaju posebni konteksti i varijeteti, na primer posebno pisani i govorni jezik. Ovaj

rad najviše će se baviti opštom vrstom korpusa jer predstavljaju najbolju svakodnevnu

upotrebu jezika.

Najpoznatiji onlajn korpusi opšteg tipa su Britanski nacionalni korpus (The British

National Corpus)1 sa 100 miliona i više reči i Korpus savremenog američkog engleskog

(The Corpus of Contemporary American English)2 sa preko 360 miliona reči govornog i

pisanog teksta. Oba su veoma zanimljiva za upotrebu zbog svoje veličine i relevantnosti

ali i zbog besplatnog pristupa koji je obezbeñen od strane njihovih osnivača.

Šta je to korpusni pristup?

Pošto je definisano šta će se smatrati korpusom u daljem toku rada na red dolazi

objašnjenje kakvu ulogu taj korpus ima u lingvistici uopšte i kako se upotrebljava.

Za raziku od tradicionalnog pristupa lingvističkom istraživanju, a i predavanju jezika,

koje je uvek bilo prvenstveno okrenuto strukturi jezika, to jest identifikovanju elemenata

koji grade jezik, kao što su: vrste reči, gramatički nastavci i sl., korpusni pristup se

nedvosmisleno fokusira na otkrivanje upotrebe jezika. Korpusni pristup jeziku nudi

potpuno drugačiji pogled na način kako ljudi koriste jezik umesto da daje samo teorijski

uvid u takvu upotrebu, kao što je to bio slučaj do sada. Kako to funkcioniše najbolje se

1 http://www.natcorp.ox.ac.uk/

2 http://www.americancorpus.org/

Page 3: Corpus and Language Learning_ndobric

755

može videti ako se razmotre osnovne karakteristike i implikacije koje se tiču korpusnog

pristupa jeziku koje ga čine tako značajno drugačijim.

Tri osnovne karakteristike korpusnog pristupa su:

• empirijski karakter u smislu da je u pitanju prirodna, stvarna upotreba jezika;

• da se upotrebljava veliki skup prirodnog teksta;

• da podrazumeva upotrebu računara.

Svaka od ovih karakteristika čini ovaj pristup korakom napred u odnosu na ostale

tradicionalne načine istraživanja, i kao što će postati očigledno, predavanja (da li

predavanje jezika ili podučavanje jezika-razmislite i svuda izmenite ako se slažete

samnom) jezika. Prva karakteristika je od jasne važnosti, jer za razliku od teorijskog

pristupa koji prikazuje kako bi jezik trebao da izgleda, korpusi zapravo predstavljaju

apsolutnuo realnu upotrebu jezika. Činjenica da se pristup zasniva na velikim bazama

teksta osigurava validnost i varijabilnost svih mogućih analiza jezika i generalizaciju

rezultata. Sa druge strane upotreba računara u istraživanju korpusa znači da su moguće

veoma kompleksne analize i da su iste mnogo pouzdanije jer se računar ne zamara, nije

mu dosadno i ne bude pospan dok radi na datom zadatku a i materijal je pristupačniji i

lakši za pripremu za čas.

Kako se to odražava na učenje jezika?

Pošto je gramatičko-prevodilački sistem podučavanja jezika odavno pao u zaborav a tim

poljem vladavinu preuzeo komunikacijski pristup časovima jezika jasno je da je nastavna

zajednica uveliko uvidela važnost savladavanja stvarne upotrebe jezika, tj. grañenja

veštine komunikacije kod onih koji uče dati jezik. Ali za implementaciju takvog jednog

načina učenja jezika potreban je adekvatan materijal za rad. Pomak je viñen i u toj oblasti

u poslednjih desetak godina, gde je evidentno da su stari udžbenici sa lekcijama koje je

trebalo prevesti i gramatičkim jedinicama koje je trebalo uporediti sa maternjim

strukturama a potom napamet naučiti zamenjeni modernim knjigama koje kombinuju

stvarne tekstove sa komunikacijskim vežbama prožetim propratnom gramatikom koja

Page 4: Corpus and Language Learning_ndobric

756

služi samo kao jedan kostur na kome jezik počiva. Korak dalje u tom pravcu predstavlja

upotreba korpusa kao materijala pri učenju i predavanju stranog jezika. Sve predhodno

navedene osobine koje karakterišu korpuse ukazuju na to koliko je isti savršen izvor

materijala za usvajanje vokabulara, govornog jezika, pisanog izražavanja i svih ostalih

veština koje čine upotrebu jednog jezika.

Kako se korpusi koriste u nastavnoj praksi?

I pored neslaganja pojedinih naučnih krugova oko korisnosti korpusa pri nastavi jezika iz

razloga kao što su upitna mogućnost korpusa da ispravno zabeleži upotrebu jezika ili

nesigurnost u mogućnost izvlačenja modela za predavanje iz korpusa, ili čak i da bi takav

materijal mogao da zaplaši studente, biće prikazano kako takva gledišta ne stoje i kako je

korpusni pristup iznimno koristan u predavanju i utvrñivanju odreñenih jezičkih struktura

na višim nivoima poznavanja jezika.

Postoje dva načina na koje se korpus može praktično primeniti u nastavi: meki i tvrdi.

Potonji podrazumeva obučenost studenata da koriste korpuse i da iz njih sami izvlače

relevantne informacije i znanje. Mnogo realističniji i praktičniji je meki pristup gde se

podrazumeva samo kompetencija predavača da „vlada“ korpusima i da priprema korpusni

materijal za studente.

Koji god pristup korpusima da se izabere postoje pojedine jezičke strukture koje su

posebno pogodne za obradu pomoću korpusa. Izmeñu ostalih jezičkih elemenata koji

služe za grañenje kompetentnosti jedne osobe korpusni pristup je posebno upotrebljiv za

utvrñivanje kolokacija, za unapreñivanje veštine čitanja i za predavanje i ponavljanje

gramatičkih konstrukcija. U ovom radu će, ukratko, biti obrañen primer obrade

kolokacija upotrebom korpusnog pristupa u nastavi.

Primer

Page 5: Corpus and Language Learning_ndobric

757

Sledeći primer će prikazati kako se na opisani način može predavati kolokabilnost

imenice diet grupi studenata na srednjem nivou kompetentnosti. Kolokacije se, na primer,

mogu odnositi na pojave date imenice u jednini sa glagolima, fraznim glagolima ili

izrazima koji sadrže glagol ili na bilo koje pojave imenice diet u tekstu. Kod izbora

primera iz korpusa važno je pronaći autentične tekstove koji imaju nekakve dodirne tačke

sa ishranom i dijetama. Još jedna bitna stvar je da se uvek mora imati na umu i trajanje

datog časa. U ovom primeru biće prezentovano više pojava date imenice uzetih iz

Britanskog nacionalnog korpusa koji je pripremljen za čas od 60 minuta.

Izvod iz korpusa izgleda ovako:

try other foods, although I advise against a diet of all dried food.

might have had recently could be affected by your diet , or alcohol and cigarette consumption.

or whatever--of British women are on a diet at any one time, but that, as a nation

was breast-feeding, her doctor asked about her diet and found that she was a vegetarian. She

margarines, and are best avoided on this diet programme.

've been up when I've been on a diet , I mean smelling, smoked out, smoked out on

the end. When he had been on this diet for ten days he was tested with various foods.

her child demands breastfeeding despite being on a diet of solids. Concerns about dehydration if the child

feels it will be able to cook with a diet sweetener."

commune in Vancouver, Canada and fed on a diet of black pudding and Ecstasy. If I were to

legumes, meat hardly ever figuring in their diet . On as little as 8/6d (42 new pence

testing. He gradually forgets about the diet . This pitfall can be avoided by ensuring that

with the new knowledge I had gained about my diet I was eating sensibly, I no longer crave sweet foods

last saw you. You should go on a diet . Exercise more. Edouard rides every morning

the purpose of its use (to go on a diet , or to exclude certain elements such as meat)?

"I can go on a diet when I grow up," I said, but I was

scale is the seasonal dieter who goes on a diet in spring to get rid of the Christmas over-indulgence;

After going on the diet ask yourself these questions again--you may be

our current eating habits and including in our diet the necessary changes that are required to maintain a

You can help by getting involved in her diet , preparing healthy, balanced meals and emphasising

that

unlikely that you are going to keep to the diet for very long. However, here is the vital

Page 6: Corpus and Language Learning_ndobric

758

More people are killed by poor diet than by smoking, alcohol, drugs, accidents and

. The opposition can no longer live on a diet of anti-Thatcherism. They face a prime minister,

daren't eat chewing gum if I'm on a diet Oh you don't need to

be suspect and was temporarily omitted from the diet . The patient returned to eating only foods that

for salt becomes less as you progress through the diet programme.

. Arthritic working-class guys raised on a diet of fish and chips and fags; they died of

If you're on a diet and you've found that you've hit problems, ring

She's erm, she's on a diet . Oh really? She's lost

That's why she's on a diet ! Cos she doesn't

enjoyed it. It didn't seem like a diet --in fact, if there was one sentence that

enough how important it is to set aside from your diet foods you suspect or know cause you problems.

The more you are able to stick to a diet of natural foods--fruit and vegetables (raw if

will have heard that if you do stick _VVI to a diet and lose weight, then your metabolism will drop so

was losing her will power to stick _VVI to her diet . Anne had already trimmed down to a reasonable

metabolic rate. Providing you stick _VVB to your diet , and don't consume lost of extra calories,

be so easy that you can stick with the diet until all the weight is off.

Stage II must immediately be struck out of your diet . This is very important. Failure to

to the calorie-counting method, supervised by a diet club, dietitian, or doctor.

, it dwelt in woods, surviving on a diet of maize, fruit and grass. The north American

experiment in which a doctor switched to a diet including the average adult consumption of the country's

it's fat, and you should think about a diet . But don't be bullied by precise,

like your neighbour's before he went on that diet .

Posle adekvatnog teorijskog uvoda na osnovu ovakvog kratkog materijala studentima se

mogu dati sledeći zadaci:

• pronaći glagole, frazne glagole ili izraze koji sadrže glagol koji se najčeće

kombinuju sa imenicom diet;

• da li imenica diet znači isto u svakoj rečenici;

• koja kombinacija je najčešća sa svakim od značenja;

• pronaći kombinacije sa sličnim/suprotnim značenjem;

Page 7: Corpus and Language Learning_ndobric

759

• pokušai grupisati shematiku kolokacija na neki način.

Ovakav tipični primer predavanja kolokacija za cilj ima utvrñivanje kolokacijskih shema,

leksičkog značenja i učestalosti odreñenih kombinacija.

Prikazan je samo jedan način i jedan primer kako se korisno može upotrebiti korpus na

časovima engleskog jezika na svim nepočetnim nivoima znanja studenata. Kada se

predavač dobro upozna sa načinom funckionisanja onlajn korpusa dalja upotreba na času

je ograničena samo njegovom maštom.

Kako dalje?

Još dosta usavršavanja i istraživanja upotrebe korpusa u nastavi stoji pred domaćom

lingvističkom zajednicom. Većina predavača jezika na našim prostorima nije još uvek ni

upoznata sa samim postojanjem i izgledom onlajn korpusa, a kamoli o upotrebi na času.

Ipak, zbog očigledne korisnosti u nastavi, zbog svoje veličine i zbog apsolutne

autentičnosti jezika u njima onlajn korpusi će predstavljati izuzetno bitan izvor materijala

za učenje jezika u bliskoj budućnosti. Zbog svih navedenih osobina korpusni pristup i

korpusni materijali predstavljaju dobar dodatak tradicionalnim načinima i sadržajima koji

se koriste na času i svakako mogu poboljšati nastavu stranih jezika.

LITERATURA

Alderson, J.C. (1996). Do corpora have a role in language assessment?, London: Longman

http://www.americancorpus.org/

Biber, D., Conrad, S. & Reppen, R. (1998). Corpus linguistics: Investigating language structure

and use. Cambridge: Cambridge University Press.

Gabrielatos, C. (2005). Corpora and Language Teaching: Just a fling or wedding bells?,

Department of Linguistics and English Language, Lancaster University, UK

Hunston, S. (2002). Corpora in applied linguistics. Cambridge: Cambridge University Press.

http://www.natcorp.ox.ac.uk/