a szófelismerés információs értelmezése
DESCRIPTION
A szófelismerés információs értelmezése. Információs pszicholingvisztika 2. óra Pléh Csaba 2014. ősz p leh.csaba @ gmail.com. Áttekintés. Gyakoriság és a szótár. Ziff törvények. Predikció a vizuális szófelismerésben. Bejóslás és felismerési idő. - PowerPoint PPT PresentationTRANSCRIPT
A szófelismerés információs
értelmezése Információs pszicholingvisztika 2. óra
Pléh Csaba 2014. ő[email protected]
Áttekintés
• Gyakoriság és a szótár.
• Ziff törvények.
• Predikció a vizuális szófelismerésben.
• Bejóslás és felismerési idő.
• Kohorsz elmélet és a szókezdet értéke.
• ‘Az egyéni szótár információs elemzése.
Gyakorisági viszonyok a nyelv egészében • A Zipf törvények Estoupf gyorsíró is észrevette már • A szó gyakorisága fordított arányban áll rangszámával. Vagyis nagyon gyakori
szó kevés van, ritka szó sok. Zipf első törvénye
• Ri ~ 1/iα
• Ahol α ~ 1 • Hozzá hasonló Lotka törvény, Pareto eloszlás:
• Kevés sokat publikáló, s kevés nagyin gazdag ember van • Mandelbrot általánosítja, optimális információként értelmezi
Ziff törvény Németh Géza és Zainkó Csaba (BME) adatai
A leggyakoribb szavak : Mit tudunk meg ebből? Mi a népszerű a nyelvben ?
Milyen gyakorlati következményei vannak? • Írásban, rövidítésben. Sok rövidítés kell-e? • Szókincs elsajátításában gyermekeknél• Szókincs növekedésében második nyelven. A hapax szerepe• Tárolásban, keresési optimalizációban
Zipf „második törvénye”
• A gyakori szó rövidebb. A legkisebb erőfeszítés törvénye• Egy példa az Anna Karenyina 1. fejezetére•
Ennek finomítása. ‚információs tartalom’ jobban mutatja a gyakoriságot
Minél bejósolhatóbb valami, annál kevesebb erőfeszítés a bejóslásához
Menjünk át pszicholingvisztikáraSzavak felismerése és a mentális szótár
• Alaptények: gyakoriság, kontextus felülről-lefelé kutya – kuvasz • Hozzáférési utak: akusztikus, grafémikus, közös. • Általánosítás 1: a jelentés egy közös szótárban Általánosítás 2: a hó és a hav a Hóhoz kapcsol Általánosítás 3: a szófaj is tárolva van, s sok mindent elárul pl. kabát *ik hisz a kabát főnév
A szavak gyakorisága gyakran felmerül
• Olvasás és szókincs tudás mérés megalapozásához• Asszociatív adatok értelmezéséhez • Betegek bizarr beszédének interpretáláshoz• Még stílus statisztikák is megjelennek
Információelméleti észlelés kutatás
• G. A. Miller• Zaj és észlelés • Expoziciós idő és felismerés
Gyakoriság és felismerési idő Howes és Solomon 1952 • Korrelációk
A gyakoriságnak vannak szubjektív mutatói is Ezek jól összefüggenek az objektívakkal Nyelv Kutató Korr N
Francia Bonin és mtsai. (2003) 0,87 277Kanadai francia
Desrochers és Bergeron (2000)
0,73 360
Francia Flieller és Tournois (1994)
0,86 111
Amerikai angol
Balota és mtsai. (2001)
0,78 681
Brit angol Stathagen-Honzalez és Davis (2006)
0,7 243
Elsajátítási kor
02468
1012141618
Szó
kin
cs%
2 3 4 5 6 7 8 9 10 11 12 13
Type Token arány és szókincs
Változó TTR 100 TTR CTTR Peabody Képi szók BeszSzó ÍrottSzóTTR 100 TTR 0.54 * CTTR 0. 51 * -.26 Peabody 0.29 * -0.16 0.04 KépiSzókincs 0. 22 -0.01 0.16 0.74 * Szókincs 0.45 * -0.11 0.34 0.64 * 0.58* Írott szókincs 0.24 -0.25 -0.27 0.63 * 0.51* 0.36 Összszó .06 -0.78 * 0.26 0.23 0.18 0.38* -0.05
Kor Szubjektív gyakoriság
Elsajátítási kor
-0,57
Gyakoriság log
-0,75 0,73
Betűk ,20 -0,28Szomszédok -0,22 0,23Elképzelhető -0,32 -0,28
A gyakoriság értelmetlen szavakkal is szimulálható Solomon és Postman Az ingerek A gyakorisági hatás
Goldiamond és Hawkins ez akkor is megvan, ha nincs is ott az inger
• Nagy viták• Valódi észlelési hatás• Vagy • Válaszhajlam • Könnyebben mondom ki, hogy
program mint azt, hogy proliferáció
Főbb modellek a szófelismerésre
• Küszöb és alapszint változások: logogén, kohorsz, és konnekcionista modellek
• Adatok: előfeszítés kutya - macska kutya - kapu kiolvasás kereszt szódöntés kertesz
Logogén modell Morton
Kohorsz modell Marslen-Wilson: hallott szavak felismerése: már az első szótag alapján
• Aktiválódás minden kompatibilis szóra, majd kiválasztás
• A bálon rajta volt a … malom,majom, maszk maszat,maszek, maszk maszk Tévedés: A bálon rajta volt a maszat. Visszamenés a bemenethez. Igazodás akkor erős, ha összefüggő a szöveg.
Izolált szavaknál s értelmetlen szövegnél kevesebb elvárási hatás van.
A konnekcionista felfogás lényegi mozzanatai
• PDP, a Parallel Distributed Processing. (Rumelhart és McClelland, 1986), McClelland (1988)
• A modell egységekből és azok kapcsolataiból áll. Az egységek (az elméleti neuronok) környezetüktől összegzett aktivációt kapnak bemenetként. A kapcsolatok pozitív vagy negatív előjelű súlyozott, módosítható "drótok" az egységek között.
• A különböző feladatokat eltérő hálózatok (hálózatrészek) valósítják meg.
• Mindegyikre jellemző azonban a párhuzamos működés.• A modellben nincsen elvszerű különbség alulról-felfelé s
felülről-lefelé való hatások között, a hálózatokra teljes összekötöttség jellemző.
Hogyan működik a szavaknál?
• Klasszikus lineáris, szekvenciális modellek: balról-jobbra felismerés, korlátozott kapcsolat a szintek között
• Hierarchikus szótári viszonyok• Konnekcionizmus: totális interakció• Szavak hálója a szótárban
A szófelismerés konnekcionista modellje
A szintek működése egy konkrét szó (TÉR) felismerésénél
A szófelismerés ‚érzelmibb’ befolyásolói? Szubcepció vagy gyakoriság ? • A sajátos kísérleti hatások: szubcepció, előfeszítés, maszkolás,
kétértelműség• A tudatosítás ablaka • Mit mondanak ezek a tudatról?• Nyelv és tudat egyéb eltérései• Szemantikai hatás tudat• A forma tudata
A pszichoanalitikus képés a kísérleti felfogás
Ingerek
Előfeldolgozás
beszámoló
Egyéb ingerek
Szubcepció ’50-es évek
• ‘küszöbalatti’ hatás • Gyakoriság, kiejthetőség s hasonlók is befolyásolnak • Érték is küszöbcsökkentő • Tabu szavak: magasabb küszöb.• Talán információs érték kevesebb jó-rossz 1 bit,• Míg a szó kb. 20 bit
Bruner et al, 1947: a saját értékrendemnek megfelelő szavakat gyorsabban ismerem fel
McGuninees galvános bőrreakció és felismerési idő az érzékeny szavakra
Eriksen 1960 kritikus felfogása
Eriksen: a C modell az érvényes
Recehártya
Colliculus superior
Amygdala
Corpus geniculatum laterale
Elsődleges látókéreg
A kettős fedolgozás és a szubcepció modellje ma
Beépített elektródák epilepsziásoknál
• Piros – fenyegető – zöld neutrális • Kék az eltérés • Maszkolt-nem maszkolt • Érzelem: még küszöb alatt is
megjelenik a hatása • ? Milyen neurális körökből?
Előfeszítés
• Ajtó kerék
• Ablak ablak
Maszkolás
• Kutya
Macska
Hasonlított-e a szó érzelmileg?
Legerősebb érzelmi esetben:
Pl. dög
genny
Volt-e ehhez hasonló szó?
Nem tudatos előfeszítés jellemzői gyors s nem hagy nyomot Greenwald et al 1996
-0,050
0,050,1
0,150,2
0,250,3
67 10 133 167
Késletetés
Küszöballati priming
D'
-0,4-0,2
00,20,40,60,8
1
100 200 300 400
Késletetés
Küszöbfeletti priming
KüszfelKüsz alatt
Nyelv és tudat szisztémás eltérülései
• (1) Az irreleváns jelentések automatikus aktiválása. • (2) A hangrestauráció jelensége 40 % nem tudja, hol volt • (a) Mindenki csendben volt, csak nekünk jár a *ánk.• (b) Megettük a főzeléket, nekünk már jár a *-ánk.• (3) Társalgásainkat számos rejtett nem tudatos szabályszerűség irányítja. Tudjuk
ezt? • (a) Megkérhetlek, hogy csukd be az ajtót?• (b) Be tudnád csukni az ajtót?• (c) Nem akarod becsukni az ajtót?• (d) Nem kellene becsukni az ajtót?
Kétértelműség • Általános felismerés: kettős aktiváció
• Nyúl
• Elvi mechanizmus Főnév
•Nyúl•300 ms
Kétértelmű szavak – egyértelmű mondatok • Főnév A zenekarból hiányzik a dob. HEGEDŰ HAJÍT• Ige Feri mindig ballal dob.• HAJÍT HEGEDŰ• Kontroll Mari a labdához fél kézzel nyúl. HAJÍT HEGEDŰ
A nem releváns értelem is megjelenik Gergely és Pléh Mit jelent ez? Dekomponálás • Kiolvasási idők
425
430
435
440
445
450
455
460
Tő DOB KétértDOBOK
EgyértDOBSZ
Relev
Irrel
Kontroll
Mondatkontextus Releváns olvasat Irreleváns olvasat
Igei előfeszítésA labdát ballal
dobom
nincs hatás facilitáció
Főnévi előfeszítésA zenekarban ott
van a dobom.
facilitáció gátlás
Bonyolultabb hatás: mindig a főnév az elsődleges Thuma mégpedig ez a gyakoribb
Vagyis a szófaj döntő: Főnév mindig előnyben (Thuma és Pléh)
-30
-20
-10
0
10
20
30
Tő Kétér Egyértelm
Főnév Relev
Ige Irrev
Ige Rel
Főnév Irrel
Szóalak
Kettős aktiváció „Tudatos”:
relevancia szelekció
Visszatudatosítás pl. szóvicc Megetted már a halad? .Nem én konzervatív vagyok
Mindez mit is jelent ?
• 300 mscig mindkét jelentés aktív• Utána már csak a releváns • Inger tudatosulás
• Dennett 400-800 millisecundumos integrációs ablak • Ezen az idői ablakon belül áthelyezés, kapcsolatképzés
Tudatosak-e intuitív ítéleteink?
• (a) Ott ült a kávéházban.• (b) Belement a feladatba.• (c) Bement a kávéházban.• (d) Csalódott a feladatba.
A stigmatizáció megjelenése reprezentatív mintában Pléh, 1995
11,6
51,147,3
71,2
85,2
01020
30405060
708090
Helytelen
Stigmatizált
Hiperkorrekt, rossz
Hiperkorrekció érzékeny
Helyes
Elf
ogad
ási %
12 1318
84
6973
78
5248
0
10
20
30
40
50
60
70
80
90
tükör foncsor csoport
kísérleti helyzet
száz
alék
helytelen (stigmatizált)
helyes
hiperkorrekciótindukáló
A tudatosság növekedésével csökken a hiperkorrekció Bodor és Pléh tükörben megítélés
Jackendoff 2007
1. Az élménytudatosság a hangalakra vonatkozik.2. A nyelvi tudatosság mindig érzéki képzetekhez, beszédhangokhoz
vagy jelekhez kapcsolódik.3. A gondolat formája s ezzel a jelentés sosem tudatos.4. A gondolkodás evidencia élménye javarészt a nyelvi képzetekből
származik.
Jean Piaget: Pszichológia és ismeretelmélet, 1970
• Nem vagyunk azonnali tudatában pszichés műveleteinknek, s ezek önműködően zajlanak le, míg csak akadályba nem ütköznek. A tudatosítás tehát centripetális s nem centrifugális, vagyis a műveletek külső eredményeiből indul ki, mielőtt azok belső mechanizmusaira áttérne.
Lehetséges feladatok
• Entrópiaértékek a magyar szótárban a szóalakok alapján eltérő gyakoriságoknál.
• KABÁT kabátok kabáthoz • ÜRGE ürgét, ürgének stb. • http://mokk.bme.hu/resources/webcorpus/• Egyéni szógyakoriságok, pl. email szövegek alapján, s viszonyuk a
corpus gyakorisághoz • Szubjektív és objektív gyakoriság összevetése. • Hol tér el?