a szófelismerés információs értelmezése

53
A szófelismerés információs értelmezése Információs pszicholingvisztika 2. óra Pléh Csaba 2014. ősz [email protected]

Upload: julian-mann

Post on 02-Jan-2016

31 views

Category:

Documents


3 download

DESCRIPTION

A szófelismerés információs értelmezése. Információs pszicholingvisztika 2. óra Pléh Csaba 2014. ősz p leh.csaba @ gmail.com. Áttekintés. Gyakoriság és a szótár. Ziff törvények. Predikció a vizuális szófelismerésben. Bejóslás és felismerési idő. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: A szófelismerés információs értelmezése

A szófelismerés információs

értelmezése Információs pszicholingvisztika 2. óra

Pléh Csaba 2014. ő[email protected]

Page 2: A szófelismerés információs értelmezése

Áttekintés

• Gyakoriság és a szótár.

• Ziff törvények.

• Predikció a vizuális szófelismerésben.

• Bejóslás és felismerési idő.

• Kohorsz elmélet és a szókezdet értéke.

• ‘Az egyéni szótár információs elemzése.

Page 3: A szófelismerés információs értelmezése

Gyakorisági viszonyok a nyelv egészében • A Zipf törvények Estoupf gyorsíró is észrevette már • A szó gyakorisága fordított arányban áll rangszámával. Vagyis nagyon gyakori

szó kevés van, ritka szó sok. Zipf első törvénye

• Ri ~ 1/iα

• Ahol α ~ 1 • Hozzá hasonló Lotka törvény, Pareto eloszlás:

• Kevés sokat publikáló, s kevés nagyin gazdag ember van • Mandelbrot általánosítja, optimális információként értelmezi

Page 4: A szófelismerés információs értelmezése

Ziff törvény Németh Géza és Zainkó Csaba (BME) adatai

Page 5: A szófelismerés információs értelmezése

A leggyakoribb szavak : Mit tudunk meg ebből? Mi a népszerű a nyelvben ?

Page 6: A szófelismerés információs értelmezése

Milyen gyakorlati következményei vannak? • Írásban, rövidítésben. Sok rövidítés kell-e? • Szókincs elsajátításában gyermekeknél• Szókincs növekedésében második nyelven. A hapax szerepe• Tárolásban, keresési optimalizációban

Page 7: A szófelismerés információs értelmezése

Zipf „második törvénye”

• A gyakori szó rövidebb. A legkisebb erőfeszítés törvénye• Egy példa az Anna Karenyina 1. fejezetére•

Page 8: A szófelismerés információs értelmezése

Ennek finomítása. ‚információs tartalom’ jobban mutatja a gyakoriságot

Minél bejósolhatóbb valami, annál kevesebb erőfeszítés a bejóslásához

Page 9: A szófelismerés információs értelmezése

Menjünk át pszicholingvisztikáraSzavak felismerése és a mentális szótár

• Alaptények: gyakoriság, kontextus felülről-lefelé kutya – kuvasz • Hozzáférési utak: akusztikus, grafémikus, közös. • Általánosítás 1: a jelentés egy közös szótárban Általánosítás 2: a hó és a hav a Hóhoz kapcsol Általánosítás 3: a szófaj is tárolva van, s sok mindent elárul pl. kabát *ik hisz a kabát főnév

Page 10: A szófelismerés információs értelmezése

A szavak gyakorisága gyakran felmerül

• Olvasás és szókincs tudás mérés megalapozásához• Asszociatív adatok értelmezéséhez • Betegek bizarr beszédének interpretáláshoz• Még stílus statisztikák is megjelennek

Page 11: A szófelismerés információs értelmezése

Információelméleti észlelés kutatás

• G. A. Miller• Zaj és észlelés • Expoziciós idő és felismerés

Page 12: A szófelismerés információs értelmezése

Gyakoriság és felismerési idő Howes és Solomon 1952 • Korrelációk

Page 13: A szófelismerés információs értelmezése
Page 14: A szófelismerés információs értelmezése
Page 15: A szófelismerés információs értelmezése
Page 16: A szófelismerés információs értelmezése

A gyakoriságnak vannak szubjektív mutatói is Ezek jól összefüggenek az objektívakkal Nyelv Kutató Korr N

Francia Bonin és mtsai. (2003) 0,87 277Kanadai francia

Desrochers és Bergeron (2000)

0,73 360

Francia Flieller és Tournois (1994)

0,86 111

Amerikai angol

Balota és mtsai. (2001)

0,78 681

Brit angol Stathagen-Honzalez és Davis (2006)

0,7 243

Page 17: A szófelismerés információs értelmezése

Elsajátítási kor

02468

1012141618

Szó

kin

cs%

2 3 4 5 6 7 8 9 10 11 12 13

Page 18: A szófelismerés információs értelmezése

Type Token arány és szókincs

Változó TTR 100 TTR CTTR Peabody Képi szók BeszSzó ÍrottSzóTTR 100 TTR 0.54 * CTTR 0. 51 * -.26 Peabody 0.29 * -0.16 0.04 KépiSzókincs 0. 22 -0.01 0.16 0.74 * Szókincs 0.45 * -0.11 0.34 0.64 * 0.58* Írott szókincs 0.24 -0.25 -0.27 0.63 * 0.51* 0.36 Összszó .06 -0.78 * 0.26 0.23 0.18 0.38* -0.05

Page 19: A szófelismerés információs értelmezése

Kor Szubjektív gyakoriság

Elsajátítási kor

-0,57

Gyakoriság log

-0,75 0,73

Betűk ,20 -0,28Szomszédok -0,22 0,23Elképzelhető -0,32 -0,28

Page 20: A szófelismerés információs értelmezése

A gyakoriság értelmetlen szavakkal is szimulálható Solomon és Postman Az ingerek A gyakorisági hatás

Page 21: A szófelismerés információs értelmezése

Goldiamond és Hawkins ez akkor is megvan, ha nincs is ott az inger

• Nagy viták• Valódi észlelési hatás• Vagy • Válaszhajlam • Könnyebben mondom ki, hogy

program mint azt, hogy proliferáció

Page 22: A szófelismerés információs értelmezése

Főbb modellek a szófelismerésre

• Küszöb és alapszint változások: logogén, kohorsz, és konnekcionista modellek

• Adatok: előfeszítés kutya - macska kutya - kapu kiolvasás kereszt szódöntés kertesz

Page 23: A szófelismerés információs értelmezése

Logogén modell Morton

Page 24: A szófelismerés információs értelmezése

Kohorsz modell Marslen-Wilson: hallott szavak felismerése: már az első szótag alapján

• Aktiválódás minden kompatibilis szóra, majd kiválasztás

• A bálon rajta volt a … malom,majom, maszk maszat,maszek, maszk maszk Tévedés: A bálon rajta volt a maszat. Visszamenés a bemenethez. Igazodás akkor erős, ha összefüggő a szöveg.

Izolált szavaknál s értelmetlen szövegnél kevesebb elvárási hatás van.

Page 25: A szófelismerés információs értelmezése

A konnekcionista felfogás lényegi mozzanatai

• PDP, a Parallel Distributed Processing. (Rumelhart és McClelland, 1986), McClelland (1988)

• A modell egységekből és azok kapcsolataiból áll. Az egységek (az elméleti neuronok) környezetüktől összegzett aktivációt kapnak bemenetként. A kapcsolatok pozitív vagy negatív előjelű súlyozott, módosítható "drótok" az egységek között.

• A különböző feladatokat eltérő hálózatok (hálózatrészek) valósítják meg.

• Mindegyikre jellemző azonban a párhuzamos működés.• A modellben nincsen elvszerű különbség alulról-felfelé s

felülről-lefelé való hatások között, a hálózatokra teljes összekötöttség jellemző.

Page 26: A szófelismerés információs értelmezése

Hogyan működik a szavaknál?

• Klasszikus lineáris, szekvenciális modellek: balról-jobbra felismerés, korlátozott kapcsolat a szintek között

• Hierarchikus szótári viszonyok• Konnekcionizmus: totális interakció• Szavak hálója a szótárban

Page 27: A szófelismerés információs értelmezése

A szófelismerés konnekcionista modellje

Page 28: A szófelismerés információs értelmezése

A szintek működése egy konkrét szó (TÉR) felismerésénél

Page 29: A szófelismerés információs értelmezése

A szófelismerés ‚érzelmibb’ befolyásolói? Szubcepció vagy gyakoriság ? • A sajátos kísérleti hatások: szubcepció, előfeszítés, maszkolás,

kétértelműség• A tudatosítás ablaka • Mit mondanak ezek a tudatról?• Nyelv és tudat egyéb eltérései• Szemantikai hatás tudat• A forma tudata

Page 30: A szófelismerés információs értelmezése

A pszichoanalitikus képés a kísérleti felfogás

Ingerek

Előfeldolgozás

beszámoló

Egyéb ingerek

Page 31: A szófelismerés információs értelmezése

Szubcepció ’50-es évek

• ‘küszöbalatti’ hatás • Gyakoriság, kiejthetőség s hasonlók is befolyásolnak • Érték is küszöbcsökkentő • Tabu szavak: magasabb küszöb.• Talán információs érték kevesebb jó-rossz 1 bit,• Míg a szó kb. 20 bit

Page 32: A szófelismerés információs értelmezése

Bruner et al, 1947: a saját értékrendemnek megfelelő szavakat gyorsabban ismerem fel

Page 33: A szófelismerés információs értelmezése

McGuninees galvános bőrreakció és felismerési idő az érzékeny szavakra

Page 34: A szófelismerés információs értelmezése

Eriksen 1960 kritikus felfogása

Eriksen: a C modell az érvényes

Page 35: A szófelismerés információs értelmezése

Recehártya

Colliculus superior

Amygdala

Corpus geniculatum laterale

Elsődleges látókéreg

A kettős fedolgozás és a szubcepció modellje ma

Page 36: A szófelismerés információs értelmezése

Beépített elektródák epilepsziásoknál

• Piros – fenyegető – zöld neutrális • Kék az eltérés • Maszkolt-nem maszkolt • Érzelem: még küszöb alatt is

megjelenik a hatása • ? Milyen neurális körökből?

Page 37: A szófelismerés információs értelmezése

Előfeszítés

• Ajtó kerék

• Ablak ablak

Page 38: A szófelismerés információs értelmezése

Maszkolás

• Kutya

Macska

Hasonlított-e a szó érzelmileg?

Legerősebb érzelmi esetben:

Pl. dög

genny

Volt-e ehhez hasonló szó?

Page 39: A szófelismerés információs értelmezése

Nem tudatos előfeszítés jellemzői gyors s nem hagy nyomot Greenwald et al 1996

-0,050

0,050,1

0,150,2

0,250,3

67 10 133 167

Késletetés

Küszöballati priming

D'

-0,4-0,2

00,20,40,60,8

1

100 200 300 400

Késletetés

Küszöbfeletti priming

KüszfelKüsz alatt

Page 40: A szófelismerés információs értelmezése

Nyelv és tudat szisztémás eltérülései

• (1) Az irreleváns jelentések automatikus aktiválása. • (2) A hangrestauráció jelensége 40 % nem tudja, hol volt • (a) Mindenki csendben volt, csak nekünk jár a *ánk.• (b) Megettük a főzeléket, nekünk már jár a *-ánk.• (3) Társalgásainkat számos rejtett nem tudatos szabályszerűség irányítja. Tudjuk

ezt? • (a) Megkérhetlek, hogy csukd be az ajtót?• (b) Be tudnád csukni az ajtót?• (c) Nem akarod becsukni az ajtót?• (d) Nem kellene becsukni az ajtót?

Page 41: A szófelismerés információs értelmezése

Kétértelműség • Általános felismerés: kettős aktiváció

• Nyúl

• Elvi mechanizmus Főnév

•Nyúl•300 ms

Page 42: A szófelismerés információs értelmezése

Kétértelmű szavak – egyértelmű mondatok • Főnév A zenekarból hiányzik a dob. HEGEDŰ HAJÍT• Ige Feri mindig ballal dob.• HAJÍT HEGEDŰ• Kontroll Mari a labdához fél kézzel nyúl. HAJÍT HEGEDŰ

Page 43: A szófelismerés információs értelmezése

A nem releváns értelem is megjelenik Gergely és Pléh Mit jelent ez? Dekomponálás • Kiolvasási idők

425

430

435

440

445

450

455

460

Tő DOB KétértDOBOK

EgyértDOBSZ

Relev

Irrel

Kontroll

Page 44: A szófelismerés információs értelmezése

Mondatkontextus Releváns olvasat Irreleváns olvasat

Igei előfeszítésA labdát ballal

dobom

nincs hatás facilitáció

Főnévi előfeszítésA zenekarban ott

van a dobom.

facilitáció gátlás

Bonyolultabb hatás: mindig a főnév az elsődleges Thuma mégpedig ez a gyakoribb

Page 45: A szófelismerés információs értelmezése

Vagyis a szófaj döntő: Főnév mindig előnyben (Thuma és Pléh)

-30

-20

-10

0

10

20

30

Tő Kétér Egyértelm

Főnév Relev

Ige Irrev

Ige Rel

Főnév Irrel

Page 46: A szófelismerés információs értelmezése

Szóalak

Kettős aktiváció „Tudatos”:

relevancia szelekció

Visszatudatosítás pl. szóvicc Megetted már a halad? .Nem én konzervatív vagyok

Page 47: A szófelismerés információs értelmezése

Mindez mit is jelent ?

• 300 mscig mindkét jelentés aktív• Utána már csak a releváns • Inger tudatosulás

• Dennett 400-800 millisecundumos integrációs ablak • Ezen az idői ablakon belül áthelyezés, kapcsolatképzés

Page 48: A szófelismerés információs értelmezése

Tudatosak-e intuitív ítéleteink?

• (a) Ott ült a kávéházban.• (b) Belement a feladatba.• (c) Bement a kávéházban.• (d) Csalódott a feladatba.

Page 49: A szófelismerés információs értelmezése

A stigmatizáció megjelenése reprezentatív mintában Pléh, 1995

11,6

51,147,3

71,2

85,2

01020

30405060

708090

Helytelen

Stigmatizált

Hiperkorrekt, rossz

Hiperkorrekció érzékeny

Helyes

Elf

ogad

ási %

Page 50: A szófelismerés információs értelmezése

12 1318

84

6973

78

5248

0

10

20

30

40

50

60

70

80

90

tükör foncsor csoport

kísérleti helyzet

száz

alék

helytelen (stigmatizált)

helyes

hiperkorrekciótindukáló

A tudatosság növekedésével csökken a hiperkorrekció Bodor és Pléh tükörben megítélés

Page 51: A szófelismerés információs értelmezése

Jackendoff 2007

1. Az élménytudatosság a hangalakra vonatkozik.2. A nyelvi tudatosság mindig érzéki képzetekhez, beszédhangokhoz

vagy jelekhez kapcsolódik.3. A gondolat formája s ezzel a jelentés sosem tudatos.4. A gondolkodás evidencia élménye javarészt a nyelvi képzetekből

származik.

Page 52: A szófelismerés információs értelmezése

Jean Piaget: Pszichológia és ismeretelmélet, 1970

• Nem vagyunk azonnali tudatában pszichés műveleteinknek, s ezek önműködően zajlanak le, míg csak akadályba nem ütköznek. A tudatosítás tehát centripetális s nem centrifugális, vagyis a műveletek külső eredményeiből indul ki, mielőtt azok belső mechanizmusaira áttérne.

Page 53: A szófelismerés információs értelmezése

Lehetséges feladatok

• Entrópiaértékek a magyar szótárban a szóalakok alapján eltérő gyakoriságoknál.

• KABÁT kabátok kabáthoz • ÜRGE ürgét, ürgének stb. • http://mokk.bme.hu/resources/webcorpus/• Egyéni szógyakoriságok, pl. email szövegek alapján, s viszonyuk a

corpus gyakorisághoz • Szubjektív és objektív gyakoriság összevetése. • Hol tér el?