curs cercetare

37
METODE DE CERCETARE ( elaborarea proiectelor, curs) Lect. Univ. Dr Alexandru Blaga Universitate de Vest „Vasile Goldiş” Arad 1

Upload: emilia-uzun

Post on 26-Jun-2015

635 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curs Cercetare

METODE DE CERCETARE

( elaborarea proiectelor, curs)

Lect. Univ. Dr Alexandru BlagaUniversitate de Vest „Vasile Goldiş” Arad

1

Page 2: Curs Cercetare

CAP. I. CONSIDERAŢII GENERALE DESPRE CERCETAREA ŞTIINŢIFICĂ

1.1. Cercetarea din perspectivă gnoseologică

Conform DEX (on-line) gnoseologie este „teoria filosofică asupra capacităţii omului de a cunoaşte realitatea şi de a ajunge la adevăr, teoria cunoaşterii”.

Aceeaşi sursă defineşte epistemologia ca „parte a gnoseologiei care studiază procesul cunoaşterii aşa cum se desfăşoară în cadrul ştiinţelor, teorie a cunoaşterii ştiinţifice”.

Ronald F.King (Strategia cercetării, 2005, p.36) este de părere că în cazul cercetării „se pun două întrebări critice : ce şi cum putem cunoaşte? Prima întrebare reprezintă ontologia, a doua epistemologia”.

Termenii „a propune” şi „a dispune” sunt termenii care ar putea clarifica răspunsurile la întrebările formulate.

În perspectivă ontologică, folosind termenii propuşi, întrebările se reformulează, se dezvoltă astfel: Oare lumea ni se oferă, ni se propune spre înţelegere sau noi ne propunem înţelegerea ei?

În perspectivă epistemologică interogaţia este următoarea:Oare lumea este cea care ne dictează atunci când ne evaluăm afirmaţiile, permiţând să

păstrăm partea adevărată şi să dispunem eliminarea a ceea ce este fals, sau criteriile de eliminare sunt la discreţia evaluatorului?

În domeniul ştiinţelor sociale, spre deosebire de domeniul ştiinţelor exacte, unde disputa asupra cunoaşterii ştiinţifice este mai puţin aprinsă, există câteva obiecţii serioase cu privire la cercetare.

1) Societatea este un fenomen prea complex, deci judecăţile produse sunt fie irelevante, fie banale.

2) Judecăţile de tip lege privind societatea nu pot prezenta interes, trăim într-un anumit spaţiu şi timp deci ele nu pot fi veşnic adevărate. În ştiinţele exacte (fizică, chimie, matematică) legile descoperite sunt veşnic valabile

3) Un observator nu obţine obiectivitate ştiinţifică deoarece atât observatorul cât şi ceilalţi indivizi, membrii ai societăţii, trăiesc în acelaşi mediu uman.

4) Indivizii umani sunt imposibil de abordat din perspectiva obiectivităţii şi a constanţei ştiinţifice, deoarece aceştia dispun de libertate şi voinţă, deci sunt schimbători.

Susţinătorii necesităţii cercetării în domeniul ştiinţelor sociale, afirmă că pentru ca aceasta să fie utilă, trebuie îndeplinite câteva condiţii:

- cercetarea să fie empirică, să se bazeze pe observaţii şi experienţe în mediul social- rezultatele cercetării să fie verificabile. Aceasta presupune posibilitatea aplicării de

probe care constituie modalităţi de a distinge adevărul de neadevăr, de fals- cercetarea va trebui să fie ne-normativă, adică verificarea (demonstrarea) ipotezelor se

va face independent de preferinţele cercetătorului- informaţiile obţinute în urma cercetării trebuie să fie transmisibile şi generale- fenomenele cercetate vor fi prezentate în final în manieră cauzală- rezultatele oricăror cercetări vor fi considerate provizorii. Demersul în cercetare va putea

fi reluat atunci când se va considera necesar.Ştiinţa, în general, este nomologică, adică produce afirmaţii de forma:

„Pentru toţi X şi toţi Y, dacă condiţiile rămân neschimbate, dacă X….. atunci Y ….”. Afirmaţia este uneori modificată, astfel: „Pentru toţi X>i şi toţi Y<j, dacă toate condiţiile rămân neschimbate, dacă X….. atunci Y ….”

2

Page 3: Curs Cercetare

În sfera epistemologică a ştiinţelor contemporane, asistăm în ultimul timp, la o situaţie contradictorie, aparent paradoxală: tendinţa de apropiere a ştiinţelor socio-umane de ştiinţele naturii dar şi o delimitare tot mai accentuată a sferelor de cunoaştere.

Prima tendinţă se explică prin unitatea lumii materiale în care are loc orice cercetare. A doua tendinţă se aplică pe fondul unităţii de ansamblu a ştiinţelor, unde se acumulează

tot mai multe deosebiri în detalii, ca efect al unor cercetări ştiinţifice particulare şi a unor reflecţii filosofice de amploare.

După unii cercetători (Diltheiy, de exemplu) distincţia dintre ştiinţele socio-umane şi ştiinţele naturii, are la bază diferenţa dintre explicaţie, proprie ştiinţelor naturii şi înţelegere, proprie ştiinţelor socio-umane. Explicaţia vizează cauzele, iar înţelegerea, referindu-se la fenomen, solicită un efort de intuiţie şi imaginaţie.

1.2. Subiect, teorie şi metodă în cercetare

Subiectul cercetării va trebui să aibă câteva calităţi:- să fie important- să fie relevant pentru lumea în care trăim (acum!)- să cuprindă o aserţiune numită ipoteză urmată de argumentaţie

Ipoteza are forma tipică: „Dacă X …. atunci Y…..”

Exemple:1) Proiectul de cercetare are ca subiect evoluţia concepţiei despre educaţie în Antichitate.Cercetarea se va face pe baza studiului bibliografiei (vezi cap. II).

2) Proiectul de cercetare are ca subiect nemulţumirea educatorilor privind salarizarea în învăţământul românesc.

O formulare a ipotezei ar putea fi următoarea: Dacă salariile în învăţământ nu cresc, nemulţumirea educatorilor va creşte.

Formularea ipotezei poate fi dezvoltată prin precizarea unor detalii (categorii de personal didactic determinate de vechime, învăţământ preuniversitar sau universitar, procente de creştere etc.)

Existăm într-o lume nestructurată. Demersul cognitiv este orientat în direcţia ordonării fazelor, evenimentelor, a reacţiilor în scopul realizării unei cunoaşteri sistemice. Aceasta este scopul teoriei.

Exemplu:Rezultatele brute ale unui test docimologic sunt nesistematizabile. Teoria care poate

sistematiza rezultatele este statistica.Metoda este modalitatea de a ajunge la o concluzie despre ipoteza cercetării.

Concluzia despre ipoteză poate fi:1) adevărată sau falsă2) deocamdată adevărată sau falsă3) probabil adevărată sau falsă

TEMĂAlegeţi un subiect de cercetare în domeniul ştiinţelor educaţiei. Formulaţi ipoteza cercetării.

3

Page 4: Curs Cercetare

CAP. II. PRACTICA CERCETĂRII

2.1. Alegerea temei (subiect) de cercetat

Criteriile care se vor avea în vedere la alegerea temei de cercetare sunt:- experienţa personală şi pasiunea pentru un anumit domeniu- extensia (volumul) temei să fie în concordanţă cu posibilităţile de abordare- tema va propune remedierea unor neajunsuri

2.2. Tehnica documentării va satisface următoarele exigenţe:

- Înlăturarea unei bibliografii supraabundente sau din contră;- Lectura pe care o face cercetătorul în vederea documentării va fi o lectură de calitate;- Cercetătorul trebuie să fie un bun cunoscător al specialităţii dar şi un cunoscător a

disciplinelor de graniţă, ale domeniului;- O bună cunoaştere a tehnicilor de clasificare a bibliotecii (catalog pe materii, catalog

alfabetic) se impune de asemenea;

După întocmirea listei bibliografice urmează studierea bibliografiei.- Documentarea va fi selectivă şi va cuprinde lucrări de valoare, reprezentative pentru

domeniu;- Documentarea se va face cu spirit critic, informaţia va fi trecută prin filtrul

cercetătorului;- Documentarea va fi continuă. Ea se va desfăşura şi în timpul cercetării;- Lectura cu caracter de documentare presupune citirea şi consemnarea celor citite;- Citirea poate fi progresivă. O astfel de citire are ca scop parcurgerea rapidă a

informaţiei;- Citirea poate fi exegetică. O astfel de citire are ca scop orientarea cu precădere spre

părţile mai dificil de înţeles;- Documentarea se poate face direct pe sursă, prin folosirea unor semne convenţionale sau

se va face pe fişe bibliografice.

2.3. Ipoteza în cercetarea ştiinţifică

Aşa cum am mai arătat (cap. I), ipoteza este un enunţ a cărui valoare de adevăr (adevărat sau fals) este probabilă (în faza de început a cercetării). Cercetarea va dovedi exact valoarea de adevăr a ipotezei.

Cea mai simplă ipoteză statuează că o variabilă X influenţează (cauzează sau declanşează) variabila Y.

Ipoteza confirmată devine teorie dar şi practică. După stabilirea ipotezei urmează testarea şi apoi valorificarea ei. Pe parcursul testării ipoteza poate suferi modificări.

Ipoteza specifică pleacă de la presupunerea că doar modificările ce se produc s-ar datora modificărilor factorului X, aflat sub controlul cercetătorului.

Ipoteza nulă pleacă de la presupunerea că toate modificările ce se produc s-ar datora unor factori întâmplători.

Respingerea ipotezei nule întăreşte ipoteza specifică.Ipoteza nulă este o ipoteză statistică şi poate fi respinsă dacă probabilitatea factorilor aleatori

este sub 50%. În caz contrar ea poate fi admisă.

4

Page 5: Curs Cercetare

Admiterea sau respingerea ipotezei nule se poate face pe baza calculului unor indici de semnificaţie stabiliţi prin „testul z” sau „testul t”.

În unele cercetări, numite cercetări descriptive, ipoteza nu trebuie formulată explicit.

2.4. Metodica cercetării

Metodica cercetării include:- stabilirea metodelor pentru recoltarea datelor, prelucrarea şi interpretarea lor- stabilirea demersului logic (declarativ, inductiv) - eşantionarea pentru cercetarea dar şi pentru grupul martor

Metodele folosite în cercetare sunt:- observarea- experimentarea- teste- anchetă (convorbiri, chestionare)- studiul produselor- studiul documentelor etc.Complexitatea fenomenelor studiate, obligă cercetătorul la a lua în considerare mai multe

metode simultan.

2.5. Prelucrarea şi interpretarea datelor

Interpretarea datelor este operaţia prin care se descifrează semnificaţia informaţiei obţinute din datele colectate.

Prelucrarea datelor este în principal o operaţie statistică care are în vedere calcularea:- valorilor centrale (media, mediana, modul)- abaterile faţă de tendinţa centrală (abaterea centrală, abaterea standard, dispersia)- coeficientul de corelaţieInterpretarea şi prelucrarea datelor implică:- operaţii logice (analiză, sinteză, comparaţie, abstractizare, generalizare)- raţionamente (inductiv, deductiv)- cultură psihopedagogică

2.6. Eşantionarea

TEMĂ:De ce este nevoie de eşantionare ?Arătaţi care sunt avantajele şi dezavantajele eşantionării

Extinderea concluziilor desprinse din eşantionare se cheamă estimare.Eşantionarea este de mai multe tipuri:- Eşantionarea simplă aleatoare: prin procedeul loteriei, sau alegerea celui de al n-lea

individ dintr-o populaţie ordonată aleator, sau tabele cu numere aleatoare etc.- Eşantionarea stratificată. Populaţia statistică se împarte iniţial în straturi, se alege apoi

un eşantion din fiecare strat prin eşantionare simplă , aleatoare- Eşantionare fixă (panels). Eşantionul este ales fie în mod aleator, fie stratificat. Din

timp în timp, se fac cercetări asupra eşantionului ales. Se studiază astfel tendinţa în timp producerii fenomenului.

- Eşantionul experimental (E.E.), este cel asupra se acţionează cu ajutorul factorului experimental.

- Eşantionul de control(martor) (E.C.) este eşantionul asupra căruia nu se acţionează în timpul cercetării.

5

Page 6: Curs Cercetare

Uneori, în cercetare, se foloseşte tehnica „înainte şi după” ce are în vedere un singur eşantion. Aici se fac măsurători înainte şi după introducerea factorului experimental.

Între EE şi EC, pe cât posibil, trebuie să existe o egalizare – omogenizare. Aceasta se obţine prin:

- eşantionare corelată (fiecărui individ din EE îi corespunde un individ asemănător din EC)

- stabilirea de sub-eşantioane şi compararea lor. Pe baza unui test iniţial, de exemplu se stabilesc sub-eşantioane cu indivizi mediocri, buni şi foarte buni, atât în EE cât şi în EC

În final eşantioanele se compară între ele.- controlul statistic constă în testarea prealabilă a celor două eşantioane, calcularea pe

baza datelor a tendinţei centrale şi a variabilităţii (gradul de la care media aritmetică este semnificativă).

Cu cât diferenţele dintre indici sunt mai mici, cu atât eşantioanele sunt mai omogene şi tendinţa ca factori necontrolaţi să intervină în experiment este mai redusă.

2.7. Metode de cercetare

Experimentul: După E. Planchard, (Cercetare în pedagogie, 1972, EDP) „metoda experimentală constă, în primul rând, în introducerea sau suprimarea unuia sau a mai multor factori, bine determinaţi într-o situaţie cunoscută, în vederea verificării rezultatului acestei intervenţii”.

Variabilele care intervin în experiment sunt de mai multe tipuri:- variabile independente- variabile dependente- variabile intermediareExperimentul are câteva funcţii:- gnoseologică sau de cunoaştere a unor aspecte noi- praxiologică ce presupune modificare acţiunii, perfecţionarea eiFazele experimentului sunt următoarele:- faza preliminară, în care se selectează eşantioanele, se cristalizează variabilele, se

precizează factorul experimental care încă nu intervine, se stabileşte strategia experimentării.

- faza administrării factorului experimental- faza înregistrării rezultatelorPentru a explica modul în care se desfăşoară o cercetare facem notaţiile: t1,t2,t3 - fazele cercetăriiVd1 – variabila dependentă la începutul experimentuluiVd2 – variabila dependentă la sfârşitul experimentuluif.e. – factorul experimental

Schema următoare lămureşte modul cum pot fi citite rezultatele experimentului în cazul celor două eşantioane EE şi EC.Tab.1

Eşantion Variabila dependentă

Experiment Variabila dependentă

Diferenţe Nr. crt.

EE Vd1 Vd1+f.e. Vd2 Vd2 -Vd1 1EC Vd1 Vd1+0 Vd2 Vd2 -Vd1 2

Faza t1 t2 t3 - -Diferenţele (1) respectiv (2) arată măsura în care starea variabile dependente Vd, după o

perioadă de timp se schimbă.Mai mult, în cazul (1), diferenţa arată şi măsura în care factorul experimental şi-a făcut

efectul (sau nu).

6

Page 7: Curs Cercetare

Diferenţa dintre (1) şi (2) arată măsura în care factorul experimental şi-a făcut (sau nu) efectul atunci când factorul experimental a intervenit în EE, dar nu a intervenit în EC.

Experimentele pot fi clasificate astfel:- experimentul de laborator. Acesta se realizează într-un spaţiu special amenajat unde se

înlătură influenţa unor factori întâmplători.- experimentul natural. Acesta se desfăşoară într-o ambianţă naturală, în procesul de

activitate.

Cercetarea corelaţională

În cazul cercetării experimentale cercetătorul intervine asupra variabilelor independente studiind apoi efectele acestei intervenţii. În principal deci, experimentul presupune manipularea conştientă a unor variabile.

Uneori cercetătorul nu poate manipula variabile.În aceste cazuri se rezumă la a surprinde corelaţiile dintre variabile. Cercetarea corelaţională

este descriptivă.În cazul experimentului variabila independentă influenţează variabila dependentă. În cazul

cercetării corelaţionale variabila independentă este asociată variabilei dependente şi o poate influenţa.

Corelaţia este calculată cu formule speciale. Mărimea şi semnul (plus sau minus) ne indică intensitatea şi direcţia ei.

TEMĂ1) Imaginaţi o cercetare experimentală explicând ipotezele cercetării, variabilele şi modul în

care vă alegeţi eşantionul2) Imaginaţi o cercetare corelaţională evidenţiind variabilele pentru care credeţi că veţi putea

demonstra că sunt în corelaţie.

Metoda observaţiei

Observaţia presupune urmărirea faptelor în desfăşurarea lor firească, naturală. Observatorul nu intervine, el înregistrează doar, aşteptând producerea fenomenelor.

Cerinţele privind realizarea observaţiei sunt:- elaborarea unui plan de observaţie (se pot imagina şi observaţii fără elaborarea prealabilă

a unui plan)- consemnarea datelor observaţiei. În această situaţie se folosesc fişele de observaţie,

tehnică de înregistrare electronică.- efectuarea observaţiilor , în condiţii variate, de acelaşi observator sau mai mulţi

observatori- un observator străin poate altera rezultatele observării. Din acest motiv se recomandă ca

observatorul să fie integrat în fenomen.Indicatorul observaţional sau empiric exprimă determinarea cantitativă a unei caracteristici

calitative. Se procedează astfel:- se stabileşte obiectul investigaţiei- se stabilesc clasele prin care se anticipează că obiectul investigaţiei s-ar putea manifesta.

Fiecărei clase i se asociază un indicator.Indicatorii astfel stabiliţi se pot exprima numeric şi constituie informaţii cantitative despre

fenomen.Operaţionalizarea indicatorilor presupune parcurgerea traseului dintre conţinuturile teoretice

specifice fenomenului de studiat şi aspectele empirice, practice ale aceluiaşi fenomen.

7

Page 8: Curs Cercetare

Metoda anchetei

În principal, metoda anchetei presupune un dialog între cercetători şi subiecţii cercetaţi.Convorbirea este o formă de anchetă care de regulă se desfăşoară după un plan. Nu

înseamnă că cercetătorul nu se poate abate de la acest plan.Chestionarul, o altă formă a metodei anchetei, se bazează pe întrebări care pot fi închise,

deschise sau cu răspunsuri formulate anterior.Cele închise au 2 sau cel mult 3 variante de răspuns, cele deschise nu au variante de răspuns

iar cele cu răspunsuri formulate anterior au mai multe răspunsuri propuse.,mai mult de trei răspunsuri propuse.

Metoda analizei produselor

Metoda analizei produselor presupune analiza unor produse ale activităţii subiecţilor, cu scopul descoperirii unor trăsături de personalitate.

Metoda cercetării documentelor

Are acelaşi scop ca metoda analizei produselor dar ea are ca obiect de investigaţie rezultate consemnate în documente oficiale.

Metoda cazului sau metoda clinică

Această metodă se aplică în situaţii individuale mai deosebite (elevi supradotaţi, delicvenţă, întârziaţi mintali etc.). Ea înglobează un set de metode şi procedee diverse. Pe parcursul aplicării metodei se întocmeşte câte o fişă pentru fiecare caz.

Metoda biografică

Este o variantă a metodei anterioare şi se foloseşte de regulă pentru personalităţi dezvoltate peste medie (oameni de ştiinţă de notorietate, scriitori, artişti etc.)

Metoda testelor

Testul este alcătuit dintr-o probă sau din mai multe probe care înregistrează prezenţa sau absenţa unui fenomen psihic, comportament sau reacţie la stimul (I.Drăgan şi I. Nicola, 1995, Cercetarea psihopedagogică).

Standardizarea testului presupune elaborarea unor reguli şi cerinţe privind administrarea testului. Etalonarea constă în realizarea unei scări la care se raportează rezultatele testului. Etalonarea se face pe un eşantion.

Calităţile ce se cer îndeplinite în cazul testului sunt:- Fidelitatea. Aceasta reflectă gradul în care aplicarea testului în condiţii apropiate

conduce la rezultate apropiate.- Validitatea testului indică gradul în care un test măsoară obiectivele pentru care a fost

construit.Testele post fi clasificate după câteva criterii:

Clasificarea testelor după numărul de indivizi cărora le este aplicat:- teste individuale

8

Page 9: Curs Cercetare

- teste de grupe- teste combinate

Clasificarea testelor după conţinut:- teste de cunoştinţe (docimologice)- teste psihologice (de memorie, de imaginaţie, de atenţie etc.)- teste de personalitate (inventare de personalitate)

Interpretarea datelor furnizate de teste trebuie făcute cu multă precauţie (mai ales în cazul testelor psihologice şi de personalitate)

TEMĂ1) Construiţi un test docimologic standardizat. Explicaţi cum se face etalonarea testului.2) Elaboraţi un studiu de caz pentru un elev deosebit dintr-o clasă pe care o cunoaşteţi

2.8. Sugestii privind valorificarea cercetării

Importanţa subiectului abordat, rezultatele obţinute în cercetare, determină hotărâtor modul de comunicare şi valorificare a rezultatelor cercetării.

În cazul în care cercetarea produce efecte remarcabile în domeniul ştiinţific abordat, rezultatele cercetării vor fi comunicate lumii ştiinţifice, sub forma unor lucrări ştiinţifice elaborate în limbi de circulaţie mondială şi vor fi publicate în reviste de specialitate, prezentate în sesiuni ştiinţifice sau editate în edituri de prestigiu.

Munca de cercetare presupune din partea cercetătorului realizarea, chiar pe parcursul cercetării, a unor instrumente de lucru, evidenţierea unor rezultate parţiale, studiu bibliografic însoţit de fişe şi alte activităţi asemănătoare. Acestea vor sta la baza redactării finale a rezultatelor cercetării.

Structura lucrării finale depinde de importanţa acesteia, de mediul ştiinţific căruia i se adresează, de planul de cercetare, personalitatea autorului cercetării etc.

Structura unei lucrări de gradul I, de exemplu, ar putea fi concepută astfel (după I.Drăgan şi I. Nicola, 1995, Cercetarea psihopedagogică, p.33):

Partea întâi va cuprinde importanţa temei tratate şi motivarea alegerii acestei teme. Partea a doua va aborda metodica cercetării unde vor fi enunţate ipotezele de lucru,

eşantionul ales, metodele utilizate, etapele cercetării, etc. Partea a treia va cuprinde rezultatele cercetării, prelucrarea lor statistică, comentarii de

natură psihologică, pedagogică, socială, într-un cuvânt interpretarea rezultatelor. Partea a patra va cuprinde concluziile şi propunerile pe care autorul le face în baza

rezultatelor cercetării. Sfârşitul lucrării cuprinde de obicei anexe cu diferite rezultate şi bibliografia.Referatul este o altă modalitate de valorificare a unei cercetări. Acesta va trebui să fie

concis, având în vedere că se susţine public, într-un interval de timp limitat.Comunicarea ştiinţifică, ca formă de exprimare a rezultatelor cercetării, este destinată unui

public bun cunoscător al domeniului. Va fi concisă şi de regulă susţinerea sa va fi urmată de dezbateri laudative sau critice, întrebări, intervenţii etc.

Comunicarea rezultatelor cercetării în formele amintite produce de multe ori discuţii aprinse, dezvoltări argumentative favorabile sau nefavorabile. Toate acestea pot avea ca efect dezvoltarea cercetării, un real câştig pentru cunoaşterea ştiinţifică.

9

Page 10: Curs Cercetare

CAP. III. ELEMENTE DE STATISTICĂ MATEMATICĂ

3.1. Ce ne poate oferi statistica

Înainte de aborda elementele statisticii matematice este bine să lămurim care sunt beneficiile aduse de statistică, în cunoaştere, dar şi care sunt limitele cunoaşterii prin statistică.

Obiectul de studiu al statisticii este constituit din fenomenele de masă iar raţionamentul folosit în mod deosebit este raţionamentul de tip inductiv.

Fenomenele de masă sunt fenomene atipice şi deosebit de complexe. Studiul lor este important atât dintr-o perspectivă diagnostică cât mai ales din perspectivă prognostică.

Esenţa unui fenomen de masă poate fi cunoscută dacă se iau în considerare un număr mare de cazuri individuale deoarece indivizii în aparenţă asemănători, au în fond, o multitudine de trăsături distincte. Fenomenele de masă se caracterizează prin variabilitate.

Fenomenele de masă sunt deterministe de tip stohastic, care se produc în condiţii de incertitudine.

Demersul uman de cunoaştere folosind statistica tinde, în condiţiile arătate despre fenomenele statistice, să se raporteze la termenii de constanţă şi stabilitate necesari interpretării fenomenelor statistice.

Acest lucru este posibil deoarece aceleaşi cauze care operează asupra sistemului studiat determină permanent rezultatele ce variază continuu între limite bine stabilite şi care pot fi determinate. În concluzie avem în obiectiv, prin studiul statistic, un sistem controlat de cauze, iar rezultatele pun în evidenţă stabilitatea între anumite limite. Se spune astfel că procesul este într-o stare de control statistic (W.E.Deming).

Legile statistice (stohastice) se manifestă sub formă de tendinţe şi sunt valabile pentru un întreg ansamblu de unităţi.

Statistica se bazează pe principiile teoriei probabilităţilor, pe cerinţele legii numerelor mari, formulată de J. Bernoulli. Legea numerelor mari afirmă că într-un număr suficient de mare de cazuri individuale, influenţele factorilor individuali se compensează într-o astfel de manieră încât determină o valoare tipică a întregului ansamblu.

Statistica abordează fenomenele de masă printr-un studiu cantitativ. În esenţă studiul presupune următoarele etape:

- observarea statistică- sistematizarea datelor primare- prezentarea rezultatelor prelucrării primare sub formă de tabele , diagrame, grafică sau

indicatori- interpretareaÎn situaţia în care studiul statistic s-a făcut pe un eşantion şi nu pe întreaga populaţie,

urmează generalizarea printr-un raţionament inductiv, verificarea ipotezelor, formularea de predicţii şi formularea concluziilor.

Dacă studiul statistic s-a făcut pe întreaga populaţie, după faza de interpretare se trece la formularea concluziilor.

Încercând să concluzionăm şi să răspundem la întrebarea pusă la începutul paragrafului, statistica îşi dovedeşte utilitatea în cercetare deoarece:

- porneşte de la date dispersate şi amorfe aducându-le la o formă ordonată- studiul efectuat prin mijloace specifice asupra datelor ordonate, arată tendinţa în care se

dezvoltă fenomenul studiat, tendinţă ce poate fi de real folos în elaborarea prognozei.Limitele analizei statistice se referă la:

10

Page 11: Curs Cercetare

- imposibilitatea de a ajunge la concluzii certe asupra unui individ al unei populaţii pornind de la caracteristicile generale ale populaţiei studiate statistic.

- concluziile formulate în analizele statistice sunt doar probabile. Este drept că probabilitatea poate să fie mai mare sau mai mică şi poate fi prevăzută sau chiar influenţată.

- costurile mari ale unor cercetări statistice în cazul unor populaţii numeroase (cercetare totală) sunt evitate prin eşantionare (cercetare selectivă) care prezintă o marjă de nesiguranţă, atunci când interpretarea pe eşantion este generalizată la populaţia totală.

3.2. Noţiuni de bază ale statisticii

Cercetarea unui fenomen cu ajutorul metodelor statisticii se numeşte cercetare statistică sau analiză statistică.

Mulţimea elementelor suspusă unei cercetări statistice se numeşte populaţie statistică sau simplu, populaţia.

Elementele populaţiei statistice se numesc indivizi sau unităţi statistice.

Exemple:1) Mulţimea locuitorilor unei regiuni pentru care se studiază cu metode statistice

fenomenul gripei virale poate fi o populaţie statistică.2) Mulţimea pieselor produse într-un atelier pentru care se studiază fenomenul rebuturilor

poate fi o populaţie statistică, dacă studiul se face cu metodele statisticii

Caracteristica (statistică) sau variabila statistică desemnează însuşirea comună a indivizilor care capătă valori sau accepţiuni diferite de la un individ la altul.Exemple: sexul, vârsta, culoarea părului, ocupaţia, înălţimea, cifra de afaceri etc.

Caracteristicile calitative se exprimă prin cuvinte care reprezintă apartenenţa la o categorie.Exemple: culoarea ochilor se exprimă prin cuvintele albaştrii, verzi, căprui

Caracteristicile cantitative sunt exprimate numeric.Exemple: Înălţimea indivizilor este exprimată numeric în centimetri, metri, decimetri etc.

Vârsta indivizilor este exprimată numeric în ani, luni, zile etc.

Fiecare caracteristică (variabilă) este definită de mulţimea valorilor individuale (variante) numită şi spaţiu al observaţiilor (notat cu M).

Spaţiul observaţiilor poate fi înzestrat cu o structură de ordine (mai mic, mai mare, egal), cu o structură algebrică (adunare, înmulţire, cu proprietăţile caracteristice), cu o structură de ordine şi o structură algebrică sau poate fi nestructurat (admite doar identitatea =, sau neidentitatea ≠). Structura spaţiului observaţiilor depinde de scala folosită.

Spaţiul observaţiilor poate avea o mulţime finită sau infinită de elemente. Dacă spaţiul observaţiilor este numeric (cazul caracteristicilor cantitative) acesta poate fi o mulţime discretă de genul {1,2,3,4} sau una continuă, de tipul intervalului [1;100] care cuprinde toate numerele întregi, raţionale şi iraţionale cuprinse între 1 şi 100.

Exemple: Caracteristica rezultatelor la teza de matematică (exprimată în note întregi) are mulţimea

observaţiilor {1,2,3,….,10}, o mulţime discretă. Caracteristica înălţimea elevilor clasei a II-a (exprimată în metri) poate fi intervalul

[0,8;1,20].

11

Page 12: Curs Cercetare

Scala reprezintă instrumentul care permite exprimarea măsurii în care un individ posedă o anumită caracteristică.

În principal există scala nominală, ordinală, scală de interval şi scală de raport.Scala nominală este folosită pentru exprimarea unor variabile nominale.Variabilele nominale determină împărţirea populaţiei statistice în clase disjuncte (fără

elemente comune) a căror reuniune este populaţia statistică întreagă.Exemplu:

Într-o grupă cu 35 de studenţi se studiază caracteristica (calitativă) culoarea ochilor. Rezultatele sunt cuprinse în tabelul alăturat:

Tab.2Clasa Efective

C1 albaştri 5C2 verzi 12C3 căprui 8Total 25

Scala nominală astfel construită are calitatea de a repartiza fiecare individ într-o singură clasă şi de a nu lăsa nici un individ nerepartizat.

Reprezentarea grafică obişnuită în acest caz este histograma, prezentată mai jos.

Fig.1Spaţiul M aferent scalei nominale nu prezintă nici o structură. Totuşi în M se admite

identitatea notată „=” sau neidentitatea notată „≠”. O altă reprezentare grafică posibilă a caracteristicii date este camembertul . Se calculează, în procente, efectivele (frecvenţa) pentru fiecare clasă, apoi, proporţional cu aceste procente, se desenează într-un cerc trei sectoare, câte unul pentru fiecare clasă.

În cazul rezultatelor exprimate în scală nominală se poate desemna modul (clasa cu cei mai mulţi indivizi, vezi paragraful următor). În exemplul considerat, modul, notat M0 este C2.

Scala ordinală împarte populaţia în clase care trebuie să satisfacă următoarele condiţii:- oricare două clase sunt disjuncte- reuniunea lor este populaţia întreagă- clasele sunt ordonate (se va înţelege care este prima, a doua, a treia etc.)Spaţiul M aferent scalei ordinale are structură de ordine.

Exemplu: (adaptat după S. Moscovici şi F. Buschini, 2007).Nivelul de studiu al unei populaţii dintr-o întreprindere se prezintă astfel:

12

Page 13: Curs Cercetare

Tab.3 Nivelul de studiuEfective

Cu mai puţin de gimnaziu

Cu mai puţin de

liceu

Cu liceu Cu bacalau

reat

Cu primul ciclu univ.

Cu al doilea

ciclu univ

Cu al treilea

ciclu univ

Total

Frecvenţa absolută

C1 C2 C3 C4 C5 C6 C7

14 5 19 36 22 27 9 132Procente 11 4 14 27 17 20 7 100

Frecvenţa absolută reprezintă numărul de indivizi n ce au aceeaşi valoare a caracteristici. În cazul abordat în tabel, acesta coincide cu numărul elementelor unei clase. Frecvenţa relativă este valoarea raportului dintre n şi N (N,numărul total de indivizi ai populaţiei). Formula n/N *100 conduce la valoarea frecvenţei absolute exprimată în procente.

O scală ordinală are proprietatea de tranzitivitate, deci dacă clasa A≤B şi clasa B≤C atunci clasa A≤C.

Interpretarea relaţiei de tranzitivitate în cazul exemplului considerat ar putea fi următoarea : daca clasa A conţine indivizi mai puţin pregătiţi decât cei conţinuţi în clasa B şi clasa B conţine indivizi mai puţin pregătiţi decât cei din clasa C, atunci indivizii clasei A sunt mai puţin pregătiţi decât cei ai clasei C.

Modificăm tabelul iniţial în felul următor:Tab.4 Nivelul de studiuEfective

Cu mai puţin de gimnaziu

Cu mai puţin de

liceu

Cu liceu Cu bacalau

reat

Cu un ciclu univ.

Cu al doilea

ciclu univ

Cu al treilea

ciclu univ

Frecvenţa absolută cumulată

C1 C2 C3 C4 C5 C6 C7

132 118 113 94 58 36 9Frecvenţă relativă

cumulată100 89 86 71 44 27 7

După cum se observă a doua linie a tabelului conţine frecvenţele cumulate. Logica cumulării frecvenţelor este următoarea : dacă numărul indivizilor din clasa C6 este 27 şi a celor din clasa C7

este 9 (vezi tabelul 3) atunci evident că 27+9=36 indivizi au absolvit al doilea ciclu universitar etc.Datele cuprinse în fiecare din cele două tabele pot fi reprezentate prin două histograme.

Scala de interval este folosită în cazul caracteristicilor cantitative. Punctul zero al scalei şi unitatea de măsură pot fi alese arbitrar.

Exemple:1) Măsurarea timpului se face pe o scală de interval în care punctul 0 este anul naşterii lui

Iisus Hristos. Punctul 0 nu este pentru toate popoarele acelaşi.2) Temperatura se măsoară de asemenea pe o scală de interval cu precizarea că scala

Celsius, de exemplu, are punctul 0 ales ca nivel al temperaturii la care apa îngheaţă. Pe scara Fahrenheit acelaşi fenomen fizic se întâmplă la 32o F, deci punctul 0 ocupă o altă poziţie.

Datorită localizării arbitrare a punctului 0 suma a două valori precum şi raportul acestora nu are sens. În schimb are sens distanţa dintre două valori (diferenţa) precum şi suma sau raportul distanţelor. Spaţiul M aferent scalei de interval are structură de ordine.

Exemplu:

13

Page 14: Curs Cercetare

Dacă distanţa (în timp, diferenţa) dintre revoluţia burgheză (1848) şi insurecţia armată (1944) este de 96 de ani iar distanţa (în timp) dintre insurecţia armată şi căderea comunismului (1989) este de 45 de ani atunci distanţa între revoluţia burgheză (1848) şi căderea comunismului (1989) este 141 ani. Se poate calcula ca diferenţă sau ca sumă de diferenţe 96+45=141, acestea fiind operaţii cu sens pe o scală de intervale.

Distanţele în timp între evenimente pot fi comparate deoarece în M există o structură de ordine.

Scala de raport se caracterizează prin alegerea punctului 0 (original) în mod natural. Acesta semnifică absenţa totală a fenomenului studiat. Unitatea de măsură se alege arbitrar.

Această scală determină pe M o structură de ordine, dar şi o structură algebrică (corp ordonat).

Pe această scară de raport au sens toate operaţiile valabile pe scala de interval. În plus are sens suma şi raportul a două valori ale variabilei.

Exemplu: Scala de notare este o scală de raport. Punctul 0 (de regulă 1) semnifică lipsa totală a

fenomenului studiat (cunoştinţe, competenţe, abilităţi etc.).Calculul mediei notelor foloseşte o sumă, operaţie permisă de scala de raport.

În concluzie, pentru caracteristicile calitative se folosesc scala nominală şi scala ordinală iar pentru cele cantitative scala de interval şi scala de raport. Cantitatea de informaţie oferită prin folosirea scalelor creşte de la scala nominală (cu cea mai mică cantitate de informaţie) până la scala de raport (cu cea mai mare cantitate de informaţie).

În afară de scalele amintite ştiinţele sociale mai folosesc şi alte tipuri, din care amintim, scala de distanţă socială, scala Thurstone pentru măsurarea atitudinilor, scala Lickert.

Scala Lickert este o metodă simplă de colectare de informaţii. În construirea ei se pleacă de la baterii de enunţuri pe care subiecţii trebuie să le evalueze. Enunţurile sunt redactate, de obicei în manieră condiţională.

Exemplu:Dacă un elev este prins copiind, el trebuie drastic pedepsit!

Urmează apoi completarea, de către fiecare individ aflat în populaţia statistică a unei matrici de forma:Tab.5

Aprobare totală Aprobare Nehotărât Dezaprobare Dezaprobare totală

5 4 3 2 1

Dacă, de exemplu, bateria de enunţuri are 10 enunţuri (legate de tema copiatului, în sensul exemplificat) cotate de la 1 la 5, scorul maxim poate fi 50 iar cel minim 10. Aşadar, există 41 de nivele pe care se pot situa atitudinile indivizilor în raport cu copiatul.

Dacă majoritatea răspunsurilor înregistrează nivele ridicate înseamnă că populaţia statistică este majoritar împotriva copiatului. Dacă din contră, majoritatea răspunsurilor sunt situate pe nivele mici, înseamnă că populaţia statistică este tolerantă faţă de copiat.

Grupări de date

Notăm cu P populaţia statistică studiată după o caracteristică f, calitativă sau cantitativă. Prin măsurători (folosind diferite scale) fiecărui individ x din P i se poate ataşa o valoare a caracteristicii f(x).

14

Page 15: Curs Cercetare

Exemplu:1) Fie o clasă de 32 de elevi care se supune unei cercetări statistice după caracteristica

calitativă nivel de pregătire la matematică. Rezultatele unui test la matematică, obţinute prin aplicarea scalei de interval (scala de notare) produce următoarele informaţii:

Tab. 6Nr.crt. Numele elevului Nota

1 Abrudeanu I. 72 Bărbulescu A. 8.. ……………………. ….. ……………………. …32 Vasilescu M. 5

Rezultatul cuprins în tabelul 6 se numeşte repartiţia empirică. O reorganizare a informaţiei poate aduce mai multă claritate. Se procedează astfel:

Tab.7Nota 1 2 3 4 5 6 7 8 9 10Nr. indivizi 0 0 1 2 5 2 9 7 4 2

Este evident, din tabelul 7 că nota 8a fost obţinută de 7 elevi, nota 9 de 4 elevi, nota 3 de 1 elev etc.

Gruparea datelor în acest mod se numeşte seria statistică grupată sau repartiţie.Cu notaţiile deja acceptate, f(8)=7, f(9)=4, f(3)=1, şi în general f(x)=nx

nx (număr de indivizi) se numeşte frecvenţa absolută

Dacă N este numărul total de indivizi se numeşte frecvenţă relativă (vezi scala

ordinală)Alt exemplu:2) Studiind tensiunea la un număr de 100 de arzătoare se obţine următoarea repartiţie

empirică:Tab.8

Nr.crt. tensiune1 1342 1333 136… …… …100 148

Se cere scrierea repartiţiei statistice (exemplu adaptat după Reischer C., Sâmboau A, 1972)Rezolvarea problemei o vom face în două etape. În prima etapă vom scrie valorile

tensiunilor începând de la cea mai mică 122, până la cea mai mare 148 având grijă să numărăm unităţile statistice corespunzătoare fiecărei tensiuni. Se va obţine tabelul 9.

Tab.9.Tensiune Nr. de arzătoare Tensiune Nr. de arzătoare

122 1 … …123 2 … …124 1 … …125 1 146 2

15

Page 16: Curs Cercetare

Note Test

0

2

4

6

8

10

1 2 3 4 5 6 7 8 9 10

Nota

Fre

cven

ta a

bso

luta

Note Test

0

2

4

6

8

10

1 2 3 4 5 6 7 8 9 10

Nota

Fre

cven

ta a

bso

luta

… … 147 1… … 148 2

Informaţia cuprinsă în tabelul 9 este incomodă, tabela este prea extinsă. Concatenăm informaţia exprimând tensiunea pe intervale aşa cum se vede în tabelul 10.

Tab.10

Notă!Evident, pentru simplificarea expunerii, tabelele nu conţin toate datele, pentru detalii poate fi consultată sursa bibliografică citată.

Observaţie:În situaţia în care gruparea datelor se face pe intervale, valoarea medie a capetelor

intervalului va reprezenta intervalul. Pe intervalul[122;124] valoarea medie este 123, pe intervalul [125;127] valoarea medie este 126 etc. Valoarea medie astfel calculată, se numeşte valoare centrală a intervalului.

3.3 Reprezentarea grafică a seriilor statistice pentru o singură caracteristică

Am amintit deja că seriile statistice pot fi reprezentate prin histograme dar şi folosind camambertul. Adăugăm la aceste modalităţi de reprezentare grafică a seriilor statistice, reprezentarea prin batoane şi prin poligonul frecvenţelor.

Pentru exemplificare folosim tabelul 7 pentru care construim o reprezentare în batoane.

Fig. 2Dacă punctele obţinute la capetele segmentelor (a batoanelor) se unesc, se obţine un poligon

numit poligonul frecvenţelor (absolute).

Fig.3

16

Tensiune Nr.de aprinzătoare

122-124 4125-127 5128-130 10

… …… …

146-148 5Total 100

Page 17: Curs Cercetare

Modificăm tabelul 7, înlocuind frecvenţele absolute cu frecvenţele relative.

Tab.11Nota 1 2 3 4 5 6 7 8 9 10Frecvenţa relativă

0 0 0.062 0.156

Temă:Completaţi tabelul 11 cu frecvenţele relative care nu au fost calculate. Reprezentaţi grafic

seria statistică din tabelul 11.

Indicaţie:

Frecvenţa relativă se calculează cu formula . Pe axa verticală (0y) se ia o unitate de

măsură suficient de mare pentru a putea reprezenta frecvenţa relativă într-o manieră acceptabilă

3.4. Valori caracteristice ale unei serii statistice

Fie seria statistică unde xi reprezintă valorile caracteristice, iar ni

frecvenţele corespunzătoare.

Numărul se numeşte media aritmetică. Suma =

N

Exemplu:

Informaţiile din tabelul 7 se transcriu astfel: . Media

aritmetică este

Observaţii:Media aritmetică nu ne poate da în orice condiţii informaţii utile privind starea în care se

găseşte populaţia studiată. Uneori reprezentativitatea mediei este pusă la îndoială. Admitem, de exemplu, că un elev a primit la o materie o notă de 2 şi una de 8 (media 5). Ce-mi spune această medie? Dacă am renunţa la informaţia furnizată de ea am putea crede că elevul este slab pregătit (nota 2) şi că nota 8 a fost un accident sau invers. Singura măsură corectă ar fi ca elevul să fie în continuare ţinut sub observaţie, pentru a vedea care este nivelul său real de pregătire.

Problema reprezentativităţii mediei se poate rezolva fie prin înlăturarea notelor extreme, fie prin gruparea notelor în clase omogene, fie prin calcularea coeficientului de variabilitate (vezi paragraful următor). În toate situaţiile, o judecată pripită, făcută în baza mediei, ar putea duce la concluzii greşite.

Admitem, de exemplu că un elev a înregistrat la o anumită materie notele 1,1,3,3,8,8,10,10,10. Media este 54:9=6

Dacă am neglija cele două note de 1(note extreme, considerând , de exemplu, că au fost obţinute din cauze accidentale) media ar fi 52:7=7,17. dacă am grupa notele în clase omogene {1,1},{3,3},{8,8},{10,10,10} şi am calcula media ca medie a mediei claselor am obţine 1+3+8+10:4=5,5.

17

Page 18: Curs Cercetare

Cu toate metodele de calculare a mediei folosite, dilema reprezentativităţii ei a rămas. O singură concluzie se poate trage: „valoarea” elevului este undeva situată între 5,5 şi 7,17. vom relua problema reprezentativităţii medie, folosind coeficientul de variabilitate.Observaţie:

În cazul seriilor statistice reprezentate pe intervale, valoarea x i din formulă este valoarea centrală a intervalului.

Dispersia se calculează pentru o serie statistică cu formula:

. Mărimea se numeşte abatere medie pătratică.

Se numeşte modul sau moda (se notează Mo) unei serii statistice valoarea caracteristicii căreia îi corespunde cea mai mare frecvenţă.

În situaţia în care caracteristica are valorile grupate pe intervale, modul este valoarea centrală a intervalului căreia îi corespunde cea mai mare frecvenţă.

Se numeşte mediană (notată Me) a unei serii statistice, valoarea caracteristicii care împarte populaţia în două părţi egale.

Exemple:Reluăm repartiţia din tabelul 7. Mo=7 deoarece nota 7 corespunde celei mai mari frecvenţe

(9).Pentru a înţelege modul în care se determină Me, scriem toate cele 32 de note astfel:

16 note  e 16 note

3 4 4 5 5 5 5 5 6 6 7 7 7 7 7 7

7 7 7 8 8 8 8 8 8 8 9 9 9 9 10 10

1 2note 5note 2note 9note 8note 4note 2note

Împărţind numărul total al elevilor la 2 obţinem 16, deci Me=7.

Pentru o serie statistică (a notelor, de exemplu) cu un număr impar de elemente:3,3,4,4,5,7,9,9,10 (total 9), Me este 5 (50% din note se află în stânga valorii 5, 50%

la dreapta).Uneori în cazul unui număr par de indivizi, Me se calculează ca o medie aritmetică a doi

termeni vecini astfel: 3,4,4,5,7,9,9,10 (total 8), .

Amplitudinea variaţiei sau împrăştierii (A) este diferenţa dintre ce mai mare şi cea mai mică valoare înregistrată . Media ( ), mediana (Me) şi modul (Mo) se numesc indici ai tendinţei central. Dispersia (σ2), abaterea medie pătratică (σ) şi amplitudinea se numesc indici ai variabilităţii sau ai abaterii de la tendinţa centrală.

3.5. Interpretarea datelor statistice

Fenomenele de masă pe care le studiază statistica sunt influenţate de o serie complexă de factori.

Tendinţa ce se manifestă la nivelul populaţiei statistice, informaţie care interesează în mod deosebit pe cercetător, este reflectată sintetic de medie, mediană, modul etc. cu condiţia ca aceşti indicatori să fie reprezentativi şi stabili.

Valoarea medie, de exemplu, aşa cu am mai spus, nu este întotdeauna reprezentativă. Reprezentativitatea creşte în situaţia în care datele folosite sunt omogene. Se impune deci verificarea gradului de omogenitate a datelor. Această verificare se face prin măsurarea şi analiza împrăştierii şi concentrării faţă de valorile centrale.

18

Page 19: Curs Cercetare

Noţiunea de împrăştiere, variaţie sau dispersare se leagă de o valoare centrală.De exemplu, în cazul următoarelor două populaţii statistice, înregistrate prin valorile

caracteristicii1) şi 2) se observă următoarele:- media şi mediana sunt egale- seria a doua este mai omogenă (împrăştierea este mai mică faţă de valorile centrale)

Informaţiile furnizate de valorile centrale sunt deci mai de încredere pentru seria 2.

Înainte de a da recomandări ce pot fi urmate în cazul unor serii statistice neomogene, pentru care putem culege informaţii despre tendinţele de dezvoltare ale fenomenelor cu probabilitate destul de mică , să mai prezentăm o modalitate prin care putem admite sau respinge reprezentativitatea mediei.

Coeficientul se numeşte coeficient de omogenitate sau de variaţie

(variabilitate). Coeficientul de variaţie permite comparea variabilităţii, iar valorile sale sunt situate între 0 şi 100. Astfel, cu cât valorile sunt mai apropiate de 0, cu atât seria este mai omogenă. Practic s-a stabilit că dacă CV este mai mare ca 35% colectivitatea este eterogenă.

Calculul şi analiza indicatorilor împrăştierii în jurul tendinţei centrale este util pentru cunoaşterea fenomenelor de masă şi a tendinţei centrale, atât în cercetare cât şi în economie sau societate.

Aplicaţie:Revenim asupra seriei statistice cu valorile pentru calcularea

coeficientului de variabilitate.Am stabilit că media =6Calculăm dispersia σ2 apoi abaterea medie pătratică σ.

CV fiind mai mare ca 35%, colectivitatea este eterogenă, deci media aritmetică nu este reprezentativă.

De un real folos în studierea unui fenomen statistic sunt studiile referitoare la caracterizarea asimetriei şi aplatizării curbei frecvenţelor.

Pe scurt, lucrurile se prezintă astfel: fenomenele normale (majoritatea) au repartiţia reprezentată prin curba (clopotul) lui Gauss (fig. 4)

Fig.4

În această situaţie Mo, Me şi se confundă.

O repartiţie asimetrică (oblică) poate avea una din următoarele reprezentări:

19

Page 20: Curs Cercetare

Fig. 5 Fig. 6

Fig. 5, de exemplu, spune că majoritatea indivizilor au rezultate sub medie ( ) şi mai precis, mai mult de jumătate din indivizi au rezultate sub medie ( ).

Temă:Interpretaţi graficul din fig. 6

Reprezentarea grafică a seriilor statistice nu este un demers uşor de realizat. Asimetria distribuţiilor statistice este dată (prin calcul, nu grafic) de coeficienţii lui Yule şi Kendall şi de cei ai lui Pearson sau Fischer (vezi Isaia-Maniu Alexandru şi colab., 2004, Statistică).

O distribuţie este aplatizată dacă o mare variaţie a valorilor caracteristicii are drept consecinţă o mică variaţie a frecvenţelor sau invers.

Indicatorii de exces sau kurtois (Kurtos=cocoşat, Platys=larg, Leptos=îngust în limba greacă) se pot observa în figurile 7,8,9.

Leptokurtică Mezokurtică

Fig. 8

Fig. 7 Platikurtică

Fig. 9Aplatizarea (boltirea) se poate determina folosind graficele sau prin calcularea unor

coeficienţi (coeficienţii lui Pearson sau a lui Fisher).

20

Page 21: Curs Cercetare

Analizele făcute până aici, au presupus studiul unei singure variabile, cu precizarea că aceasta este unimodală (Mo este unic), fapt care, nu întotdeauna concordă cu realitatea.

În plus, într-o cercetare pot apărea mai multe variabile.Considerăm variabila X şi variabila Y. Valorile variabilei X au fost sistematizate pe k

intervale, iar cele ale variabilei Y pe p intervale.xij reprezintă valoarea xi a variabile X ce se găseşte în intervalul i dar se găseşte şi în

intervalul j al variabilei Y. Evident i ia valori de la 1 la k iar j de la 1 la p.Se notează cu nij numărul indivizilor la care s-a înregistrat valoarea xij.Acest mod de organizare a datelor va fi folosit în paragraful următor.

3.6. Regresie şi corelaţie statistică

Este uşor de observat că în practică, întâlnim variabile ce se influenţează reciproc. De exemplu lungimea trunchiului şi lungimea picioarelor influenţează statura umană.

Măsurătorile brute pentru o populaţie adultă de bărbaţi din comuna Giuleşti, jud. Maramureş formată din 93 de indivizi au fost trecute în două table cu dublă intrare, după sistemul descris în ultima parte a paragrafului precedent. S-au obţinut următoarele rezultate (exemplu adaptat după Reischer C., Sâmboau A, 1972):

Tab.12

Statura cmTrunchicm

153 156 159 162 165 168 171 174 177 180 Total

43 2 2 x 2 1 1 x x x x 846 1 4 10 9 9 3 2 x x 1 3949 x x 5 6 8 12 4 3 1 x 3952 x x x 1 1 x 2 2 x 1 7

Total 3 6 15 18 19 16 8 5 1 2 93

Tabelul 12 se citeşte astfel: 2 indivizi au lungime trunchiului de 43 cm şi statura 153 cm, 9 indivizi au lungimea trunchiului de 46 cm şi statura de 162 cm, un individ are lungimea trunchiului de 52 cm şi statura de 180 cm etc.

Tab.13

Statura cmPicioarecm

153 156 159 162 165 168 171 174 177 180 Total

71 2 2 3 2 x x x x x x 974 1 1 9 7 2 1 x x x x 2177 x 2 3 7 13 2 x x x x 2780 x 1 x 2 4 11 4 x x x 2283 x x x x x 1 4 3 x x 886 x x x x x 1 x 2 1 2 6

Total 3 6 15 18 19 16 8 5 1 2 93

În practică, după cum am mai arătat, unele variabile evoluează dependent de alte variabile.Dacă notăm cu y o caracteristică dependentă şi cu x cea independentă relaţia între x şi y este

y=f(x)(legătură simplă).În situaţia în care variabilele independente sunt mai multe x1,x2,….xn, relaţia de dependenţă

se scrie y=f(x1,x2,….xn) (legătură multiplă).Dependenţa variabilelor poate fi directă (dacă x creşte, y creşte sau dacă x scade, y scade),

indirectă (dacă x creşte, y scade sau dacă x scade, y creşte), dar poate fi şi liniară (funcţia f amintită

21

Page 22: Curs Cercetare

mai sus este de tip liniar) sau neliniară (funcţia f este neliniară, exponenţială, de tip parabolă, hiperbolă etc.).

Regresia exprimă modalitatea în care o variabilă(sau mai multe) influenţează altă variabilă şi se exprimă în formă analitică.

Corelaţia exprimă gradul în care o variabilă (sau mai multe) influenţează alte variabile.Studiul regresiei şi corelaţiei este foarte important în cercetare (şi nu numai) deoarece,

cercetătorul, studiind variaţia variabilei independente poate să prognozeze variaţia variabilei dependente.

Câteva metode elementare de caracterizare a corelaţiei

1) Metodele tabelelor de corelaţie.Tabelul de corelaţie este un tabel cu dublă intrare care conţine gruparea unităţilor statistice

după cele două variabile (vezi tab. 12,13), din care una este independentă.Dacă frecvenţele se concentrează în jurul diagonalei principale (stânga sus - dreapta jos)

atunci legătura este directă (ca în cazul tab. 12,13). Dacă frecvenţele se concentrează în jurul diagonalei secundare (stânga jos – dreapta sus), legătura este inversă.

Dacă frecvenţele sunt distribuite astfel încât nu dovedesc nici o concentrare după diagonale, legătura între variabile lipseşte.

2) Metoda seriilor paralele interdependenteÎntr-un sistem de axe se reprezintă toate punctele de coordonate (x,y), unde x este o valoare

a variabilei independente, iar y o valoare a variabilei dependente.Dacă punctele se situează la întâmplare (putem considera că ele se grupează în jurul unei

drepte paralele cu 0x), între cele două variabile nu există legături semnificative.Dacă punctele se situează în jurul unei drepte care nu este paralelă cu 0x, atunci între

variabile există o legătură. Mai exact, dacă dreapta în jurul căreia se situează punctele este crescătoare, legătura este directă. În caz contrar legătura este inversă. Pentru exemplificare folosim tabela 12, din care citim coordonatele punctelor. Ele sunt:

(43,153) (43,156) (43,162) (43,165) (43,168) (46,153) (46,156) (46,159) (46,162) (46,165) (46,168) (46,171) (46,180) (49,159) (49,162) (49,165) (49,168) (49,171) (49,174) (49,177) (52,162) (52,165) (52,171) (52,174) (52,180)

Observaţie: La scrierea coordonatelor punctelor nu ţinem cont de frecvenţă.Temă:

1. Reprezentaţi grafic punctele a căror coordonate au fost scrise, din tab.12 alegând convenabil unităţile de măsură pe axe.

2. Folosind tab.13 faceţi reprezentarea grafică după modelul anterior.Observaţie:

Atât în situaţia tab.12 cât şi a tab.13, „norul” de puncte reprezentat grafic se dispune aproximativ după o dreaptă crescătoare. Ajungem la aceeaşi concluzie ca în cazul în care am aplicat metoda tabelului de corelaţie.

Metoda seriilor paraleleSe ordonează valorile variabilei X (crescător sau descrescător). În paralel se ordonează

valorile corespunzătoare ale variabilei Y. Dacă variabila Y se ordonează (aproximativ) în acelaşi mod în care s-a ordonat X (crescător sau descrescător), atunci între X şi Y există legătură directă, dacă X şi Y sunt ordonate invers, (una crescătoare, alta descrescătoare) între variabile există o legătură inversă.

Dacă variabila Y nu manifestă o tendinţă de ordonare între X şi Y nu există legătură.Pentru exemplificare folosim informaţiile furnizate de tab.13:

Tab.14

22

Page 23: Curs Cercetare

În coloana lui Y pentru fiecare valoare a lui X am scris valorile extreme pe care le ia Y. Cele două coloane dovedesc că X şi Y se află în legătură directă.

Temă:Folosind datele din tab.12 şi metoda seriilor paralele, studiaţi relaţia dintre cele două

variabile.

În situaţia în care datele supuse prelucrării statistice sunt numeroase, metodele elementare pe care le-am prezentat nu pot fi aplicate.

Vom explica, în cele ce urmează, cum putem determina, folosind coeficientul de corelaţie şi raportul de corelaţie legătura dintre două variabile.

Pentru început să ne imaginăm că cele două variabile au fost reprezentate prin puncte.„Norul” de puncte poate fi aproximat printr-o dreaptă paralelă sau nu cu axa 0x. Ecuaţia

acestei drepte este y=ax+b. Se pune problema determinării coeficienţilor a şi b. O metodă simplă, dar nu întotdeauna aplicabilă, este metoda centrelor de greutate. Dacă „norul” este format de 6 puncte necoliniare, atunci coordonatele centrului de greutate al unui prim triunghi format din 3 puncte poate fi determinat. La fel şi centrul de greutate a celui de-al doilea triunghi. Dreapta căutată este dreapta ce trece prin cele centre de greutate şi coeficienţii a şi b se pot afla.

În cazul în care „norul” de puncte este numeros se poate folosi metoda celor mai mici pătrate. Aceasta constă în exprimarea diferenţei dintre yi, ordonata punctului Ai (xi,yi) al norului şi ordonata punctului de abscisă xi situat pe dreapta y=ax+b, astfel:

di=yi-(axi+b)Pentru determinarea coeficienţilor a şi b se pune condiţia ca S=Σdi

2 să fie minimă.După efectuarea calculelor se obţine:

şi

unde A=Σxi2, B=Σxi, C=N, D=-Σxiyi, E=-Σyi iar F=Σyi

2

Dependenţa a două variabile poate fi apreciată cu ajutorul măririi abaterii valorilor empirice de tipul y, faţă de linia de regresie, adică, faţă de valorile teoretice (cele determinate de funcţia de regresie) de tipul y*.

În cele ce urmează, vom aborda corelaţia liniară simplă.Există două situaţii extreme:

1) panta dreptei de regresie este 0 (b=0), atunci variabilele nu sunt în legătură. 2) punctele corelogramei (reprezentare grafică) se găsesc pe dreapta de regresie,

deci valorile empirice de tip y coincid cu cele estimate de tip y*. în această situaţie corelaţia este perfectă

3) situaţia intermediară este prezentată în fig.10

23

X Y71 153-16274 153-16877 156-16880 156-17183 168-17486 168-180

Page 24: Curs Cercetare

P(x,y) este un punct al corelogrameiQ(x, ) S(x,y*)y* se calculează ca valoare a funcţiei y=ax+b în abscisa x a punctului P. Din acest motiv vom nota yx

*. Se observă că:PQ=y- şi reprezintă variaţia totală a lui y faţă de media sa .PS= y- yx

* şi reprezintă variaţia neexplicată de regresie.SQ= yx

* - şi reprezintă variaţia explicată de regresie.

Calculele conduc la formula raportului de corelaţie R

şi la formula coeficientului de corelaţie rxy

Observaţii:1. iar . Valorile negative pe care le poate lua rxy semnifică că legătura

între variabile este o legătură inversă. Corelaţia este cu atât mai puternică cu cât rxy este mai aproape de 1.

2. Coeficientul de corelaţie nu necesită determinarea, în prealabil, a funcţiei de regresie (care se determină în cazul raportului de corelaţie)

3. Coeficientul de corelaţie se calculează doar în cazul legăturilor liniare.4. Raportul de corelaţie se poate calcula în cazul oricărui tip de legătură. În situaţia legăturii

liniare R=rxy.

Dacă cei doi indicatori nu sunt egali, legătura nu este liniară şi se poate folosi doar raportul de corelaţie pentru care se impune determinarea funcţiei de corelaţie.

În practică, rezolvarea acestor probleme este simplificată, de utilizarea tehnicii de calcul.

BIBLIOGRAFIE

24

Page 25: Curs Cercetare

Andrei, T , 1995,Statistică. Teorie şi aplicaţii Ed. ALL BucureştiCucoş, Constantin, 2001, Pedagogia, Polirom, IaşiDrăgan ,I ,Nicola, I , 1995, Cercetarea psihopedagică,Ed. Tipomur, Tg. MureşEnăchescu, C, 2005,Tratat de teoria cercetării, Ed. Polirom,IaşiIsac-Maniu, A,Mituţ , C,2004, Statistica Ed. Universitară , BucureştiMoscovici, S, Buschini ,F, (coord.) 2007 ,Metodologia ştiinţelor socioumane, Ed. Polirom,IaşiKing ,R ,2005, Strategia cercetării ,Ed. Polirom,IaşiSilverman ,D ,Interpretarea datelor calitative , Ed. Polirom,Iaşi

25