Documente noi - cercetari, esee, comentariu, compunere, document
Referate categorii

Erori statistice

Erori statistice

Este evident pentru oricine faptul ca nu putem accepta concluzia la studiul anterior, cel cu privire la „puterea mediumului”, ca fiind una absolut si definitiv adevarata. Ea este doar una justificata in conformitate cu o anumita conventie (regula) decizionala care se bazeaza pe fixarea unui prag minim pentru p (in cazul dat, 0.05). Ipoteza de nul este astfel formulata incat nu poate fi decat adevarata sau falsa. De aici, consecinta este ca ea nu poate fi decat acceptata sau respinsa. Daca plasam intr-o structura tabelara relatiile dintre ipoteza de nul si adevarul vietii (ceea ce este adevarat in realitate), atunci avem doar patru situatii posibile:

Adevarul vietii

mediumul nu are „putere”

(ipoteza de nul este adevarata)

mediumul are „putere”

(ipozeza de nul este falsa)

Decizia

Statistica

acceptarea

ipotezei de nul

decizie corecta

p=1-alfa

Eroare de tip II

p=beta

respingerea

ipotezei de nul

Eroare de tip I

p=alfa

decizie corecta

p=1-beta

Rezulta ca, daca raportam adevarul vietii la decizia statistica, fiecare avand doar posibilitatea de a fi adevarata sau falsa, ne aflam in situatia de a decide gresit sau corect.

Situatiile in care putem gresi sunt urmatoarele:

a)     Respingem ipoteza de nul desi, in realitate, ea este adevarata.

Pentru a intelege mai bine despre ce este vorba, sa ne raportam la exemplul nostru. Mediumul i-ar fi putut selectionat pe cei mai inteligenti subiecti pur si simplu pentru ca avut noroc. Sau, pentru ca baza de selectie a esantionului a constat in subiecti mai inteligenti decat media, fapt care poate fi direct imputat cercetatorului. Nu putem fi siguri ca cei oferiti selectiei nu au fost, dintr-un motiv oarecare, mai inteligenti decat media, astfel incat mediumul nu trebuia neaparat sa dispuna de o putere speciala pentru a selecta un esantion cu inteligenta peste medie. In acest caz se poate spune ca, desi am procedat justificat in raport cu criteriul de decizie statistica, am gresit in raport cu puterea reala a mediumului (adevarul vietii). In statistica aceasta eroare este denumita eroare de tip I, iar probabilitatea de a o comite este egala cu valoarea asumata pentru alfa. 

b)     Acceptam ipoteza de nul desi, in realitate, ea este falsa.

Aceasta situatie este posibila daca, de exemplu, am pus la dispozitia mediumului, ca baza de selectie, subiecti mai putin inteligenti decat media. Intr-un astfel de caz, media esantionului poate fi mai mica decat media populatiei fara ca acest fapt sa probeze in vreun lipsa de putere a mediumului. In statistica aceasta eroare este definita ca eroare de tip II, iar probabilitatea de a o comite este simbolizata cu beta.

Aspectul critic al problemei celor doua tipuri de eroare este faptul ca ele coexista si evolueaza simultan, dar in directii opuse. Nimic nu ne impiedica sa alegem un nivel alfa oricat de mic, pentru a reduce eroarea de tip I dar, in acest fel, nu facem decat sa crestem corespunzator riscul erorii de tip II. Cu cat punem in fata mediumului un prag mai greu de atins (niveluri mici ale lui alfa), cu atat riscam mai putin sa ii recunoastem „puterea” atunci cand nu o are dar, in acelasi timp, riscam mai mult sa nu i-o recunoastem, desi o are. Invers, daca suntem mai putin exigenti cu decizia statistica (alfa mai mare) riscam mai mult sa ii recunoastem o „putere” pe care, de fapt, nu o are, dar scade riscul de a gresi nerecunoscand o calitate de care dispune.

Cu alte cuvinte, in timp ce eroarea de tip I este o concluzie fals pozitiva, eroarea de tip II este una fals negativa. Nu este greu de observat faptul ca cele doua erori afecteaza in mod diferit factorii implicati in studiu. In timp ce din punctul de vedere al societatii este important mai ales sa nu fie admise concluzii si teorii false, cercetatorul este interesat sa nu riste neconfirmarea, din greseala, a unei teorii adevarate. Desigur, sustinem aceste afirmatii in limitele demonstratiei didactice, fiindca nu este de loc sigur ca cele doua categorii de interese sunt absolut disjuncte.

Dar sa continuam cu analiza celorlalte celule ale tabelului de mai sus. La randul lor, situatiile in care decidem corect sunt urmatoarele:

a)     Acceptam ipoteza de nul ea fiind intr-adevar adevarata (nu recunoastem calitatea mediumului atunci cand de fapt nici nu o are).

Acesta este cazul in care decidem ca mediumul nu are „puterea” pe care o reclama, fapt care este adevarat si in realitate. Cu alte cuvinte, cercetatorul refuza sa admita existenta unei relatii care nu exista nici in realitate. Probabilitatea asociata acestui tip de decizie corecta este 1-alfa.

b)     Respingem ipoteza de nul, ea fiind intr-adevar falsa (recunoastem calitatea mediumului atunci cand o are).

Ne aflam in aceasta situatie atunci cand respingem calitatea asumata de medium, de care acesta, cu adevarat nu dispune. Probabilitatea acestei erori este notata cu 1-beta. Ea are o semnificatie aparte, fiind cunoscuta si ca „puterea testului statistic” deoarece se refera la situatia in care cercetarea admite existenta unei relatii dintre variabile atunci cand relatia exista cu adevarat.

In mod obisnuit, conventia deciziei statistice pune accentul pe limitarea riscului de eroare de tip I (prin impunerea unui nivel minim pentru alfa). Dar cercetatorul nu trebuie sa uite atat de eroarea de tip II cat si de „puterea testului”, a carui nivel, in mod dezirabil, ar trebui cat mai mare.

TEMA PENTRU ACASA


La evaluarea partiala indicatorii statistici descriptivi pentru scorul intregului an sunt:


μ=22.8

σ=3.91

N=192


Iar pentru fiecare dintre grupe:

GR.

m

s

N

1

18.36

5.45

28

2

19.21

4.09

19

3

18.92

4.70

26

4

19.45

4.17

22

5

18.88

4.28

26

6

19.13

4.68

23

7

19.09

4.44

22



Folosind aceste date, calculati:

scorul z personal, raportat

o       la grupa din care faceti parte

o       la intregul an

care este procentul valorilor mai bune decat scorul personal obtinut, prin raportare la curba normala?

scorul z al grupei din care faceti parte, raportat la intregul an

care este procentul valorilor care se plaseaza pe curba normala peste scorul obtinut de grupa din care faceti parte?

Calculati limitele de incredere pentru media grupei din care faceti parte pentru estimarea mediei intregului an, pentru z critic=1.85