Biblioteca de manuale digitale de biostatistică
Vrem să testăm eficiența unei diete speciale cu un experiment autocontrolat. Greutatea corporală a fiecărui subiect a fost măsurată înainte și după dietă. Rezultatul experimentului ipotetic la 10 subiecți experimentali este prezentat în Figura 8.1. prezentată în tabel.
8.1. Tabel - Date dintr-un experiment dietetic
2. | 95 | 90 | 5 |
3. | 75 | 72 | 3 |
4. | 110 | 100 | 10 |
5. | 81 | 75 | 6 |
6. | 92 | 88 | 4 |
7. | 83 | 83 | 0 |
8. | 94 | 93 | 1 |
9. | 88 | 82 | 6 |
10. | 105 | 99 | 6 |
In medie | 90,8 | 86,8 | 4 |
SD | 10,79 | 9.25 | 3,333 |
Metoda parametrică - test t asociat
Metodele parametrice presupun că datele noastre provin dintr-o populație distribuită în mod normal. Compararea a două distribuții normale înseamnă compararea mediilor și abaterilor standard, pentru aceleași abateri standard trebuie comparate doar mijloacele. Testele parametrice care compară cele două grupuri (teste t) examinează schimbarea medie, ipoteza lor nulă este că media celor două populații studiate este aceeași (1 = 2). În cazul experimentelor autocontrolate, luând diferența dintre perechile de date, obținem un singur set de date, condiția normalității se aplică acestui set de date de diferență. Metoda se numește test t în perechi sau denumire mai veche, test cu o singură probă pentru diferență. Metoda a fost descrisă în detaliu în capitolul anterior, aici o vom rezuma doar pe scurt.
Conform ipotezei nule, media diferenței de populație este zero (? Diferență = 0), conform ipotezei alternative, este diferită de zero (? Diferență0). Testul poate fi efectuat folosind un interval de încredere dat pentru media diferenței: dacă 0 se încadrează în intervalul de încredere, abaterea este nesemnificativă la un nivel dat, dacă în afara acesteia, abaterea este semnificativă. Cu toate acestea, determinarea semnificației statistice este examinată cel mai adesea folosind cantitatea notată cu t formată din media eșantionului de diferență, care depinde chiar de numărul de itemi și de abaterea standard a diferenței:
media diferențelor, sd este abaterea standard a diferențelor.
Se poate arăta că dacă condiția normalității este satisfăcută și ipoteza nulă este adevărată, atunci cantitatea de mai sus urmează distribuția t a lui Student cu n -1 grade de libertate. Dacă într-adevăr nu există nicio diferență între cele două grupuri de comparat, atunci a
și astfel t va fi, de asemenea, mic, aproape de zero. În plus față de nivelul de semnificație și gradul de libertate dat din tabelul distribuției t, este posibil să se determine limita până la care valoarea t este „acceptabil de mică”, așa-numita valoare t critică (t, n-1). Dacă valoarea absolută a valorii t pe care o calculăm este mai mare decât valoarea critică,
, apoi decidem asupra ipotezei alternative, adică respingem ipoteza nulă și spunem că diferența este la un nivel semnificativ, notat de ex. Dacă
, apoi ne hotărâm asupra ipotezei nule și spunem că diferența nu este semnificativă, pg.
Astăzi, în loc să extragem valorile critice dintr-un tabel, așa-numitul Valoarea p este utilizată pentru decizie, deoarece este calculată de majoritatea sistemelor statistice. Decidem apoi comparând valoarea p cu. Valoarea p este probabilitatea ca dacă ipoteza nulă este adevărată, atunci obținem cel puțin valoarea t cu valoarea absolută obținută sau chiar mai mare.
Test t asociat pentru o ipoteză alternativă unilaterală. Dacă, spre deosebire de ipoteza nulă, examinăm doar dacă schimbarea este pozitivă (sau, în cazul unei alte probleme, negativă), atunci valoarea critică este căutată la o margine a distribuției t, deci (t2, n -1), iar valoarea p va fi jumătate din valoarea p față-verso. Rar folosim un test unilateral, deoarece ipotezele sunt stabilite înainte de efectuarea experimentului, atunci când de cele mai multe ori nu cunoaștem direcția schimbării.
Rezolvarea problemei de exemplu cu un test t egal
H0: = 0 (diferența de populație medie 0)
Dacă: 0 (diferența medie a populației diferă de 0, ipoteză alternativă pe două fețe)
, gradul de libertate este df = 10-1 = 9, valoarea critică este t0.05.9 = 2.262. Din moment ce 3.795g2.262, respingem ipoteza nulă și spunem că diferența este semnificativă la nivelul de 5%.
Folosind un program statistic pentru cel de-al 9-lea grad de libertate, valoarea p-bilaterală pentru t = 3.795 este p = 0.00425, cu mult mai mică decât 0.05, deci diferența este la fel de semnificativă. THE
8.1. Figura 1 prezintă distribuția t, valoarea critică și valoarea p (zona neagră) corespunzătoare datelor din exemplu.
În cazul unei ipoteze alternative unilaterale, examinăm doar dacă greutatea corporală a scăzut, adică dacă diferența medie care indică schimbarea este pozitivă în populație. Apoi, la un nivel de semnificație de 5%, valoarea t critică este t0.1.9 = 1.66 și, comparativ cu 3.795, obținem că efectul este semnificativ. Valoarea p unilaterală este p = 0,002125. În figură, valoarea p față-verso este dimensiunea celor două mici zone negre împreună la cele două margini ale distribuției.
Testul pe două fețe poate fi efectuat și pe baza unui interval de încredere de 95%. Pentru a calcula intervalul, utilizați aceeași valoare t critică în tabel, adică adăugați și scădeți
cantitate. Cele două puncte finale ale intervalului sunt 4 2.384, deci intervalul de încredere de 95% pentru media diferenței (1.616, 6.384). Probabilitatea ca populația medie caracteristică pierderii în greutate medie să se încadreze în acest interval este de 95%. Cu toate acestea, intervalul nu include media „0” conform ipotezei nule. Prin urmare, decidem că abaterea este semnificativă la nivelul de 5%. Rețineți că intervalul de încredere, pe lângă faptul că este utilizat pentru luarea deciziilor, este utilizat în principal pentru a estima magnitudinea „efectului”.
Metode neparametrice, testul semnelor, testul Wilcoxon al rangului semnelor
În cazul metodelor neparametrice, distribuția diferenței perechilor de date nu se presupune a fi normalitatea distribuției, deoarece fie nu o putem verifica, fie nu are rost să o verificăm, de ex. evident înclinat sau pentru un număr mic de probe sau pentru date ordinale.
În această secțiune, prezentăm metode nonparametrice bazate pe enumerare, în cazul unui experiment autocontrol, un astfel de test este testul semnului și testul rangului semnului Wilcoxon. Ipoteza nulă a ambelor este că distribuția celor două populații este aceeași.
Pentru a efectua testul semnelor (vezi secțiunea anterioară), formăm mai întâi diferența dintre cele două eșantioane și apoi numărăm numărul diferențelor negative și pozitive (omiterea zerourilor). Dacă cele două variabile originale au aceeași distribuție, obținem aproximativ același număr de diferențe negative și pozitive. Există un tabel statistic pentru test, în care puteți găsi numărul de elemente eșantion și câte diferențe pot fi considerate semnificative (acesta se calculează pe baza distribuției binomiale). În cazul unui număr mare de elemente eșantion (g30), se poate utiliza formula pentru care tabelul distribuției normale poate fi deja utilizat pentru a găsi valoarea p. Datorită simplității sale, testul semnului este de obicei utilizat pentru referință rapidă.
Testul de rang semnat Wilcoxon ia în considerare nu numai semnele, ci și ordinele de mărime ale diferențelor, deci este mai puternic decât testul semnelor. Spre deosebire de testul semnelor, condiția pentru acest test este ca distribuția diferenței să fie simetrică. Implementarea sa este după cum urmează: clasificăm diferențele dintre elementele eșantionului indiferent de semne, omițând orice zerouri.
Clasamentul se face după cum urmează: seriile de date sunt sortate după mărime, iar cel mai mic este clasat pe locul 1, următorul este clasat pe locul 2 și așa mai departe. Atribuim un total de n grade. Chiar și în cazul datelor egale, acordăm un rang crescător, iar apoi rangurile aparținând datelor egale sunt corectate ulterior cu media rangurilor corespunzătoare (rangurile corectate se numesc ranguri legate). Corectitudinea clasamentului poate fi verificată prin adăugarea clasamentelor obținute, această sumă trebuie să fie egală cu n (n + 1)/2 (suma primului număr întreg "n").
În timpul testului, adăugăm apoi clasamentele pentru diferențele pozitive sau negative separat (de fapt, doar una este suficientă). Dacă ipoteza nulă este adevărată și cele două populații sunt distribuite în mod egal, atunci sumele de rang pentru diferențele pozitive și negative vor fi aproximativ aceleași. Cu cât diferența dintre una dintre cele două populații este mai mare, cu atât este mai mare diferența dintre cele două sume de rang. Câtă diferență mai putem considera că este aleatorie? Pentru un număr mic de elemente eșantion (nl30 sau nl50), sunt disponibile tabele care dau intervalul pentru care suma rangului poate fi considerată în continuare o abatere aleatorie. În cazul unui număr mare de elemente eșantion, sau dacă există un număr mare de ranguri legate, semnificația poate fi examinată pe baza distribuției normale utilizând o statistică distribuită aproximativ normal:
Aici, numărătorul conține suma tuturor clasamentelor semnate, iar numitorul este rădăcina pătrată scăzută din suma lor de pătrate. Sistemele de programe de calculator calculează de obicei această valoare p numai din aproximarea normală, chiar și pentru un număr mic de elemente eșantion, atunci când aproximarea nu este foarte bună.
Evaluați exemplul de activitate cu un test de rang semnat
Clasarea diferențelor se face la valoarea absolută a diferențelor (adică, indiferent de semn). Cel mai mic număr este 1, obține rangul 1. Deoarece există două 1 între diferențe, acordăm celui de-al doilea 1 un rang de 2 mai întâi, iar apoi îl ajustăm în coloana „ranguri legate” dând ambele un rang de 1,5 (media 1 și 2). Facem același lucru cu cele trei 6s.
8.2. Tabelul 8.1 - Efectuați testul de rang semnat pe datele din Tabelul 8.1.
2. | 5 | 5 | 5 | 5 | 25 |
3. | 3 | 3 | 3 | 3 | 9 |
4. | 10 | 9 | 9 | 9 | 81 |
5. | 6 | 6 | 7 | 7 | 49 |
6. | 4 | 4 | 4 | 4 | 16 |
7. | 0 | 0 | |||
8. | 1 | 2 | 1.5 | 1.5 | 2.25 |
9. | 6 | 7 | 7 | 7 | 49 |
10. | 6 | 8 | 7 | 7 | 49 |
Cantitate | 42 | 282,5 |
Se adaugă rândurile de semn egal. Suma rangurilor pozitive este R + = 43,5, iar cea a rangurilor negative este R- = 1,5. În tabel, pentru p = 0,05 și n = 9, sumele clasificate în intervalul 5-40 pot fi considerate aleatorii. Ambele sume de rang se află în afara acestui interval, deci obținem o diferență semnificativă la nivelul de 5%. Numărul de elemente este acum mic și există doar 1 rang conectat, totuși calculați valoarea z cu formula (8.2): z = 42/282,5 = 2.499. Valoarea p corespunzătoare din distribuția normală standard este p = 0,012. Astfel, schimbarea este semnificativă și la nivelul de 5% pe baza metodei neparametrice.
- Éva Forgách - Miracle Pot - Dietă și carte de rețete pentru pacienții cu cancer care doresc să recupereze Extreme Digital
- Ellie Herman - Pilates Extreme Digital
- DOIY 30 Day Fitness Challenge, hârtie în limba engleză Extreme Digital
- BioTech SUA, Brutal Muscle ON, 2270 g, proteine, aromă de afine și iaurt Extreme Digital
- Dolph Lundgren - Fit Forever Extreme Digital