Statističko testiranje učinkovitosti lijeka protiv COVID-19
Studentov T-test.Testiranje hipoteze
Šta je Studentov T-test?
Najčešće upotrebljavan parametrijski test značajnosti za testiranje nulte hipoteze je Studentov T-test. Koristi se za testiranje značajnosti razlika između dvije aritmetičke sredine. Primjena T-testa podrazumjeva da su obje varijable koje se testiraju numeričke te da je veličina uzorka manja od 30 jedinica uz uslov da je raspored normalan ili bar simetričan.
William Sealy Gosset
Engleski statističar (1876-1937) poznat kao "Student". Nakon diplomiranja 1899. godine počinje raditi u pivovari Arthur Guinness & Son. Guinness je bila progresivna agro-hemijska kompanija u kojoj je Gosset primjenjivao svoje statističko znanje i u pivari i u poljoprivredi kako bi odabrao najbolju sortu ječma za proizvodnju piva. Obzirom da je kompanija Guinness imala poprilično striktan odnos kada je u pitanju otkrivanje poslovnih tajnih u pogledu statitičkih analiza, Gosset je svoj naučni rad T-distribucija objavio pod pseudonimom "Studentova -T distribucija"...
Tipovi Studentovog T-test ?
T - test razlike između aritmetičke sredine osnovnog skupa i uzorka
T - test razlike između aritmetičke sredine dva mala nezavisna uzorka
T - test razlike između aritmetičke sredine dva mala zavisna uzorka
T - test razlike između aritmetičke sredine dva velika nezavisna uzorka
T - test razlike između aritmetičke sredine dva velika zavisna uzorka
T - test proporcije
Predpostavimo da drugi val epidemije COVID-19 dočekamo sa efektivnim lijekom protiv ove infekcije te da isti testiramo na pacijentima koji su ponovno zaraženi, koji kao takvi nisu stekli trajni imunitet na ovu infekciju.
Dakle, testirat ćemo dvije varijable prosječno vrijeme oporavka (drugi val epidemije) nakon uzimanja lijeka (dani) i prosječno vrijeme oporavka (prvi val epidemije) bez uzimanja lijek (dani). Veličina uzorka tj. broj pacijenata na kojima se vrši testiranje jeste 20.
Koji tipStudentovog T-testaodabrati?
T - test razlike između aritmetičke sredine dva mala zavisna uzorka
Prvi i osnovni korak prilikom utvrđivanja T- testa bilo kojeg tipa jeste postavljanje alternativne hipoteze. Alternativnom hipotezom dokazujemo konstataciju iz narednog pitanja.
Dokazujemo HA:μ1-μ2>μ0
alternativnu hipotezu.
HA: Da li postoji dovoljno dokaza koji upućuju na to da je prosječno vrijeme oporavka veće (duže) nakon uzimanja lijeka nego što je to bilo u prvom valu epidemije kad se pacijent nije tretirao lijekom (nivo značajnosti α=0,05)?
S druge strane, nulta hipoteza H0:μ1-μ2≤μ0 znači da nema razlike između prosječnog vremena oporavka pacijenata prije i posle uzimanja lijeka, te u slučaju da ona ipak postoji, kraće (manje) je vrijeme oporavka nakon što su pacijenti tretirani lijekom.
odlučivanja
koristimo?
Odbaciti H0 ako je t "realizovano" = (xsr - µ0)/(s/(√n)) > tn-1,α tj. p"realizovano" < 0,05 (nivo značajnosti α)

Primjer Studentovog T-test
Nakon postavljanja hipoteza, svodimo dva mala zavisna uzorka na razliku između njih (μ1 - μ2 =Xn) te izračunavamo, aritmetičku sredinu, standardnu devijaciju razlike kada varijansa nije poznata, utvrđujemo stepen slobode, te najzad, t i p vrijednost a sve to u cilju prihvatanja tj. odbacivanja nulte hipoteze.
n | Ponovno zaraženi pacijent | Oporavak uz tretman lijekom (dani) μ1 | Oporavak bez tretmana lijekom (dani) μ2 | Razlika μ1-μ2=Xn |
---|---|---|---|---|
1 | Pacijent A | 47,23 | 50,56 | -3,33 |
2 | Pacijent B | 66,21 | 65,49 | 0,72 |
3 | Pacijent C | 30,64 | 20,01 | 10,63 |
4 | Pacijent D | 52,34 | 60,45 | -8,11 |
5 | Pacijent E | 50,91 | 46,87 | -4,04 |
6 | Pacijent F | 63,29 | 59,08 | 4,21 |
7 | Pacijent G | 97,08 | 98,76 | -1,68 |
8 | Pacijent H | 69,41 | 70,65 | -1,24 |
9 | Pacijent I | 42,98 | 43,07 | -0,09 |
10 | Pacijent J | 72,34 | 69,55 | 2,79 |
11 | Pacijent K | 50,31 | 54,81 | -4,5 |
12 | Pacijent L | 11,91 | 11,32 | 0,59 |
13 | Pacijent M | 44,89 | 41,98 | 2,91 |
14 | Pacijent N | 44,55 | 43,91 | 0,64 |
15 | Pacijent O | 55,77 | 55,98 | -0,21 |
16 | Pacijent P | 28,71 | 26,89 | 1,82 |
17 | Pacijent Q | 32,95 | 38,77 | -5,82 |
18 | Pacijent R | 25,98 | 23,56 | 2,42 |
19 | Pacijent S | 17,79 | 17,38 | 0,41 |
20 | Pacijent T | 24,73 | 28,55 | -3,82 |
Aritmetička sredina računa se prema sljedećem obrascu:
xsr = (x1+x2+x3+...+xn) / n
Aritmetička sredina (xsr) u našem konkretnom slučaju iznosi xsr= 0,12.
Standardna devijacija uzorka (sˆ') računa se po sljedećem obrascu:
sˆ' = √(((x1+xsr)2 +(x2+xsr)2 + ...+ (xn+xsr)2) / (n-1))
Standardna devijacija uzorka (sˆ') u našem konkretnom primjeru iznosi sˆ' = 4,13.
Kada poznajemo standardnu devijaciju uzorka i aritmetičku sredinu istog možemo pristupiti testiranju hipoteze koja će se u našem konkretnom slučaju zasnivati na primjeni Studentovog t-testa za dva mala zavisna uzorka i to prema slijedećem obrascu:
trealizovano = xsr / (sˆ' / √((n))
Nakon primjene predhodnog obrasca ustanovili smo da je trealizovano = 0,129.
Primjenom funkcije TDIST u excelu koja sadrži integrisane tablice Studentove t - distribucije ustanovili smo da je prealizovano =0,449.
odlučivanja
koristimo?Prihvata se H0 ; obzirom da je prealizovano > pα (0,449 > 0,05) te trealizovano < tn-1,α ; gdje kroz tablice Studentove t - distribucije pronalazimo vrijednost tn-1,α (stepen slobode označen izrazom "n-1 = v" ) tj. trealizovano < t19; 0,05 (0,129 < 1,729)
parametrijskog testa
hipoteze?Zaključak, odbacuje se se HA (alternativna hipoteza) tj. kraće je vrijeme oporavka nakon što su pacijenti tretirani lijekom, za ovu konstataciju imamo prilično čvrste dokaze jer je nivo značajnosti prealizovano = 0,449 što je u odnosu na pα = 0,05 znatna razlika.
Pošaljite Upit
Ukoliko ste zainteresovani za BESPLATNU excel verziju navedenog postupka kao i savjetovanje iz oblasti parametrijskog testiranja HIPOTEZE pošaljite upit.