Teema 1: \(p\)-väärtuse leidmine MC simulatsioonide abil.

Statistika algusaegadel sai kasutada ainult selliseid statistilisi teste, mille korral teststatistiku jaotus (või vähemalt asümptootiline jaotus) on leitav analüütiliselt. Kaasajal ei ole see aga enam nii oluline, sest juhul, kui me oskame nullhüpoteesile vastavaid valimeid arvutil genereerida, saame järelikult genereerida ka teststatistiku väärtuseid ja nende põhjal hinnata statistiku jaotusega seotud arvnäitajaid (sh konkreetse valimi puhul saadud tulemuse \(p\)-väärtust, mille saame leida näiteks empiirilist jaotusfunktsiooni kasutades).

Harjutus 1

Täringu ebaausus väljendub selles, et tulemused ei ole kõik võrdse tõenäosusega. Kuna suurte arvude seaduse põhjal konkreetse tulemuse esinemista arv jagatuna katsete arvuga koondub selle tulemuse tõenäosuseks, siis statistik, mis leiab maksimaalse absoluutse erinevuse suhteliste sageduste ja \(\frac{1}{6}\) vahel peaks piisavalt suure valimi korral käituma oluliselt erinevalt ausa täringu ja ükskõik millise ebaausa täringu korral. Seega võime kasutada täringu aususe testimisel ka statistikut

\[ S=\max (|\frac{n_i}{n}-\frac{1}{6}|,\ i=1,2,\ldots,6),\] kus \(n\) on valimi suurus ja \(n_i\) on \(i\) silma esinemiste arv valimis. Leia selle statistiku \(p\)-väärtus sagedustabeliga

## valim
##  1  2  3  4  5  6 
##  7  9 10  8 17  9

valimi korral, simuleerides selleks 10000 valimi moodustamist ausa täringu abil. Kasuta empiirilist jaotusfunktsiooni (R-s käsk ecdf) \(p\)-väärtuse arvutamiseks.


Märkus: Kui arvutatava statistiku jaotusfunktsioon on pidev (st tõenäosus saada täpselt sama väärtust erinevate valimite korral on 0), siis võib leida valimist leitud statistiku väärtusele \(\hat{s}\) vastava \(p\) väärtuse kujul \(1-F_m(\hat{s})\), kus \(F_m\) on \(m\) valimi põhjal leitud statistiku väärtustele vastav empiiriline jaotusfunktsioon. Kui statistik võib omandada mingit fikseeritud väärtust positiivse tõenäosusega (mis kehtib alati, kui valim vastab diskreetsele juhuslikule suurusele), siis kehtib võrdus \[P(S\geq \hat{s})=1-F_{S}(\hat{s})+P(S=\hat{s})\] Kui oskame leida sellise arvu \(\varepsilon\), et statistiku võimalike väärtuste vahe on suurem kui \(\varepsilon\), siis saab eelnevat valemit lihtsustada kujule (mõtle järele, miks see nii on!)

\[P(S\geq \hat{s})=1-F_{S}(\hat{s}-\varepsilon)\]


Teema 2: Testi võimsuse leidmine MC simulatsioonide abil.

Selleks, et valida test konkreetse uuringu jaoks, on mõistlik vaadata, milline testidest eristab kõige paremini meie jaoks nullhüpoteesist oluliselt erinevad jaotuseid. Oletame, et tüüpilised valed täringud on sellised, kus üks külg on veidi suurema tõenäosusega kui \(\frac{1}{6}\) ja selle vastaskülg on samavõrra väiksema tõenäosusega ning ülejäänud käituvad samamoodi, kui ausal täringul.

Harjutus 2

Tee simulatsioonide abil kindlaks, kas eelmises ülesandes vaadeldud test on võimsam kui \(\chi^2\)-test juhul, kui neid kasutada \(\alpha=0.05\) korral 120 viske põhjal täringu aususe kindlakstegemiseks, kui visatava täringu visketulemuste tõenäosused on antud tabelina

Vihje Kõigepealt on mõistlik tekitada eelmise ülesande statistiku jaoks empiiriline jaotusfunktsioon nullhüpoteesi ja vaadeldava valimimahu jaoks, alles seejärel asuda alternatiivse jaotusega katseid tegema

Harjutus 3

Sageli kasutatakse võimsusarvutusi selleks, et teha kindlaks valimimaht, mille korral vaadeldavat tüüpi erinevus tuvastatakse vaadeldava testi korral etteantud tõenäosusega. Tee eelmise ülesande korral mõlema testi puhul kindlaks, millise valimimahu korral lükatakse alternatiivhüpoteesi kehtimisel \(H_0\) ümber tõenäosusega 0.9.