Tööleht on valminud Hariduse Infotehnoloogia Sihtasutuse IT Akadeemia programmi toel

Teema 1: Genereerimine segujaotusest

Sageli võib andmete jaotusi uurides täheldada mitut “küüru” või lihtsalt erinevat tüüpi käitumist erinevates väärtuste piirkondades, mistõttu ei vasta nende käitumine lihtsatele tuntud jaotustele. Tihti on selline käitumine põhjustatud üldkogumi mittehomogeensusest ehk sellest, et ülkogumis on mitu erinevat rühma (näiteks mehed/naised), milles mõõdetav tunnus käitub erinevalt. Olgu meil \(m\) rühma, kusjuures igas rühmas käitugu uuritav tunnus vastavalt pidevale juhuslikule suurusele tihedusfunktsiooniga \(f_i,\ i=1,2,\ldots,m\). Olgu iga rühma osakaal üldkogumis \(p_i\), siis täistõenäosuse valemi abil on lihtne näidata, et uuritava tunnuse tihedusfunktsioon üldkogumist juhusliku liikme valikul avaldub kujul \[f(x)=\sum_{i=1}^m p_i f_i(x),\ -\infty < x < \infty.\] See valem annab meile võimaluse keerulisemalt käituvaid juhuslikke suuruseid esitada lihtsamate kaudu.

Harjutus 1

Oletame, et naissoost tudengite pikkused vastavad normaaljaotusele \(N(167,\sqrt{33})\) ning meessoost tudengite pikkused vastavad normaaljaotusele \(N(182,\sqrt{46})\). Kirjuta funktsioon, mis etteantud \(n\) ja meeste osakaalu \(p\) korral genereerib \(n\) juhuslikult valitud tudengi pikkust. Kujuta graafikul 16000 genereeritud pikkuse histogramm juhul \(p=0.4\) koos teoreetilise tihedusfunktsiooniga.


Kontrolliks: Tulemus võiks näha välja nagu allpooltoodud graafik

Harjutus 2

Kasutada segujaotuse ideed selleks, et genereerida 2000 pseudojuhuslikku arvu tihedusfunktsioonile \[f(x)=\begin{cases} 0,& x<1,\\ \frac{1}{3},& 1\leq x<2,\\ \frac{1}{12},& 2\leq x<4,\\ \frac{1}{6},& 4\leq x<7,\\ 0,& x\geq 7 \end{cases}\] vastavast jaotusest. Kontrollida Kolmogorov-Smirnovi testiga saadud arvude vastavust soovitud jaotusele.


Kontrolliks:

Leitud jaotusfunktsiooni graafik peaks olema selline nagu järgneval joonisel

Teema 2: Pideva juhusliku suuruse teisendused

Loengust teame, et kui \(g\) on pööratav funktsioon pöördfunktsiooniga \(h\), siis tihedusfunktsiooniga \(f_X\) juhusliku suuruse abil defineeritud juhusliku suuruse \(Y\) tihedusfunktsioon avaldub kujul

\[ f_Y(y)=\begin{cases} f_X(h(y))\, |h'(y)|,& y\in g(\mathbb{R}),\\ 0& \text{mujal} \end{cases}\]

Erijuhul \(g(x)=ax+b\), \(a\not=0\) saame siit \[ f_Y(y)=\frac{1}{|a|}f_X(\frac{y-b}{a}),\ y\in \mathbb{R}\]

Harjutus 3

Kasuta juhusliku suuruse teisendamise ideed selleks, et genereerida 1000 funktsiooniga \[f(y)=\begin{cases} e^{2y},& y\leq 6,\\ 0,& y>6 \end{cases}\] proportsionaalse tihedusfunktsiooniga pseudojuhuslikku arvu, lähtudes jaotusega \(Exp(1)\) pseudujuhuslikest arvudest. (Vihje: leidke sobiv teisendus kujul \(y=a\,x+b\).)

10 esimest väärtust juhul, kui set.seed(100) on lahenduse alguses

 [1] 5.537894 5.638081 5.947678 4.451319 5.687597 5.412785 5.953441 5.125805
 [9] 5.875004 5.902837


Teema 3: Tinglikust jaotusest genereerimine jaotusfunktsiooni pöördfunktsiooni abil.

Järgmises loengus tõestame, et pööratava jaotusfunktsiooniga \(F_X\) pideva juhusliku suuruse \(X\) korral saab tinglikust jaotusest \(X\mid \{a< x\leq b\}\) juhusliku suuruse esitada kujul \(Y=F_X^{-1}(Z)\), kus \(Z\sim U(F_X(a),F_X(b))\) (ühtlane jaotus vahemikus \((F(a),F(b))\)).

Harjutus 4

Genereeri \(X\sim N(1,2)\) korral 1000 arvu tinglikust jaotusest \(X\mid \{4<X\leq 7\}\) Võrdle saadud tulemusi teoreetilise jaotuse tihedusfunktsiooniga.

Harjutus 5

Kasuta segujaotusest genereerimise ideed, et genereerida 10000 väärtust funktsiooniga \[f(x)=\begin{cases} e^{-2\,x^2}+0.5\,e^{-2x},& x\geq -1,\\ 0,& x< -1 \end{cases}\] proportsionaalse tihedusfunktsiooniga jaotusest, leia nende põhjal ligikaudselt vastava juhusliku suuruse keskväärtus. (Vihje: väärtuste genereerimisel oleks hea kasutada ühel juhul tinglikust jaotusest genereerimist ja teisel juhul sobivalt valitud lineaarteisendust)

Keskväärtus juhul, kui set.seed(100) on lahenduse alguses

[1] -0.2908503


Kodutöö nr 5 (VPL harjutus, tähtaeg 23.10.2023)

Ülesande teks on leitav Moodle keskkonnas alates 14.10.2023