Random Samples
Tomáš Svoboda
Abstract:
Pomocný text objasňující základy teorie náhodných vzorků (random
samples). Především odhad střední hodnoty a rozptylu. Vysvětelna je
momentová funkce (moment generating) funkce a odvození jednotlivých
momentů.
Moment
-tého řádu je definován
 |
(1) |
Centrální moment
-tého řádu
 |
(2) |
Moment prvního řádu označujeme jako střední hodnotu
.
Druhý centrální moment označujeme jako rozptyl
.
Odmocninu
nazýváme standardní
odhylkou. Rozptyl lze spočítat z prvního a druhého momentu.
 |
(3) |
Důkaz:
Odvození je převzato a upraveno z knihy [1]. Momentová
funkce náhodné veličiny
je definována jako střední hodnota
funkce
.
Funkci označíme
a je definována pro
všechna
pro která
.
 |
(4) |
Tuto funkci s výhodou využijeme při transformaci náhodných veličin.
Buď
náhodná veličina. Její momentová funkce je
rovna:
 |
(5) |
Buď
-tý moment náhodné veličiny.
 |
(6) |
Důkaz:
diferencováním (4) podle
vypočteme
jelikož
,
tato rovnice je přesně rovnice (1).
Buď
rozptyl a
střední hodnota náhodné veličiny
.
Definujeme náhodnou veličinu
jako
Nyní chceme spočitat
a
ze znalosti charakteristik
náhodné veličiny
.
Známe vztah pro momentovou funkci
transformované veličiny (5). Derivujeme podle 
 |
(7) |
po dosazení
,
 |
(8) |
Derivací rovnice (7) získáme
připomeňme, že platí
,
viz rovnice (3). Dosazením obdržíme
Rozptyl veličiny
je tedy roven
 |
(9) |
Výše uvedené vztahy lze samozřejmě použít i ve vícedimenzionálním
problému. Mějme
-rozměrnou náhodnou veličinu y,
-rozměrnou
x a transformační matici
o rozměru
a
vektor b.
Rovnice (8) se změní na
 |
(10) |
a rovnice (9) bude
 |
(11) |
je
kovarianční matice x a
je
kovarianční matice vektoru y.
Náhodné vzorky definujeme jako sekvenci nevzájem nezávislých náhodných
veličin se stejným rozdělením (v anglické literatuře i.i.d -
independent and identically distributed).
Aritmetickému průměru
 |
(12) |
vzorků
se říká střední hodnota náhodných vzorků.
Uvědomme si, že
je také náhodná veličina. Připomeňme,
že vzorky
mají stejnou střední hodnotu a rozptyl. S
použitím rovnic (10) a
(11) vypočteme střední hodnotu

 |
(13) |
pro rozptyl pak platí
 |
(14) |
Buď
náhodné vzorky z rozdělení, jehož tvar známe, ale
neznáme jeho parametry. Předokládejme náhodné rozdělení. Odhady budeme
značit se stříškou,
je tedy odhad střední hodnoty
a
je odhad rozptylu
.
Metodou maximální
věrohodnosti získáme následující odhady parametrů. Pro odhad střední
hodnoty aritmetický průměr
 |
(15) |
Střední hodnota odhadu je (viz předchozí podkapitola)
 |
(16) |
Odhad střední hodnoty je tedy nevychýlený. Pro odhad rozptylu:
 |
(17) |
Ukážeme ale, že tento odhad je vychýleným odhadem skutečného
rozptylu
.
Střední hodnota odhadu rozptylu je tedy
S použitím vztahu pro rozptyl střední hodnoty (14)
 |
(18) |
Je zřejmé, že pro větší hodnoty
je vychýlení zanedbatelné. Je
třeba si uvědomit, že vychýlení je z důvodu použití odhadu střední
hodnoty
místo skutečné střední hodnoty
.
Pro
nevychýlený odhad rozptylu se používá vztah
 |
(19) |
Po odvození zjistíme, že střední hodnota tohoto odhadu je
.
- 1
-
Athanasios Papoulis.
Probability and Statistics.
Prentice-Hall, 1990.
Tomas Svoboda
1999-03-17