Random Samples
Tomáš Svoboda
Abstract:
Pomocný text objasňující základy teorie náhodných vzorků (random
samples). Především odhad střední hodnoty a rozptylu. Vysvětelna je
momentová funkce (moment generating) funkce a odvození jednotlivých
momentů.
Moment -tého řádu je definován
|
(1) |
Centrální moment -tého řádu
|
(2) |
Moment prvního řádu označujeme jako střední hodnotu .
Druhý centrální moment označujeme jako rozptyl
.
Odmocninu
nazýváme standardní
odhylkou. Rozptyl lze spočítat z prvního a druhého momentu.
|
(3) |
Důkaz:
Odvození je převzato a upraveno z knihy [1]. Momentová
funkce náhodné veličiny
je definována jako střední hodnota
funkce
.
Funkci označíme
a je definována pro
všechna
pro která
.
|
(4) |
Tuto funkci s výhodou využijeme při transformaci náhodných veličin.
Buď
náhodná veličina. Její momentová funkce je
rovna:
|
(5) |
Buď
-tý moment náhodné veličiny.
|
(6) |
Důkaz:
diferencováním (4) podle
vypočteme
jelikož ,
tato rovnice je přesně rovnice (1).
Buď
rozptyl a
střední hodnota náhodné veličiny
.
Definujeme náhodnou veličinu
jako
Nyní chceme spočitat
a
ze znalosti charakteristik
náhodné veličiny .
Známe vztah pro momentovou funkci
transformované veličiny (5). Derivujeme podle
|
(7) |
po dosazení ,
|
(8) |
Derivací rovnice (7) získáme
připomeňme, že platí
,
viz rovnice (3). Dosazením obdržíme
Rozptyl veličiny
je tedy roven
|
(9) |
Výše uvedené vztahy lze samozřejmě použít i ve vícedimenzionálním
problému. Mějme -rozměrnou náhodnou veličinu y, -rozměrnou
x a transformační matici
o rozměru
a vektor b.
Rovnice (8) se změní na
|
(10) |
a rovnice (9) bude
|
(11) |
je
kovarianční matice x a
je
kovarianční matice vektoru y.
Náhodné vzorky definujeme jako sekvenci nevzájem nezávislých náhodných
veličin se stejným rozdělením (v anglické literatuře i.i.d -
independent and identically distributed).
Aritmetickému průměru
|
(12) |
vzorků
se říká střední hodnota náhodných vzorků.
Uvědomme si, že
je také náhodná veličina. Připomeňme,
že vzorky
mají stejnou střední hodnotu a rozptyl. S
použitím rovnic (10) a
(11) vypočteme střední hodnotu
|
(13) |
pro rozptyl pak platí
|
(14) |
Buď
náhodné vzorky z rozdělení, jehož tvar známe, ale
neznáme jeho parametry. Předokládejme náhodné rozdělení. Odhady budeme
značit se stříškou,
je tedy odhad střední hodnoty
a
je odhad rozptylu .
Metodou maximální
věrohodnosti získáme následující odhady parametrů. Pro odhad střední
hodnoty aritmetický průměr
|
(15) |
Střední hodnota odhadu je (viz předchozí podkapitola)
|
(16) |
Odhad střední hodnoty je tedy nevychýlený. Pro odhad rozptylu:
|
(17) |
Ukážeme ale, že tento odhad je vychýleným odhadem skutečného
rozptylu .
Střední hodnota odhadu rozptylu je tedy
S použitím vztahu pro rozptyl střední hodnoty (14)
|
(18) |
Je zřejmé, že pro větší hodnoty
je vychýlení zanedbatelné. Je
třeba si uvědomit, že vychýlení je z důvodu použití odhadu střední
hodnoty
místo skutečné střední hodnoty .
Pro
nevychýlený odhad rozptylu se používá vztah
|
(19) |
Po odvození zjistíme, že střední hodnota tohoto odhadu je .
- 1
-
Athanasios Papoulis.
Probability and Statistics.
Prentice-Hall, 1990.
Tomas Svoboda
1999-03-17