Random Samples

Tomáš Svoboda

Abstract:

Pomocný text objasňující základy teorie náhodných vzorků (random samples). Především odhad střední hodnoty a rozptylu. Vysvětelna je momentová funkce (moment generating) funkce a odvození jednotlivých momentů.

Základní vztahy

Momenty náhodné veličiny

Moment

-tého řádu je definován

$\begin{displaymath} m_n = {\sf E}\{{\bf x}^n\} = \int_{-\infty}^{\infty} x^n f(x) dx. \end{displaymath}$

(1)

Centrální moment

-tého řádu

$\begin{displaymath} \eta_n = {\sf E}\{({\bf x}-\mu)^n\} = \int_{-\infty}^{\infty} (x-\mu)^n f(x) dx. \end{displaymath}$

(2)

Moment prvního řádu označujeme jako střední hodnotu $m_1 = \mu$ . Druhý centrální moment označujeme jako rozptyl $\eta_2 = \sigma^2$ . Odmocninu $\sqrt{\sigma^2}$ nazýváme standardní odhylkou. Rozptyl lze spočítat z prvního a druhého momentu.

$\begin{displaymath} \sigma^2 = m_2 - \mu^2. \end{displaymath}$

(3)

Důkaz:

$\begin{displaymath}\sigma^2 = {\sf E}\{({\bf x}-\mu)^2\} = {\sf E}\{{\bf x}^2 \}... ...mu{\sf E}\{{\bf x} \} + \mu^2 = {\sf E}\{{\bf x}^2 \} - \mu^2. \end{displaymath}$

Momentová funkce

Odvození je převzato a upraveno z knihy [1]. Momentová funkce náhodné veličiny ${\bf x}$ je definována jako střední hodnota funkce $e^{s{\bf x}}$ . Funkci označíme $\Phi(s)$ a je definována pro všechna

pro která ${\sf E}\{e^{s{\bf x}}\}$ .

$\begin{displaymath} \Phi(s) = {\sf E}\{e^{s{\bf x}}\} = \int_{-\infty}^{\infty} e^{sx}f(x) dx. \end{displaymath}$

(4)

Tuto funkci s výhodou využijeme při transformaci náhodných veličin. Buď ${\bf y}=a{\bf x}+b$ náhodná veličina. Její momentová funkce je rovna:

$\begin{displaymath} \Phi_y(s) = {\sf E}\{e^{s(a{\bf x}+b)}\} = e^{bs}\Phi_x(as). \end{displaymath}$

(5)

Momentový teorém

Buď

-tý moment náhodné veličiny.

$\begin{displaymath}m_n={\sf E}\{{\bf x}^n\} = \Phi^{(n)}(0). \end{displaymath}$

(6)

Důkaz:

diferencováním (4) podle

vypočteme

$\begin{displaymath}\Phi^{(n)}(s) = \int_{-\infty}^{\infty} x^n e^{sx} f(x) dx. \end{displaymath}$

jelikož

, tato rovnice je přesně rovnice (1).

Parametery transformované veličiny

Buď $\sigma^2_x$ rozptyl a $\mu_x$ střední hodnota náhodné veličiny ${\bf x}$ . Definujeme náhodnou veličinu ${\bf y}$ jako

$\begin{displaymath}{\bf y} = a{\bf x} + b. \end{displaymath}$

Nyní chceme spočitat $\sigma^2_y$ a $\mu_y$ ze znalosti charakteristik náhodné veličiny ${\bf x}$ . Známe vztah pro momentovou funkci transformované veličiny (5). Derivujeme podle

$\begin{displaymath} \Phi'_y = be^{bs} \int_{-\infty}^{\infty} e^{asx} f(x) dx + e^{bs} a \int_{-\infty}^{\infty} xe^{asx} f(x) dx. \end{displaymath}$

(7)

po dosazení

$\begin{displaymath} \mu_y = \Phi'_y(0) = b+a\mu_x. \end{displaymath}$

(8)

Derivací rovnice (7) získáme

$\begin{displaymath}m_2(y) = b^2 + 2ba\mu_x + a^2 m_2(x). \end{displaymath}$

připomeňme, že platí $m_2(x) = \sigma^2_x + \mu^2_x$ , viz rovnice (3). Dosazením obdržíme

$\begin{displaymath}m_2(y) = (b+a\mu_x)^2 + a^2\sigma^2_x. \end{displaymath}$

Rozptyl veličiny ${\bf y}$ je tedy roven

$\begin{displaymath} \sigma^2_y = m_2(y) - \mu^2_y = a^2\sigma^2_x. \end{displaymath}$

(9)

Výše uvedené vztahy lze samozřejmě použít i ve vícedimenzionálním problému. Mějme

-rozměrnou náhodnou veličinu y,

-rozměrnou x a transformační matici

o rozměru $m\times n$ a $m\times 1$ vektor b.

$\begin{displaymath}{\bf y} = A{\bf x} + {\bf b}. \end{displaymath}$

Rovnice (8) se změní na

$\begin{displaymath} {\sf E}\{{\bf y}\} = A {\bf x} + {\bf b} \end{displaymath}$

(10)

a rovnice (9) bude

$\begin{displaymath} C_{\bf y} = A C_{\bf x} A^T. \end{displaymath}$

(11)

$C_{\bf x}$ je $n\times n$ kovarianční matice x a $C_{\bf y}$ je $m \times m$ kovarianční matice vektoru y.

Náhodné vzorky - Random Sampling

Náhodné vzorky definujeme jako sekvenci nevzájem nezávislých náhodných veličin se stejným rozdělením (v anglické literatuře i.i.d - independent and identically distributed).

$\begin{displaymath}{\bf x}_1, \dots, {\bf x}_i, \dots, {\bf x}_n. \end{displaymath}$

Střední hodnota náhodných vzorků

Aritmetickému průměru

$\begin{displaymath}\mean{\vc{x}} = \frac{\vc{x}_1 + \dots + \vc{x}_n}{n}. \end{displaymath}$

(12)

vzorků $\vc{x}_i$ se říká střední hodnota náhodných vzorků. Uvědomme si, že $\mean{\vc{x}}$ je také náhodná veličina. Připomeňme, že vzorky $\vc{x}_i$ mají stejnou střední hodnotu a rozptyl. S použitím rovnic (10) a (11) vypočteme střední hodnotu $\mean{\vc{x}}$

$\begin{displaymath}\Expect{\mean{\vc{x}}} = \frac{\mu + \dots + \mu}{n} = \mu \end{displaymath}$

(13)

pro rozptyl pak platí

$\begin{displaymath} \sigma_{\mean{\vc{x}}}^2 = \frac{\sigma^2 + \dots + \sigma^2}{n^2} = \frac{\sigma^2}{n}. \end{displaymath}$

(14)

Odhad parametrů z náhodných vzorků

Buď $\vc{x}_i$ náhodné vzorky z rozdělení, jehož tvar známe, ale neznáme jeho parametry. Předokládejme náhodné rozdělení. Odhady budeme značit se stříškou, $\hat{\mu}$ je tedy odhad střední hodnoty $\mu$ a $\hat{\sigma}^2$ je odhad rozptylu $\sigma^2$ . Metodou maximální věrohodnosti získáme následující odhady parametrů. Pro odhad střední hodnoty aritmetický průměr

$\begin{displaymath}\hat{\mu} = \frac{1}{N} \sum_{i=1}^{N} \vc{x}_i. \end{displaymath}$

(15)

Střední hodnota odhadu je (viz předchozí podkapitola)

$\begin{displaymath}\Expect{\hat{\mu}}= \frac{1}{N} \sum_{i=1}^{N} \mu = \mu. \end{displaymath}$

(16)

Odhad střední hodnoty je tedy nevychýlený. Pro odhad rozptylu:

$\begin{displaymath}\hat{\sigma}^2 = \frac{1}{N} \sum_{i=1}^{N} (\vc{x}_i - \hat{\mu})(\vc{x}_i - \hat{\mu}) \end{displaymath}$

(17)

Ukážeme ale, že tento odhad je vychýleným odhadem skutečného rozptylu $\sigma$ .

$\begin{eqnarraystar}\hat{\sigma}^2 & = & \frac{1}{N} \sum_{i=1}^{N} \left((\vc{x... ...{N}(\hat{\mu}-\mu)^2 \\ & = & \sigma^2 - (\hat{\mu}-\mu)^2. \end{eqnarraystar}$

Střední hodnota odhadu rozptylu je tedy

$\begin{displaymath}\Expect{\hat{\sigma}^2} = \sigma^2 - \Expect{(\hat{\mu}-\mu)^2}. \end{displaymath}$

S použitím vztahu pro rozptyl střední hodnoty (14)

$\begin{displaymath}\Expect{\hat{\sigma}^2} = \frac{N-1}{N} \sigma^2. \end{displaymath}$

(18)

Je zřejmé, že pro větší hodnoty

je vychýlení zanedbatelné. Je třeba si uvědomit, že vychýlení je z důvodu použití odhadu střední hodnoty $\hat{\mu}$ místo skutečné střední hodnoty $\mu$ . Pro nevychýlený odhad rozptylu se používá vztah

$\begin{displaymath}\hat{\sigma}^2 = \frac{1}{N-1} \sum_{i=1}^{N} (\vc{x}_i - \hat{\mu})(\vc{x}_i - \hat{\mu}) \end{displaymath}$

(19)

Po odvození zjistíme, že střední hodnota tohoto odhadu je $\sigma^2$ .

Bibliography

1: Athanasios Papoulis.
Probability and Statistics.
Prentice-Hall, 1990.

Tomas Svoboda
1999-03-17