Neparametrické odhady - Parzenova okna (Parzen windows)

Zadání

Stáhněte si a nahrajte do Matlabu soubor data_33rpz_cv05.mat.

Soubor obsahuje proměnné:

trn_2000	- struktura s trénovací sadou obrázků
tst	- struktura s testovací sadou obrázků
Alphabet	- abeceda

Pro každý obrázek z trénovací sady trn_2000 spočtěte odezvu měření x. Výsledky uložte pro každou třídu zvlášť do vektorů X₁, X₂.

Napište funkci y = my_parzen(x,X,sigma), která metodou Parzenových oken vypočte pro dané x odhad pravděpodobnosti p(x) na základě n naměřených hodnot X , (tj. X je vektor délky n ). Jako jádrovou funkci W(x) použijte normální rozdělení N(0, σ).

Nápověda: y = 1/n * Sum_i W(x-X(i))

(Jádrové funkce se v některé literatuře značí symbolem φ(x)).
Funkci my_parzen() nyní použijte pro odhad distribuce p(x|1). Do jednoho obrázku vykreslete normalizovaný histogram X₁ a odhad distribuce p(x|1).
- pro vyčíslení odhadu použijte vytvořenou funkci: p(x|1) = my_parzen(x,X1,sigma)
- x volte např. od min(X₁) do max(X₁) s krokem 100
Odhad vykreslete pro tři různá sigma, např. sigma = 80,800,1600.

Očekávané výsledky:
Pomocí krosvalidace, maximalizací věrohodnosti, odhadněte optimální velikost parametru sigma. Použijte zjednodušenou verzi krosvalidace s dělením jen na dvě množiny (trénovací a validační).

Postup:
1. Nastudujte si techniku krosvalidace.
2. Sadu X₁ rozdělte na dvě stejně velké části X_1a a X_1b (doporučujeme použít funkci crossval()).
3. Na části X_1a odhadněte distribuci p(x|1) pro různá sigma a na druhé části (validační) vyčíslete logaritmus věrohodnosti L(sigma), tj:
  
  p(x|1) = my_parzen(x,X_1a,sigma)
  L(sigma) = Sum_x log( p(x|1) ), kde sčítáme přes všechna x z X_1b.
4. Krok 2 opakujte pro různá sigma, např. sigma = 100, 200,...,1000.
5. Vykreslete do obrázku závislost věrohodnosti L(sigma) na sigma a vyberte optimální hodnotu sigma maximalizující věrohodnost
Otázka: Jaké sigma by se našlo, pokud bychom množinu nerozdělili, ale hledali maximum věrohodnosti na celé množině?

Poznámka: Použitý postup, při kterém jsme rozdělili trénovací množinu na dvě části, je zjednodušenou formou krosvalidace. Odvážnější studenti mohou použít její úplný tvar s dělením do více množin.

Očekávané výsledky:
Stejným způsobem odhadněte distribuci p(x|2).
Odhadnuté distribuce p(x|1) a p(x|2) použijte pro bayesovskou klasifikaci dat v testovací sadě tst. (Apriorní pravděpodobnosti P(1),P(2) odhadněte na trénovací sadě stejným způsobem, jako v předešlém cvičení.) Vyčíslete chybu klasifikace.

Bonusová úloha

Zopakujte body 3-7, tentokrát ale použijte jádrovou funkci W(x) typu 1-d krychle:

W(x) = 1/h, pro abs(x) <=1/2*h,

W(x) = 0, pro abs(x) >1/2*h,

kde h značí šířku okna (tj. parametr h v určitém smyslu odpovídá paremetru σ při použití N(0,σ)).
Zopakujte body 2-7, tentokrát ale pro dva příznaky. Jako druhý příznak použijte rozdíl horní a dolní poloviny obrázku. Jako jádrové funkce použijte 2D gaussovské distribuce s diagonální kovarianční maticí cov = sigma^2*eye(2). Vykreslete odhadnuté distribuce p(x|k).

Doporučená literatura

Created by Martin Urban and Karel Zimmerman, 28.10.2006, last update 07.04.2008 V.Franc

W(x) = 1/h,	pro abs(x) <=1/2*h,
W(x) = 0,	pro abs(x) >1/2*h,

Neparametrické odhady - Parzenova okna (Parzen windows)

Formulace úlohy

Zadání

Bonusová úloha

Doporučená literatura