AdaBoost

Využijeme učícího algoritmu AdaBoost k natrénování jednoduchého klasifikátoru obrázků číslic. Jako pozitivní třídu zvolíme jednu číslici a budeme se ji učit rozpoznat od ostatních číslic. Slabý klasifikátor bude využívat hodnoty pouze jednoho pixelu v obrázku, na jejímž základě bude pomocí jednoho prahu klasifikovat do pozitivní a negativní třídy.

Formulace úlohy

Algoritmus učení AdaBoostu je popsán v [1] (Algoritmus 1).

V našem případě jsou vstupem obrázky číslic velikosti 13x13 v šedotónové škále (x_i) a jejich příslušnosti do tříd. Pozitivní třídu (y_i = +1) zvolíme jako jednu číslici, ostatní budeme uvažovat jako negativní příklady (y_i = -1).

Množina slabých klasifikátorů H obsahuje 13x13=169 slabých klasifikátorů, z nichž každý využívá informace jen z jednoho pixelu v obrázku. Slabý klasifikátor má dva parametry - práh θ a paritu p (p Î {+1, -1}, neboli, je pozitivní třída nad prahem nebo pod prahem?). Rozhoduje tedy tak, že přečte hodnotu pixelu a podle prahu a parity rozhodne, do které třídy obrázek patří:

h_x,y(I) = sign[p * (I(x,y) - θ)].

Práh θ a parita p nejsou dopředu známé, je třeba je tedy také najít.

Zadání

Pro přehlednost a snadnou udržitelnost kódu (dnes bude spíše delší) doporučujeme členit kód do funkcí.

Stáhněte si trénovací (trn_data) a testovací (tst_data) data v souboru data_rpz33_cv07.mat.
Vyberte si jednu číslici (pozitivní třída), kterou se budete učit rozpoznávat od zbytku číslic (negativní třída).

Připomenutí: Pro učení je třeba nastavit y_i = +1 pro pozitivní třídu a y_i = -1 pro negativní třídu.
Implementujte učení pomocí AdaBoostu (algoritmus 1 v [1]). K nalezení prahu a parity při daném ovážení trénovací množiny použijte funkci findThetaPar.

Poznámka 1: Aktualizace vah D_t+1 (krok 4) se dá napsat jednoduše vektorovým zápisem (není třeba for cyklu). Dále si uvědomte, že Z_t je jen normalizační faktor, zajišťující, že D_t+1 je distribuce (integrál přes ni je roven 1). Z této úvahy vám vyplyne jednodušší vzoreček pro Z_t než ten uvedený v kroku 4 (algoritmu 1 v [1]).

Poznámka 2: Aktualizace vah D_t+1 se dá také napsat (po dosazení za a_t) jako D_t+1= D_t sqrt(ε_t/(1 - ε_t)), když y_i= h_t(x_i) a jako D_t+1= D_t sqrt((1 - ε_t)/ε_t), když y_i≠ h_t(x_i).
Vykreslete do jednoho grafu průběh trénovací a testovací chyby.
Vykreslete průběh chyby ε_t vybraných slabých klasifikátorů.

Doporučená literatura

[1] AdaBoost (cvičení z minulých let)

[2] AdaBoost přednáška

Created by Jan Šochman, last update 19.11.2008