Support Vector Machines

Zadání

doma

Nastudujte formulaci optimalizační úlohy, kterou řeší SVM algoritmus (rovnice (1) a (2) pro lineárně separabilní, (4) a (5) pro neseparabilní data, viz [2]). O jaký typ optimalizační úlohy jde? Porovnejte s perceptronem.

Ujasněte si geometrický význam jednotlivých proměných jak v primární, tak v duální úloze. Vaše porozumnění by mělo být takové, že až budete na cvičení dotázáni (budete), budete schopni geometrický význam jednotlivých proměnných krátce vysvětlit.

Úlohy k vypracování na cvičení:

Imlementujte SVM algoritmus pro lineárně separabilní i neseparabilní data. Použijte duální formu optimalizační úlohy. K vlastnímu řešení úlohy kvadratického programování použijte funkci gsmo.
Poznámky k používání funkce gsmo:

Funkce je součástí STPR toolboxu, ale k tomu, aby fungovala, je potřeba zkompilovat soubor gsmo_mex.c do MEXu, což nemusí na vašich počítačích jít. Zkompilovaný soubor si můžete stáhnout zde Win32, Win64 (od Lukáše Bartáka) (návod na přeložení pod Ubuntu nalezený Ondřejem Pluskalem v sekci mex funkce). Pozor: V MATLABu pak používejte funkci gsmo (help k ní získáte pomocí `help gsmo') a nikoli gsmo_mex.
Je dobré nastavit `options.verb' (viz help), abychom viděli, jak optimalizace postupuje.
Je dobré také omezit maximální počet iterací nastavením `options.tmax'. Důvodem je to, že když je přímá úloha QP nesplnitelná, je (podle jisté věty o QP dualitě) duální úloha neomezená (viz [2]) - tudíž algoritmus s neomezeným počtem iterací nikdy neskončí.
Je nutno se dívat na výstupní parametr `stat', podle kterého poznáme, zda optimalizace skončila úspěšně či neúspěšně. Pokud skončila neúspěšně, musíme zjistit proč.

Ukažte na vhodně zvolené trénovací sadě (viz např. obrázek níže), jak volba konstanty C ovlivňuje pozici oddělující nadplochy. K vytvoření dat a vizualizaci použijte funkce createdata, ppatterns a pline.

C = Inf	C = 1

Navržený klasifikátor použijte ke klasifikaci znaků data_33rpz_cv08.mat pomocí dvou příznaků

x = (součet hodnot pixelů v levé polovině obrázku) - (součet hodnot pixelů v pravé polovině obrázku)
y = (součet hodnot pixelů v horní polovině obrázku) - (součet hodnot pixelů v dolní polovině obrázku)

Support Vector Machines (SVM)

Zadání

Doporučená literatura