Cvičení 22.3. a 23.3.
Návrh klasifikátoru
Příprava dat
Pošlete svoje datové soubory jako
attachments na dresu svoboda@cmp.felk.cvut.cz. Data
budou spojena dohromady a budou sloužit v různých modifikacích jako
testovací a trénovací množina. Pro vaše vlastní experimenty si můžete
aktuální celkový datový soubor stahnout zde. Soubor se bude doplňovat tak, jak mi
budou docházet vaše data.
Zápis o experimentu - Protokol
Výsledky zapisujte do svého protokolu
o klasifikaci. Protokol by měl obsahovat:
- Informace o treninkové množině. (Četnost, druh použitých příznaků
atd.)
-
Druh použitého klasifikátoru.
-
Informace o testovací množině.
-
Výsledky klasifikace.
Zapisujte pečlivě. K zápisu dat můžete použí připravenou tabulku expclass.tar (tar archiv). K protokolu se
budou připisovat další informace (např. metody na selekci příznaků a
pod.
Úkoly
-
S použítím svého souboru dat vytvořte klasifikátor pro určení pohlaví
na základě příznaků.
-
Je-li k dispozici málo vzorků pro jeden druh pohlaví, klasifikujte
osoby na velké (výška>=180cm) nebo malé (<180cm).
-
Zdůvodněte použití vámi vybraného klasifikátoru.
-
Jako testovací množinu použijte soubor
všech dat (zatím k dispozici).
-
Vyhodnoťe úspešnost klasifikace pro různé příznaky a pro různý počet
příznaků.
-
Zdůvodněte si výsledky (úspešnost) klasifikace. (počet příznaků, volba
příznaků).
-
Krátkou zprávu (max. ekvivalent A4 textu) shrnující váš experiment
pošlete na svoboda@cmp.felk.cvut.cz. Pište
v ASCII bez hacku a carek. Nadprůměrné výsledky budou ohodnoceny
+.