Neymanova-Pearsonova úloha

Jste kapitánem obchodní lodi a plavíte se Karibským mořem. Cesta by měla být bezpečná, již mnoho let zde nikdo pirátksou loď nespatřil. Přesto máte špatné tušení a od rána do večera pečlivě sledujete obzor. Na obzoru pozorujete mnoho neznámých lodí. Co kdyby některá přeci jen patřila obávanému Pirátovi z Karibiku?


obr.1 Obchodní loď	obr.2 Pirátská loď

Abychom Vám úlohu zjednodušili, předpokládejme, že k rozlišení obchodní a pirátské plachetnice používáte jednorozměrné diskrétní měření

x = round( (průměrná intensita levé poloviny obrázku) - (průměrná intensita pravé poloviny obrázku) )

Z námořní příručky znáte rozložení zmíněné veličiny mezi obchodními loděmi P(x|1) a pirátskými loděmi P(x|2). Jaká je apriorní pravděpodobnost setkání s piráty P(2) ale vůbec netušíte.

Vaším cílem je nalézt na základě známých diskrétních rozložení P(x|1) a P(x|2) takovou rozhodovací strategii, která bude minimalizovat pravděpodobnost falešného poplachu za předpokladu, že pravděpodobnost přehlédnutí pirátské karavely nepřekročí nějakou rozumnou hranici ε.

Pokud strategii klasifujicí x do třídy 1 a 2 zapíšeme pomocí funkce q(x) takové, že

q(x) = 0 ... pokud x klasifikuji do třídy 1 (obchodní lodě)
q(x) = 1 ... pokud x klasifikuji do třídy 2 (pirátské lodě),

potom podmíněnou pravděpodobnost falešného poplachu mohu vyjádřit jako Sum_x q(x) P(x|1) a podmíněnou pravěpodobnost přehlédnutí pirátské lodi jako Sum_x [1-q(x)] P(x|2). (V sumách sčítám přes diskrétní obor hodnot x).

Neyman-Pearson úlohu potom zapíši jako hledání strategie q(x):

q = argmin Sum_x q(x) P(x|1), za podmínky

Sum_x [1-q(x)] P(x|2) <= ε.

Zadání

Stáhněte a nahrajte si do Matlabu soubor neyman-pearson-pxi.mat, který obsahuje diskrétní distribuce P(x|1), P(x|2).

Obsah souboru:

Px1	-	1x62, diskrétní distribuce P(x\|1)
Px2	-	1x62, diskrétní distribuce P(x\|2)
X	-	1x62, množina X, množina hodnot veličiny x; X = {-43,-42,...,18}

Vykreslete distribuce P(x|1) a P(x|2) do jednoho obrázku.

obr.3. Očekávaný výsledek.
Zapište úlohu hledání optimální strategie q(x) jako úlohu lineárního programování.
Pro zvolené ε nalezněte optimální strategii. K vyřešení úlohy lineárního programování použijte matlabovskou funkci

α = LINPROG(f,A,b,Aeq,beq,LB,UB),

která minimalizuje f' * α za podmínek A * α <= b, Aeq * α = beq, LB <= α <= UB.
Nalezenou optimální strategii znázorněte do obrázku s distribucemi P(x|1) a P(x|2).

obr.4. Ukázka možného výsledku. Červená políčka označují biny, které klasifikuji do třídy 1.
Pro optimální strategii vyčíslete pravděpodobnost falešného poplachu a pravděpodobnost přehlédnutí pirátské lodi.

Stáhněte si soubor neyman-pearson-images.mat, který obsahuje obrázky pozorovaných plachetnic.

Obsah souboru:

images	-	100x100x110, 110 obrázků pozorovaných lodí
labels	-	1x110, vektor se správnou klasifikací

Klasifikujte obrázky pomocí vypočtené optimální strategie. Porovnáním se skutečnou klasifikací (vektor labels) spočtěte empirické chyby (tj. procento falešných poplachů a procento přehlédnutých pirátských lodí.) Empirické chyby porovnejte se střední hodnotou chyb z bodu 6.

Body 4-7 zopakujte pro několik různých hodnot ε. Vypočtená očekávání chyb a změřené empirické chyby zapište do tabulky.

Bonusová úloha

(pro zdatné studenty)
Vyřešte body 3-8, tentokrát ale jako Waldovu úlohu.

Doporučená literatura

Michail I. Schlesinger, Václav Hlaváč. Deset přednášek z teorie statistického a strukturního rozpoznávání. Vydavatelství ČVUT, Praha 1999.
Wikipedia, Linear programming

Created by Martin Urban, last update 22.10.2007