Hlavní úloha
Analyzujte počasí na základě
měřitelných veličin (teplota, srážky, atd.) a jejich relací za co
nejdelší období do minulosti (dáno dostupností kvalitních dat).
1. Nalezení vhodných dat
Nalezněte data vhodná pro
takovouto analýzu. Meteorologická data lze získat například ze Střediska pro modelování
povětrnostních vlivů z
americké Agentury pro ochranu životního prostředí. Každá skupina
by měla použít data z jiného
regionu, případně jinak předzpracovaná, abychom viděli, jak se získané
výsledky liší podle zdroje dat.
- Skupina předloží hotový dokument, který popíše systém, se kterým bude
pracovat, a zdůvodní jeho výběr. Popisem systému se rozumí popis
dat (výběr měřených míst, volba proměnných) a jejich grafické zobrazení.
Na konzultaci studenti spolu se cvičícím proberou
úskalí, která mohou při použití dat nastat. Skupina může případně
dostat za úkol sehnat další či vhodnější data. Cvičící zodpoví případné
dotazy studentů týkající se další podúlohy.
- Termín konzultace: 18. 3. 2007
- Termín odevzdání dokumentu:
poledne 17. 3. 2007.
- Maximální počet bodů: 2
2. Posouzení závislosti jednotlivých proměnných
(podúloha 1a)
Vypočtěte podmíněné entropie mezi všemi
páry proměnných na základě optimálně diskretizovaného histogramu,
metodou
jackknife odhadněte chybu. Rozhodněte zda lze výsledky interpretovat
jako kauzální
vztahy.
- Skupina předloží dokument, ve kterém prezentuje výsledky
podúlohy, včetně vlastní interpretace a závěrů. Cvičící studentům
zprávu opraví a přidělí předběžné body. Při konzultaci cvičící se
studenty diskutuje nad jejich dokumentem. Cvičící zodpoví případné
dotazy studentů týkající se další podúlohy.
- Termín konzultace: 25. 3. 2007.
- Termín odevzdání dokumentu:
poledne 24. 3. 2007.
- Maximální počet bodů: 3
(podúloha 1b)
Vypočtěte podmíněné entropie mezi všemi páry proměnných metodou
Kozačenko-Leoněnko, metodou jackknife odhadněte chybu. Výsledky
srovnejte s výsledky odhadu z histogramu.
Rozhodněte, která z metod je lepší a za jakých podmínek.
- Skupina předloží dokument, ve kterém prezentuje výsledky
podúlohy, včetně vlastní interpretace a závěrů. Cvičící studentům
zprávu opraví a přidělí předběžné body. Při konzultaci cvičící se
studenty diskutuje nad jejich dokumentem. Cvičící zodpoví případné
dotazy studentů týkající se další podúlohy.
- Termín konzultace: 1. 4. 2007.
- Termín odevzdání dokumentu:
poledne 31. 3. 2007.
- Maximální počet bodů: 3
3. Vytvoření dynamického modelu a predikce
(podúloha 2)
Vytvořte dynamický model systému a na nezávislé testovací množině
ověřte jeho schopnost predikovat vývoj proměnných v čase. Dále, na základě dynamického modelu zkuste
predikovat vývoj počasí do budoucna.
- Skupina předloží dokument, ve kterém prezentuje výsledky
podúlohy, včetně vlastní interpretace a závěrů. Cvičící studentům
zprávu opraví a přidělí předběžné body. Při konzultaci cvičící se
studenty diskutuje nad jejich dokumentem. Cvičící zodpoví případné
dotazy studentů týkající se další podúlohy.
- Termín konzultace: 8. 4. 2007 nebo 15. 4. 2007 podle konzultace,
na kterou se skupina registruje.
- Termín odevzdání dokumentu:
poledne 7. 4. 2007.
- Maximální počet bodů: 6
4. Analýza struktury systému
(podúloha 3a)
Rozdělte systém na dva podsystémy. Implementujte jednoduchou a
iterativní spojovací proceduru. Porovnejte výsledky. Pozn.: neuvažujte
dynamiku systému.
- Skupina předloží dokument, ve kterém prezentuje výsledky
podúlohy, včetně vlastní interpretace a závěrů. Cvičící studentům
zprávu opraví a přidělí předběžné body. Při konzultaci cvičící se
studenty diskutuje nad jejich dokumentem. Cvičící zodpoví případné
dotazy studentů týkající se další podúlohy.
- Termín konzultace: 22. 4. 2007 nebo 29. 4. 2007 podle konzultace,
na kterou se skupina registruje.
- Termín odevzdání dokumentu:
poledne 21. 4. 2007.
- Maximální počet bodů: 3
(podúloha 3b)
Analyzujte strukturu systému pomocí úplného prohledání svazu
zjemnění. Ověřte statistickou významnost struktury kontingenčním
testem. Pozn.: neuvažujte dynamiku systému.
- Skupina předloží dokument, ve kterém prezentuje výsledky
podúlohy, včetně vlastní interpretace a závěrů. Cvičící studentům
zprávu opraví a přidělí předběžné body. Při konzultaci cvičící se
studenty diskutuje nad jejich dokumentem. Cvičící zodpoví případné
dotazy studentů týkající se další podúlohy.
- Termín konzultace:13. 5. 2007.
- Termín odevzdání dokumentu:
poledne 12. 5. 2007.
- Maximální počet bodů: 3
5. Úplná závěrečná zpráva
Vytvořte úplnou zprávu o analýze systému na základě předchozích
podúloh. Snažte se zapracovat všechny připomínky cvičícího a všechny
podněty, které vzešly z předchozích konzultací.
- Skupina předloží úplný dokument, ve kterém popisuje výsledky
všech podúloh. Dokument obsahuje celkové hodnocení dosažených výsledků.
Cvičící studentům zprávu opraví a přidělí předběžné body. Při
konzultaci cvičící se studenty diskutuje nad jejich dokumentem.
- Termín konzultace: 20. 5. 2007.
- Termín odevzdání dokumentu:
poledne 19. 5. 2007.
- Maximální počet bodů: 2
Poznámky:
- Bude nutné zvolit vhodnou metodu, jak se vyrovnat s nedostatkem
dat pro kvalitní odhady entropií. Bude možná nutné interpolovat data v
čase a odhadovat hustoty pravděpodobnosti vhodnou metodou.
- U všech hypotéz odvozených na základě entropie odhadněte chybu
metodou jackknife.
- Dbejte na to, abyste mohli zdokumentovat zdroj dat. V závěrečné
písemné zprávě uveďte příslušné správné reference do literatury.
Bibliografické údaje jsou obvykle součástí dat.