CMP logo

Rychlé Učitelné Metody pro Sledování Objektů

Karel Zimmermann [cv], supervisors: Jiri Matas Tomas Svoboda,
Center for Machine Perception
Czech Technical University Prague
http://cmp.felk.cvut.cz/

Video

Rychlý pohyb (obrázky)


Abstrakt

Tato práce se zabývá problémem vizuálního sledování objektů ve videosekvencích. Vizuální sledování je proces opakovaného odhadu stavu objektu (např. pozice) v obrázku při daných stavech v předcházejících snímcích. Sledování má mnoho aplikací jako jsou automatický vizuální dohled, 3D modelování objektů nebo virtuální realita a mnohé další. Vzhledem k tomu, že mnoho aplikací vyžaduje zpracování v reálném čase, velmi nízká výpočetní složitost je vysoce žádoucí vlastnost. Náš hlavní cíl je nalézt velmi rychlou metodu, která má definovanou přesnost a robustnost.

My přispíváme k metodám založeným na regresním odhadu pozice objektu. Na místo toho abychom navrhovali speciální učící proceduru pro speciální typ regresní funkce, navrhujeme optimální zřetězení různých regresních funkcí do sekvence. Vzhledem k tomu, že čas zpracování je při sledování často velmi důležitý, učení sekvence regresních funkcí je formulováno jako minimalizace výpočetní složitosti vzhledem k omezení dané uživatelem definovanou přesností a robustností. Vzhledem k tomu, že je nalezeno globální optimum, řešení je vždy lepší nebo stejně dobré než jedna regresní funkce. Libovolné regresní funkce umožnují takovéto zřetězení, avšak v naší práci se soustředíme na sekvence lineárních funkcí, které dosahují vysoké přesnosti při velmi nízké výpočetní složitosti.

V práci se také zabýváme optimálním nastavením metody pro sledování objektů v reálném čase nebo sledováním objektů se známým geometrickým modelem. Navrženou metodu ověřujeme na 12000 snímcích v nichž je pozice objektu známá a výsledky porovnáváme s nejmodernějšími metodami v oboru.

References

[1] K.Zimmermann Fast Learnable Methods for Object Tracking, PhD thesis defended (7 Nov, 2008), Czech Technical University, Faculty of Electrical Engineering, Department of Cybernetics, Center for Machine Perception (CMP), 2008, [pdf],
(reviews: matas, cootes, lepetit, stecha)
[2] K. Zimmermann, J. Matas, and T. Svoboda. Tracking by an Optimal Sequence of Linear Predictors. IEEE Transactions on Pattern Analysis and Machine Intelligence. 31(4), 2009, [pdf],
(reviews: major, minor, final )
[3] K. Zimmermann, T. Svoboda and J. Matas. Anytime learning for the NoSLLiP tracker. Image and Vision Computing, DOI: 10.1016/j.imavis.2009.03.005, (accepted), 2009, [pdf],
(reviews: minor, final )
[4] K. Zimmermann, T. Svoboda, J. Matas. Simultaneous learning of motion and appearance. The 1st International Workshop on Machine Learning for Vision-based Motion Analysis, In conjunction with the 10th European Conference on Computer Vision 2008, [pdf],
(review).
[5] K. Zimmernann, T. Svoboda, J. Matas. Adaptive Parameter Optimization for Real-time Tracking. In Proceedings of the Workshop on Non-rigid Registration and Tracking through Learning -
[6] J.Matas, K.Zimmermann, T. Svoboda, A. Hilton, Learning Efficient Linear Predictors for Motion Estimation, Proceedings of 5th Indian Conference on Computer Vision, Graphics and Image Processing, issn 0302-9743, isbn 978-3-540-68301-8, India, 2006