Semestrln projekty - Semestral Projects


Nzev:3D rekonstrukce Prahy z Google Street View
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:
Oponent:Josef Sivic (ENS Paris)
Popis:
==============
=NEAKTIVNI TEMA=
==============
(vypsano 2010)

Cílem projektu je seznámit studenty s technologií trojdimenzionální rekonstrukce a provést experiment s rekonstrukcí trojdimensionálního modelu ze snímků Google Street View z Prahy.
Pokyny k vypracovn:
Doporuen literatura:Dodá vedoucí.
Forma realizace:Vzkumn zprva, demonstran software (Matlab, C, ...)
Datum vypsn:2010-02-12




Nzev:Fast image registration using linear programming and sparse sampling
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:
Oponent:
Popis:We shall start from a very fast registration technique [1], which is based on choosing keypoints on class boundaries, sampling their neighborhood in a normal direction, approximating the criterion using piecewise linear functions, and linear programming. Possible tasks include: coupling with a very fast segmentation method, extension to 3D, automatic choice of reliable keypoints, tailor-made innerpoint method optimization, optimized multiresolution and termination criterion, etc.
Pokyny k vypracovn:
Doporuen literatura:Kybic, Borovec: Fast registration by boundary sampling and linear programming. MICCAI 2018
Forma realizace:
Datum vypsn:2018-05-29




Nzev:3D face model from a video or multiple images of a subject
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Oponent:
Popis:faces

Having a collection of multiple images or a short video of a subject, it is possible to reconstruct a 3D model of his/her face. Such reconstructed model can be used in computer graphics applications, e.g. new view generation, relighting, face texture transfer, etc. Alternatively, the model can be used for identity recognition, e.g. by constructing a face signature from geometric characteristics or by generating a virtual frontal-view.

There are several approaches in the literature to reconstruct the model of a face. Very good results can be obtained by fitting a parametric 3D morphable [1] model by using stereo images [2]. Alternatively, facial features (nose, mouth corners, eye corners), can be reconstructed automatically using classical structure from motion techniques even in uncalibrated setup. A 3D reconstruction of a face from video has already been investigated, e.g. [3]. There exist a commercial solution, however it requires a non-negligible manual effort, e.g. [4]. Nevertheless our goal is to estimate the model automatically.

We will provide a code for detection the facial landmarks which also simultaneously estimate a pose of the camera (position+orientation) [5]. This will be a starting point for the reconstruction algorithm design. Promising results were already obtained with rather naive methods, so impressive results are expected.

References

[1] V. Blanz and T. Vetter. A morphable model for the synthesis of 3d faces. In SIGGRAPH 1999.
video.
[2] B. Amberg, A. Blake, A. Fitzgibbon. Reconstructing High Quality Face-Surfaces using Model Based Stereo. In ICCV 2007.
[3] Douglas Fidaleo and Gerard Medioni. Model-Assisted 3D Face Reconstruction from Video. In AMFG, 2007.
[4] Looxis Faceworks: video.
[5] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:software, technical report
Datum vypsn:2014-05-13




Nzev:Facial video super-resolution
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Oponent:
Popis:faces


The super-resolution is a technique which allows to reconstruct high-resolution image from multiple low-resolution images or a video. A basic principle is registering the images into a common coordinate frame, deconvolution, and final aggregation. An introductory overview can be found in [1].

This technique has natural applications in forensics, e.g. license plate reading from low definition videos [2], facial image super-resolution [3,4], etc. There exist many different approaches in the literature. A code for algorithm [5] is included in OpenCV. Faces are non-rigid 3D objects, so the registration is not straightforward. We will provide a code for precise facial landmark detection in the images [6], which will be a basic tool for the registration.

The beauty of this topic is that the final result could be very impressive in the sense that human does not have this ability. Nevertheless this topic is not easy to handle. The work could start from simple experiments with planar scenes, comparing with OpenCV, until the super-resolution of faces with frontal and non-frontal videos of a subject speaking or changing expressions. Therefore this topic can be chosen for semestral, bachelor, or master project.

References

[1] Super-Resolution Image Reconstruction: A Technical Overview. IEEE Signal Processing Magazine, May 2003.
[2] Filip Sroubek, Gabriel CristĂłbal, Jan Flusser. A Unified Approach to Superresolution and Multichannel Blind Deconvolution. IEEE Trans. on Image Processing, 16(9), 2007.
[3] Kui Jia and Shaogang Gong. Generalized Face Super-Resolution. IEEE Trans. on Image Processing, 17(6), 2008.
[4] Shuowen Hu, Robert Maschal, S. Susan Young,Tsai Hong Hong, and P. Jonathon Phillips. Face recognition performance with superresolution. Applied Optics / Vol. 51, No. 18 / 20 June 2012.
[5] Mitzel, T. Pock, T. Schoenemann, D. Cremers. Video super resolution using duality based TV-L1 optical flow. DAGM, 2009. http://docs.opencv.org/modules/superres/doc/super_resolution.html
[6] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2014-05-13




Nzev:Gaze direction estimation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Oponent:
Popis:gaze

Estimating the gaze direction, i.e. estimating where a person is looking from a single monocular camera is a challenging problem with potentially large applicability. For some applications it could replace expensive eye-trackers or other intrusive 'wearable' devices. In theory, not only the direction, but also the depth of the target view can be estimated, when enough resolution is available to get the eye vergence [1].

The applications include psycho-social studies, marketing applications (e.g. contactless interaction with advertising panels), alternative mouse pointer control for disabled people, vigilance monitoring for driver assistance systems, etc. If the work is successful, there is a potential for commercialization.

Multiple approaches exist in the literature to solve this problem. A good survey can be found in e.g. [2], nice results are obtained with a help of a range sensor [3]. We will provide a code for detecting facial landmarks (nose tip, eye corners, mouth corners) in images and estimating a pose (position and orientation) of the face with respect to the camera [4]. A candidate will investigate a fusion of the head pose with the eye vergence estimation and will design a ground-truth experiment in order to evaluate the method accuracy, and to study impact of subject distance, pose, and camera resolution.

References

[1] Zakia Hammal, Corentin Massot, Guillermo Bedoya, and Alice Caplier. Eyes Segmentation Applied to Gaze Direction and Vigilance Estimation. In ICAPR 2005.
[2] Sileye O. Ba, and Jean-Marc Odobez. Multiperson Visual Focus of Attention from Head Pose and Meeting Contextual Cues. IEEE Trans. on PAMI, 33(1), 2011.
[3] Kenneth Alberto Funes Mora and Jean-Marc Odobez. Gaze Estimation from Multimodal Kinect Data. In Face and Gesture, and Kinnect CVPR Workshop. 2012.
[4] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:software, technical report
Datum vypsn:2014-05-13




Nzev:Lip activity detector
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Oponent:
Popis:lip activity
Lip activity detector (also called speech activity detector) [1] is an algorithm which automatically identifies whether a person in a video speaks at a time. This task is important in audio-visual diarization problem [2,3], i.e. recognizing who speaks when, and in audio-visual cross modal identity recognition and learning. There are typical situations when multiple people is in a camera field of view and an audio signal is perceived. Then the question is who is speaking.

The speech activity detector can be visual only (based on observing the statistics of intensity variations in the mouth region), or audio-visual (which exploits the audio-visual synchrony between these modalities [4]). A basic study of these approaches is needed together with a detailed analysis of the impact of video resolution and a camera viewpoint. We will also provide a simple ground-truth annotated dataset containing examples of positive (speaking people) and negative (non-speaking, listening people) cases.

A code for precise localization of facial landmarks will be provided [5], and [6].

If this work is successful, the task can be naturally extended to a broader Audio-Visual digitization algorithm, which would integrate multiple audio-visual cues as e.g. video identity from face recognition, visual identity from clothing models, audio identity from voice recognition, direction estimate from a microphone array, etc. Therefore this topic can be chosen as a semestral, bachelor, or master project.

References

[1] K. C. van Bree. Design and realisation of an audiovisual speech activity detector. Technical Report PR-TN 2006/00169, Philips research Europe, 2006.
[2] Felicien Vallet, Slim Essid, and Jean Carrive. A Multimodal Approach to Speaker Diarization on TV Talk-Shows. IEEE Trans. on Multimedia, 15(3), 2013.
[3] Athanasios Noulas, Gwenn Englebienne, and Ben J.A. Kroese. Multimodal Speaker Diarization. IEEE Trans. on PAMI, 34(1), 2012.
[4] Einat Kidron, Yoav Y. Schechner, and Michael Elad. Pixels that sound. In CVPR, 2005.
[5] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
[6] M. Uricar, V. Franc and V. Hlavac, Detector of Facial Landmarks Learned by the Structured Output SVM. In VISAPP 2012. http://cmp.felk.cvut.cz/~uricamic/flandmark/
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:software, technical report
Datum vypsn:2014-05-13




Nzev:Lip reading
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Oponent:
Popis:faces
Lip reading (also called speech reading) is a ability to understand human speech by looking at mouth and lips, without actually hearing the audio. This ability is sometimes present at deaf people. There are evidences in literature that audio-visual speech recognition, i.e. a fusion of classical auditory and video recognition methods, can lead to improvement in speech recognition algorithms [1], especially in case of low quality audio or overlapping speech.

There are works that employs video channel to understand isolated spoken phrases, uttered digit, or simple commands, e.g. to control mobile devices or audio system in a car, [2,3].

First, the target will be the isolated word recognition. A design of a basic method, feature extraction, classifier, ground-truth experiment with emphasis on studying the effect of camera resolution, angle, and subject distance. We will provide a code for precise estimation of facial landmarks (nose tip, eye corners, mouth corners) from images or videos [4]. Then it should be straightforward to extract representative features from the mouth regions.

If the work is successful it can be further extended and integrated with automatic speech recognizers to disambiguate the overlapping speech. Therefore the topic can be chosen as semestral, bachelor, or master project.

The image is a reproduction from [1].

References

[1] Petr Cisar, Milos Zelezny. Using of Lip-Reading for Speech Recognition in Noisy Environments. In Speech Processing, 2003. http://musslap.zcu.cz/en/audio-visual-speech-recognition/
[2] Kate Saenko, Karen Livescu, Michael Siracusa, Kevin Wilson, James Glass, and Trevor Darrell. Visual Speech Recognition with Loosely Synchronized Feature Streams. In ICCV, 2005.
[3] Dana Segev, Yoav Y. Schechner, Michael Elad. Example-based Cross-Modal Denoising. In CVPR, 2012.
[4] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2014-05-13




Nzev:Range camera - stereo fusion
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Oponent:
Popis:faces

Recently range sensors, such as time-of-flight cameras, binary-coded range finders (MS Kinnect), has become broadly available. They provide reliable depth measurement for smooth textureless surfaces with enough reflectance, however their resolution is not outstanding. On the other hand classical stereo setup with HD cameras, provides high resolution depth maps, however has difficulties in textureless or repetitive patterns. Therefore, these sensors are complimentary and a fusion of them should gain higher quality results.

A classical work related to this topic is based on low resolution upsampling using a single high resolution intensity image [1], their code is available and should be used as a reference method. A basic stereo - time-of-flight camera fusion is proposed in [2]. A task of the candidate will be to calibrate the range sensor and the stereo rig together, then use the depth map to initialize the global sub-pixel stereo matching [3] and evaluate the results with respect to [1,2].

References

[1] J. Kopf, M.F. Cohen, D. Lischinski, M. Uyttendaele. Joint bilateral upsampling. In SIGGRAPH, 2007.
[2] Vineet Gandhi, Jan Cech, Radu Horaud. High-Resolution Depth Maps Based on TOF-Stereo Fusion. In Proc. ICRA, 2012.
[3] Jan Cech. Accurate and Robust Stereoscopic Matching in Efficient Algorithms. PhD Thesis. Department of Cybernetics, Faculty of Electrical Engeneering, Czech Technical University. June 16, 2009. (Chapter 4.4, pp. 47--50).

Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:software, technical report
Datum vypsn:2014-05-13




Nzev:Humanoid NAO, demonstran loha
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Vclav Hlav CSc.,RNDr. Daniel Pra Ph.D.
Oponent:Ing. Vojtch Franc, PhD.
Popis:==============
=NEAKTIVNI TEMA=
==============
(vypsano 2010)


V evropském projektu HUMAVIPS začínáme pracovat s humanoidním robotem NAO, http://www.aldebaran-robotics.com/en/ Cílem projektu pro čtyři až pět studentů je (a) seznámit se s robotem a jeho programovým aplikačním rozhraním, (b) navrhnout tři nové kognitivní demonstrační úlohy, které využijí schopnosti robotu vidět dvěma kamerami a slyšet dvěma mikrofony, (c) Vyzkoušet aplikační programové rozhraní pro výpočet přímo na počítačích v robotu i pro výpočet na vnějším počítači s komunikací s robotem přes WiFi, (d) implmentovat 3 kognitivní úlohy, (e) doplnit úlohy uživatelskou a programátorskou dokumentací (v angličtině).
Pokyny k vypracovn:Seznamte se s robotem NAO a jeho programováním.
Doporuen literatura:http://www.aldebaran-robotics.com/en/
Forma realizace:kd v C++, Pythonu
Datum vypsn:2010-02-11




Nzev:Metody detekce lid ve videosekvench
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Vclav Hlav CSc.,Doc. Ing. Karel Zimmermann Ph.D.
Oponent:Ing. Jan Touek., Neovision s.r.o.
Popis:==============
=NEAKTIVNI TEMA=
==============
(vypsano 2010)


V evropském projektu NIFTi (záchranná robotika) potřebujeme spolehlivé algoritmy pro detekci lidí ve videu. Studenti v projektu implementují několik vybraných algoritmů detekce lidí v C/C++ tak, aby mohly existovat jako samostatně exitující dynamické knihovny. Algoritmy v literatuře se zaměřují na stojící lidi. V záchranářském prostředí je potřebné detekovat i ležící, zasypané osoby. Lze využít jak jednu kameru, tak i stereo pár.
Pokyny k vypracovn:Poskytneme několik článků a případně zkušební matlabskou implementaci. Studenti mají vytvořit tým se strukturovanými rolemi podle zásad SW inženýrství. Kromě implementace a systematického testování studenti také mají výsledky projektu řádně dokumentovat v angličtině.
Doporuen literatura:Dodá vedoucí práce.
Forma realizace:kd v C/C++, uivatelsk a programov dokumentace
Datum vypsn:2010-02-11




Nzev:Aplikce rozpoznvn textu v obrazech.
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Oponent:
Popis:Práce naváže na oceněnou diplomovou práci [pdf][ konf. článek], jejíž výsledkem je špičkový detektor a rozpoznávací systém textů v obrazech.

Student si v projektu, bakalářské, či diplomové práci vybere některý směr rozvoje tohoto systému.
1. Z pomocí informací dostupných na WWW (google, Wiki) a případně GPS implementujte systém, který bude automaticky opravovat výstupy rozpoznávání (korekce adres, názvů ulic, obchodů)
2. Implementujte (např. pro mobilní telefon) aplikace pro automatický překlad. Rozpoznaný text je odeslán po souvisejících skupinách na stránku Google Translate a výsledek zobrazen v overlay-i obrázku
3. Aplikace vlastního nápadu

Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2010-10-10




Nzev:Automatick analza snmk z leteck archeologie
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Oponent:
Popis:Za příznivých klimatický podmínek se v leteckých a satelitních snímcích krajiny objevují jinak neviditelné stopy činnosti člověka, od doby neolitu až po současnost, např. poblíž hory Říp,
View Larger Map
Cílem diplomové práce je pomocí metod zpracování obrazu a strojového učení částečně automatizovat a zároveň zkvalitnit výsledky průzkumu. Práce se zaměří na některou z těchto úloh:
1. Optimální transformace mutlispektrálních snímků na základě strojového učení.
2. Automatické hledání struktur způsobených činností člověka.
Pokyny k vypracovn:
Doporuen literatura:Práci povedeme společně s Doc. Martinem Gojdou, který je předním odborníkem v oblasti letecké archeologie a má k dispozici velké množství dat. Ne jako domácí stránce je řada odkazů na literaturu, např. souhrn nálezu z let 1992-2003 .
Forma realizace:
Datum vypsn:2010-10-10




Nzev:Mobiln telefon jako dlkomr-hloubkomr-pravtko
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.,Doc. Mgr. Ondej Chum Ph.D.
Oponent:
Popis:Cílem práce je implementovat v mobilním telefonu aplikaci, která pomocí metod počítačového vidění umožní využití telefonu jako nástroje na měření velikostí a vzdáleností.
Pokyny k vypracovn:1. Seznamte se SW pro hledání korespondencí mezi obrazy a se potřebnými partiemi
počítačového viděni.
2. Seznamte se s knihovnou OpenCV pro operační systém Symbian.
3. Navrhněte uživatelské rozhraní aplikace.
4. Implementujte na mobilu dálkoměr-hloubkoměr-pravítko.
Jelikož se jedná o poměrně náročný projekt, mohou jednotlivé DP/BP/PMT řešit jen část
úlohy.l
Doporuen literatura:Hartley, Zisserman: Multiple View Geometry in Computer Vision Forsyth, Ponce: Computer Vision
Forma realizace:
Datum vypsn:2008-09-19




Nzev:Mobiln telefon jako dlkomr-hloubkomr-pravtko
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.,Doc. Mgr. Ondej Chum Ph.D.
Oponent:
Popis:Cílem práce je implementovat v mobilním telefonu aplikaci, která pomocí metod počítačového vidění umožní využití telefonu jako nástroje na měření velikostí a vzdáleností.
Pokyny k vypracovn:1. Seznamte se SW pro hledání korespondencí mezi obrazy a se potřebnými partiemi
počítačového viděni.
2. Seznamte se s knihovnou OpenCV pro operační systém Symbian.
3. Navrhněte uživatelské rozhraní aplikace.
4. Implementujte na mobilu dálkoměr-hloubkoměr-pravítko.
Jelikož se jedná o poměrně náročný projekt, mohou jednotlivé DP/BP/PMT řešit jen část
úlohy.l
Doporuen literatura:Hartley, Zisserman: Multiple View Geometry in Computer Vision Forsyth, Ponce: Computer Vision
Forma realizace:
Datum vypsn:2008-09-19




Nzev:Mobiln telefon jako dlkomr-hloubkomr-pravtko
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Oponent:
Popis:Cílem práce je (re)implementovat v mobilním telefonu aplikaci, která pomocí metod počítačového vidění umožní využití telefonu jako nástroje na měření velikostí a vzdáleností.
Pokyny k vypracovn:Cílem práce je (re)implementovat v mobilním telefonu aplikaci, která pomocí metod počítačového vidění umožní využití telefonu jako nástroje pro měření velikostí, vzdáleností, ploch a úhlů. (Neúplná) verze pro operační systém Windows Mobile již existuje. Výběr operačního systému po dohodě z vedoucím práce, preferuji Android a IPhone.

Úloha má dvě složky: vývoj uživatelského rozhraní a vývoj algoritmů počítačového vidění. Jelikož se jedná o poměrně náročný projekt, mohou jednotlivé DP/BP/PMT řešit jen některý podproblém.

Pokyny:
1. Seznamte s existujícím řešením na Windows Mobile vyvinutím pod vedením J. Matase,
2. Seznamte se řešeními, která jsou nabízena na App Store a na Google Store .
3. Kriticky jej zhodnoťte 1. a s přihlédnutím k 2. zvolte směry pro vylepšení.
4. Implementujte navržená vylepšení.
5. Vyhodnoťte vlastnosti programu: přesnost a rychlost, ale i snadnost použití a spokojenost uživatele.
Doporuen literatura:Literatura: Forsyth, Ponce: Computer Vision
Forma realizace:
Datum vypsn:2010-10-10




Nzev:Multimodal digital pathology
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Oponent:
Popis:(The work will be supervised with Dr. Vlad Popovici, popovici@iba.muni.cz)

The current methods in digital pathology try to model the human expert approach
for understanding the histopathology images and to propose a number of quantitative descriptors of the images. However, this approach provides a limited view on the underlying biology and will likely lag behind the human expertise in interpreting the histopathology image data for the foreseeable future.

On the other hand, nowadays a biological sample is characterized by a richer
set of features raging from clinical to molecular information. It is not uncommon to have whole-genome expression data, mutational and clinical data available for analysis.

In this context, the present project aims at combining gene expression, clinical
and imaging features to provide a more comprehensive description of the pathology slides, description that will rather complement than replace the usual pathologist assessment. This represents a paradigm shift in digital pathology and is expected to advance the current state of the art. Using gene expression data to guide the development, the project will create and implement novel software tools for histopathology image analysis. The utility of the resulting methods will be evaluated in collaboration with an expert pathologist.
Pokyny k vypracovn:Requirements: familiarity with image processing; Java; pattern recognition
Doporuen literatura:
Forma realizace:
Datum vypsn:2013-07-14




Nzev:Rozpoznn typu automobilu z jednoho snmku
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Oponent:
Popis:Cílem diplomové práce je navrhnout a ověřit metodu pro rozpoznávání typu automobilu z jednoho snímku, a to bez omezení na místo pohledu a osvětlení. Práce využije detektor lokálních afinních rámců, který je k dispozici v Centru strojového vnímání. Jádrem práce bude nalezeni reprezentace 3D objektu a návrh metody matchování modelu a lokálních rámců detekovaných v obraze.
Pokyny k vypracovn:Pasivní znalost angličtiny je nutná.
Doporuen literatura:Duda, Hart, Stork- Pattern Recognition
Forma realizace:
Datum vypsn:2007-01-03




Nzev:Rozpoznvn rostlin z obrzk (na mobilnm telefonu)
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Oponent:bude stanoven pozdeji
Popis:V rámci bakalářské práce se budete podílet na projektu jehož cílem je rozpoznávání rostlin, a to buď z fotografií listu, kůry, plodu, atd. V projektu se můžete zaměřit na řadu problémů, od vlastního rozpoznávání z fotografii, po vývoj aplikace na mobilním telefonu (uživatelské rozhraní) a pro webový server s přístupem ke sdílené databázi nasnímaných dat celou komunitou uživatelů. Dosavadní výsledky projektu jsou shrnuty na stránce http://cmp.felk.cvut.cz/~sulcmila/plants/.

Řešitelé budou mít po celou dobu projektu zapůjčen mobil s OS Android (Samsung Galaxy II nebo podobný)
Pokyny k vypracovn:Budou upřesněny dle zájmů studenta.
Doporuen literatura:http://cyber.felk.cvut.cz/research/theses/detail.phtml?id=153
Forma realizace:zle na zpesnn zadn
Datum vypsn:2012-03-15




Nzev:Modelovn prchodu svtla diamantem
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Vladimr Smutn Ph.D.
Oponent:Petr Prek
Popis:Pro analýzu výrobních vad a návrh změny technologie výroby je třeba rozumět jevům při průchodu světla broušeným kamenem, například diamantem. Problém má dvě stránky, jednak modelování (raytracing) průchodu světla počítačovým modelem, jednak analýza obrazu laserového paprsku po průchodu kamenem. První část je blízká počítačové grafice, druhý problém spadá do počítačového vidění.

broušené kameny

simulace světla v kameni
Pokyny k vypracovn:Seznamte se s programovým prostředím LADOK.
Navrhněte do prostředí nové moduly a proveďte fyzicky experimenty se skutečnými kameny.
Výsledky obou metod porovnejte a zhodnoťte.
Doporuen literatura:
Forma realizace:SW v matlabu, vzkumn zprva
Datum vypsn:2018-06-29




Nzev:Navigace autonomnho robotu ve vnitnm prosted
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Vladimr Smutn Ph.D.
Oponent:Pavel Krsek
Popis:Existuje mnoho akademických řešení navigace robotu například v továrně. Zároveň existují komerční řešení, která jsou ale buď příliš drahá nebo nejsou dostatečně flexibilní pro uživatele. Cílem je navrhnout metodu, která bude dostatečně flexibilní, mít nízkou cenu potřebného HW a zároveň bude vyžadovat jen minimální či žádné úpravy okolí.

V laboratoři algoritmy vyvíjíme za pomoci robotu Jackal (na obrázku) vybaveného kamerou, lidarem a dalším HW. Robot je řízen v prostředí ROS.

Možná temata zahrnují jak úlohy většího rozsahu, např. navigace za použití obrazu z kamery, tak středního rozsahu, jako implementace a doplňování alternativních metod plánování až po drobnější úlohy jako například rozšiřování možností komunikace robotu s okolím.

robot Jackal

autonomní robot
Pokyny k vypracovn:Seznamte se s požadavky s konkrétními aplikacemi a z toho vyplývajícími požadavky z praxe.
Prostudujte vhodné navigační algoritmy a příslušné senzory.
Navrhněte/vyberte vhodný algoritmus a implementujte ho na demonstračním mobilním robotu.
Výsledky zhodnoťte.
Doporuen literatura:https://www.ottomotors.com/ https://www.sick.com/cz/en/industries/industrial-vehicles/c/g288277 http://www.jbtc-agv.com/en/Solutions/Knowledge/Videos_of_AGVs_in_Action/Tugger_AGVs_for_Towing_Carts
Forma realizace:SW v matlabu, Pythonu, C/C++, ROSu, technick zprva
Datum vypsn:2018-06-29




Nzev:Pesn navigace autonomnho robotu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Vladimr Smutn Ph.D.
Oponent:Pavel Krsek
Popis:Existují člověkem řízené stroje, které vyžadují přesné navádění. Mezi jejich aplikace patří řezání drážek v betonu a asfaltu, nanášení vodorovného značení na silnice, parkoviště, podlahu továren a podobně. Cílem projektu je z manuálně řízeného stroje udělat autonomního robota. Přesnost navigace současných autonomních mobilních robotů většinou nedostačuje.
Cílem práce je navrhnout a experimentálně vyzkoušet metody navigace a řízení robotu, které jsou pro dané aplikace dostatečně přesné, zároveň ale v praxi použitelné.

značení vozovka

značení v hale

požadovaný výsledek

řezání asfaltu
Pokyny k vypracovn:Seznamte se s požadavky s konkrétními aplikacemi a z toho vyplývajícími požadavky z praxe.
Prostudujte vhodné navigační algoritmy a příslušné senzory.
Navrhněte/vyberte vhodný algoritmus a implementujte ho na demonstračním mobilním robotu.
Výsledky zhodnoťte.
Doporuen literatura:Dodá vedoucí práce
Forma realizace:SW v matlabu, C/C++, ROSu, exprimentln prce, vzkumn zprva
Datum vypsn:2018-06-29




Nzev:Chytr prohledvn videoobsahu - Smart Videobrowsing and Search
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis:Adaptivní lineární prediktory umožňují sledovaní objektu zájmu i při změně vzhledu. Vstupem je několik ukázek toho, jak by mohl objekt případně vypadat. Hlavní inteligence je skryta v procesu off-line učení vlastní sledovánní je pak extrémně efektivní. Existuje také prototyp automatické inicializace sledovače. Pro rutinní nasazení algoritmu je potřeba zrobustnit automatickou re-inicializaci a zefektivnit I/O operace přístupu k videosekvencím. Výstupem bude program, který automaticky indexuje, tj. přiřazuje popisky k jednotlivým video sekvencím.

Zájemci mohou přímo kontaktovat
vedoucího práce a domluvit si nezávaznou schůzku.
Pokyny k vypracovn:Seznamte se existujícími algoritmy a implementacemi [1,2]. Navrhněte vhodný algoritmus (re-)inicializace sledovače. Vytvořte efektivní rozhraní pro práci se velkým objemem dat, mnoha obrazy a video sekvencemi. Podle individuálních preferencí studenta lze klást důraz na různé aspekty celého zamýšleného SW řešení. Výsledek ověřte na reálných datech.
Doporuen literatura:[1] K. Zimmermann, J. Matas, and T. Svoboda. Tracking by an Optimal Sequence of Linear Predictors. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2008
[2] K. Zimmermann, T. Svoboda, J. Matas. Simultaneous learning of motion and appearance, ECCV 2008 Workshop on Machine Learning for Vision-based Motion Analysis
Forma realizace:Software, algoritmus pro inicializaci
Datum vypsn:2009-12-12




Nzev:Klasifikace siluet pro kognitivn multikamerov system
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Oponent:Dod vedouc prce
Popis: centru strojového vnímání se v současné době pracuje na projektu rozpoznávání činností/událostí z multikamerového systému. Nedílnou součástí je nalezení parametrů 3D artikulovaného modelu člověka (model skládající se z kloubově propojených rigidní částí). Vstupem algoritmu je multikamerová sekvence, ve které jsou segmentovány siluety člověka (metodou background separation). Výstupem jsou parametry modelu člověka (např. úhly mezi navazujícími rigidními částmi nebo jejich rozměry). Úloha je obvykle řešena minimalizací kriteriální funkce, která vyjadřuje překryv projekce modelu s obrazem v kamerách. Klíčovým problémem je, že přiřazení bodů k jendotlivým částem modelu není známo předem, což způsobuje mnoho lokálních minim kriteriální funkce a tím podstatně stěžuje její minimalizaci. Cílem práce diplomanta je popsat, implementovat a experimentálně ověřit inovativní způsob, který je založen na naučení množiny klasifikátorů, které předklasifikují body každé siluety a tak označí jejich příslušnost k rigidním částem artikulovaného modelu člověka. Takto definovaná úloha má téměř konvexní kriteriální funkci jejíž minimalizace je zvládnutelná běžnými gradientními metodami.

Více informací.

Pokyny k vypracovn:(1) Seznamte se s současným stave poznání.
(2) Popište a implmentujte metodu
(3) Experimentálně ověřte
Doporuen literatura:
Forma realizace:Implementace v MATLABu + dokumentace
Datum vypsn:2007-03-16




Nzev:Learnable predictors for detection and tracking in images and videos
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis:We will follow the idea of learnable predictors/detectors. Simply
speaking the principle is to collect a few training images and learn a
direct mapping between observations and parameters, e.g. motion. The
learning process explicitly optimizes the predictor complexity
w.r.t. predefined accuracy and operating range (basin of attraction)
The approach proved to be extremely efficient and robust for objects
whose appearance were available for off-line learning in advance. We
focus on paradigm person generic detector by appearance encoded
regression. The learning procedure will separate appearance variations
in unsupervised manner. The approach will allow for learning on few
class examples (people) and detection/tracking on the complete class
Pokyny k vypracovn:
Doporuen literatura:[1] K. Zimmermann, J. Matas, and T. Svoboda. Tracking by an Optimal Sequence of Linear Predictors. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2008
[2] K. Zimmermann, T. Svoboda, J. Matas. Simultaneous learning of motion and appearance, ECCV 2008 Workshop on Machine Learning for Vision-based Motion Analysis
Forma realizace:
Datum vypsn:2009-12-12




Nzev:Modelovn pohybu lovka pro kognitivn multikamerov systm
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:multicam_logo V centru strojového vnímání se v současné době pracuje na projektu rozpoznávání činností/událostí z multikamerového systému. Vzhledem k tomu, že není předem známo jaké objekty budou ve scéně vystupovat, je potřeba automaticky rozpoznat artikulovanou strukturu každého objektu. Navrhovaný systém by měl být limitně funkční i pro případ, kdy je scéna snímána pouze jednou kamerou.

Vzhledem k tomu, že je struktura objektu předem neznámá, není možné přímo sledovat pohyb jednotlivých rigidních částí. Cílem práce je navržení metody, která automaticky faktorizuje nezávisle se pohybující oblasti do shluků příslušejícím rigidním částem objektu na základě jejich pohybu v čase. Do takto faktorizováných dat vloží artikulovaný model, který nejlépe vysvětluje pozorovaná data.

Domácí stránka projektu.

Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2006-10-30




Nzev:Multimodal recognition of objects and victims
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis:
Center for Machine Perception, Department of Cybernetics, contributes to the EU project NIFTi by developing visual algorithms for object/victim detection and robot localization. Among many other sensors, The robot carries an omnidirectional camera, a thermo camera, rotating 3D lidar, and optionally also RGB-Depth sensor on board.

During a search and rescue mission the robot is expected to locate victims and objects and computer their positions in 3D. CMP developed several methods. The goal of this work is mainly robustifying algorithms by combinigng multiple data (thermal, visual, depth, ...)
Pokyny k vypracovn:Contact: Tomáš Svoboda http://cmp.felk.cvut.cz/~svoboda
Recommended courses: Computer Vision Methods, Pattern Recognition and Machine Learning, ...
Doporuen literatura:K. Zimmermann, D. Hurych, T. Svoboda. Exploiting Features -- Locally Interleaved Sequential Alignment for Object Detection. In 11th Asian Conference on Computer Vision - ACCV 2012
T. Petricek, T. Svoboda. Area-weighted Surface Normals for 3D Object Recognition. In 21st International Conference on Pattern Recognition - ICPR 2012
E. Derner. Car Detection on a Mobile Robot by Fusing Visual and 3D Lidar Data. BSc Thesis CTU--CMP--2012--10
Forma realizace:codes C/C++; Python
Datum vypsn:2013-04-04




Nzev:Nelinern a neinteraktivn pstup ke snmkm ve videu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis: Cílem práce je naprorgamovat rozhraní, které by umožnilo aplikacím přistup k libovolnému snímku ve videou. Indexem může být číslo snímku či časový údaj relativní k začátku či konci videa. Interaktivní střihové nástroje toto umožňují. Rozhraní by umožnilo takovýto přitup pro aplikace běžící například v Matlabu. Práce by přispěla k projektu na vyhledávání objektů či osob ve videu.

Zájemci mohou přímo kontaktovat
vedoucího práce a domluvit si nezávaznou schůzku.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2009-12-12




Nzev:pagemove plugin pro dokuwiki
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Ing. Jan Kreps
Oponent:
Popis:DokuWiki je souborově orientovaná Wiki pro kolaborativní přípravu webu. Používá ji také např. CourseWare. Základní možnosti značně rozšiřuje množství pluginů. Bohužel mezi funkčními pluginy zatím chybí pagemove/pagecopy plugin který by dovolil komfortní přesuny stránek i celých prostorů (adresářů) pro autentikovaného uživatele. Hlavní obtížnost spočívá ve spolehlivé opravě všech odkazů, které na stránky odkazují z jiných míst v dané dokuwiki. Existuje prototyp, který přesouvá jednotlivé stránky. V případě úspěchu bude mít práce velký praktický dopad a plugin se stane velmi pravděpodobně hodně populární.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW plugin do DokuWiki
Datum vypsn:2011-05-18




Nzev:Porovnn algoritm pro sledovn pohybujcch objekt
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis:multicam_logo Cílem práce je instalace volně dostupného balíku "Reading People
Tracker" a jeho kritické porovnání se současnou implementací CMP
trackeru. Aplikace poběží pod OS Linux.

Práce je součástí MultiCam_IS projektu na vývoj kognitivního
multikamerového systému.

Více informací
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2007-11-01




Nzev:PTZ virtuln kamera z vesmrovho obrazu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis: V současné době se v Centru Strojového vnímání pracuje na Evropském výzkumném projektu Nifti, ve které je budován robot pomáhající lidem při nebezpečných zachranných operacích, kde hrozí například nebezpečí výbuchu či kolapsu budovy. Robot bude (mimo jiné) vybaven panoramatickou kamerou Ladybug 3, která bude snímat 360 stupňů široké okolí, termo kamerou a 3D laserovým scanerem.

Robot bude částečně řízen vzdáleným operátorem. Ačkoli všesměrová kamera poskytuje maximální možnou visuální informaci o okolí robota, není přímo vhodná pro interaktivní spolupráci. Všesměrový obraz je jednoduš příliš vzdálen tomu, co vidí lidské oko. Navrhnětě vhodnou virtuální kameru, které bude používat všesměrová data, ale operátorovi je předloží ve vhodné formě, simulující klasickou perspektivu s variabilním zvětšením (zoom).
Pokyny k vypracovn:Kontakt: Tomáš Svoboda
Doporuen literatura:
Forma realizace:kod v C/C++
Datum vypsn:2010-10-15




Nzev:Robustn trackovn pznakovch oken rigidnch objektu pro 3D rekonstrukci
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:
Jedním z hlavních směrů v počítačovém vidění je automatická 3D rekonstrukce objektů. Její neopomenutelnou součástí je i nalezení korespondencí mezi jednotlivými obrazy a to v co nejhustším pokrytí. Jedním z možných způsobů je právě trackování příznakových oken ve videosekvenci zachycující objekt, který má být zrekonstruován.

Vstupem algoritmu by měla být výše zmíněná videosekvence a výstupem co nejv?tší počet korespondencí mezi každými dvěma obrazy. Narozdíl od úlohy obecného trackingu, v této úloze vzniká omezení plynoucí z rigidity rekonstruovaného objektu, které chceme využít. Je známo, že pohyb bodů ležících na rigidním objektu je po projekci svázán fundamentální maticí. Tj. pro všechny body musí existovat matice 3x3 o hodnosti 2 taková, že x_1*F*x_2=0. Výsledná rovnice trackingu musí zahrnovat toto omezení. Navrhujeme zkombinovat Kanade-Lucas-Tomasi (KLT) tracker s touto rovnicí což vede na 3x3 lineární systém.
Pokyny k vypracovn:(1) Implementujte KLT tracker v původní a výše popsané rozšířené formě.
(2) Výsledky experimentálně zpracujte a určete jaká zlepšení přináší omezení se na rigidní struktury.
Doporuen literatura:
Forma realizace:
Datum vypsn:2006-10-30




Nzev:Trackovn rigidnch st lovka pro kognitivn multikamerov systm
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:V centru strojového vnímání se v současné době pracuje na projektu rozpoznávání činností/událostí z multikamerového systému. Jedním ze slibných podproblémů celého projektu je real-time trackování 3D rigidních částí ze sterea 3dtracker.mpeg. Cílem úlohy je implementace real-time trackeru v jazyce C/C++, respektive mex-file (tj. funkce v C++ kompilovaná pro prostředí MATLAB). Vstupem do funkce je seznam 3D bodů a jejich barev, obraz a kalibrace kamer(y). Výstupem je translace a rotace těchto bodů nejvíce odpovídající pozorované skutečnosti (tj. jejich zpětná projekce do kamer minimalizující barevný rozdíl). Charakter práce je především implementační, funkční prototyp je již implementován v prostředí MATLAB. Student by měl mít alespon základní zkušenosti s programováním v C/C++.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:MEX funkce
Datum vypsn:2007-11-01




Nzev:Visual odometry (SLAM) from omnidirectional camera
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis: Center for Machine Perception, Department of Cybernetics, contributes to the EU project NIFTi by developing visual algorithms for object/victim detection and robot localization. Among many other sensors, The robot carries an omnidirectional camera on board.

On of the important taks is the robot localization in an unknown terrain. The goal of this work is to develop and implement a real-time robut method for visual based localization of the robot. The method will complement and robustifies the laser based mapping and robot odometry filtering
Pokyny k vypracovn:Contact: Tomáš Svoboda http://cmp.felk.cvut.cz/~svoboda
Recommended courses: Computer Vision Methods, Three-Dimensional Computer Vision
Doporuen literatura:F. Fraundorfer and D. Scaramuzza. Visual odometry : Part ii: Matching, robustness, optimization, and applications. Robotics Automation Magazine, IEEE, 19(2):78?90, June 2012.
Y. Ma, S. Soatto, J. Kosecka, and S.S. Sastry. An Invitation to 3-D Vision: From Images to Geometric Models, volume 26 of Interdisciplinary Applied Mathematics Series. Springer, New York, 2010
Forma realizace:code C/C++; Python
Datum vypsn:2013-03-29




Nzev:Automobil, kter vid kolem sebe
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Radim ra Dr. Tech.
Oponent:
Popis:Tato práce bude součástí aplikačního projektu interactIVe, ve kterém se vyvíjí systém asistující při řízení automobilu. Základním cílem naší části projektu je za jízdy měřit vzdálenost k okolním objektům pomocí standardní kamery umístěné na vozidle a rozpoznávat objekty v okolí vozidla. Takový senzor je velmi kompaktní a může nahradit dosud používané sonary, radary a rangefindery, jaké známe například z vozidel, které soutěžily na DARPA Grand Challenge. Možnost pracovat s obrazem dovoluje rozšířit funkci o "porozumění scéně", například o rozeznání chodce od pasivní překážky a o predikci jeho chování.

hloubkova-mapa

Zájemce bude bude součástí výzkumného týmu, v kterém se pracuje s metodami počítačového vidění, digitálního zpracování obrazu, sledování pohybu (tracking), odhadování vlastního pohybu z videosekvence a rozpoznávání objektů

Konkrétní téma práce bude upřesněno na základě vzájemných preferencí.

Dotazy na sara@cmp.felk.cvut.cz.
Pokyny k vypracovn:Bude upřesněno při zadání.
Doporuen literatura:
Forma realizace:bude upesnno pi vbru konkrtnho tmatu
Datum vypsn:2010-08-31




Nzev:Nvrh a realizace stereoskopickho zazen pro podporu testovn asistennch systm vozidel
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Radim ra Dr. Tech.
Oponent:
Popis:Jedná se o vývoj a realizaci nástroje, který umožní alternativně
měřit, vizualizovat a zaznamenávat polohy objektů v okolí vozidla při
jízdních zkouškách.

Na základě strereovidění se dvěma kamerami zájemce navrhne a realizuje
zařízení pro určování vzdáleností objektů v okolí vozidla v reálném
čase. Zařízení bude možné jednoduše zkalibrovat buď pomocí
referenčních obrazců nebo pomocí změření jeho polohy a úhlu na
instalovaném vozidle. Výstupem zařízení bude hloubková mapa okolí
vozidla (půdorys), latence systému bude do 200ms, rozhraní bude
ethernet, vytvoření komunikačního rozhraní a protokolu bude součástí
DP. Součástí DP bude také výběr vhodných kamer a systém jejich
synchronizace.

Zadání DP bude přizpůsobeno schopnostem studenta. Podrobnosti k
zadání možno získat u vedoucího práce.

Vedoucí práce je z Valeo Active Safety, R&D CDV Prague. Alternativně lze nejprve komunikovat s
garantem.

Ve firmě též možné získat stipendium na práci nesouvisející přímo s
diplomovým úkolem.

About Valeo:

Valeo is one of the biggest Tier-1 automotive components supplier
worldwide, active in various areas such as lighting systems,
powertrain systems, comfort systems, etc. In TCE Prague our work is
focussed on development of ADAS (Advanced Driver Assistance Systems)
and driving automation systems.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2014-12-12




Nzev:Analyza obrazu gelove elektroforezy
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Predmetem prace je zpracovani obrazku z gelove elektroforezy.
Ukolem je odstraneni sumu, detekce znacek odpovidajicich jednotlivym
soucastem smesi, automaticke odecitani jejich poloh, a automaticka
kompenzace geometrickeho zkresleni vznikleho nehomogenitou proudu.
Vysledkem bude jednoduse ovladatelny samostatny program pripadne
s program typu klient-server s ovladanim pres www.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2018-05-28




Nzev:Automatic nuchal translucency measurements
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Nuchal translucency is a diagnostics measurement performed on fetal ultrasound to determine certain abnormalities. The task is to perform this measurement automatically and reliably, by first assessing the correctness of the pose, identify the correct measurement spot, locally identifying the tissue boundaries and performing the measurement.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:sw projekt
Datum vypsn:2018-05-29




Nzev:Biomedical image analysis competitions
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:This is a meta-topic. The idea is to choose a  medical imaging-related task from either Grand Challenges or Kaggle competitions, solve it and submit a solution.  The advantage is that you get an feedback, how well your solution compares to the true state of the art. A motivated team should be able to meet the deadline and actually compete. An individual student might not be able to solve the problem in time to win anything but the comparison should still be possible.
Pokyny k vypracovn:
Doporuen literatura:https://grand-challenge.org/All_Challenges https://www.kaggle.com/
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Creation of 3D meshes for mechanical modeling from 3D medical data
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The task can be divided into several subtasks:
1. Automatic or semi-automatic tissue segmentation based on intensities and shape priors. The input are 3D volume data from MRI, CT, or ultrasound.
2. Creating a good quality triangular 2D mesh describing the surface.
3. Creating a good quality tetrahedral 3D mesh of the object interior.
4. Creating a GUI.
5. Practical example applications - visualizations or mechanical or electrical modeling.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-28




Nzev:Deep learning for 3D drosophila egg segmentation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The task is to detect and segment Drosophila eggs from microscopy images using deep learning (convolutional neural networks). The challenge is that the data are 3D and standard CNN methods cannot be used directly because of memory limitations in available GPU cards.
It is therefore necessary to find other methods or reimplement existing ones.

Pokyny k vypracovn:Recommended implementation languages are Python or Julia.
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Deep learning for automatic detection of multiple myeloma from CT images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic , Jan Hering Dipl.-Math.
Oponent:
Popis:The task is to develop a deep learning (convolutional neural network) method to detect multiple myeloma in 3D CT images of long bones, especially femurs. Several network architectures should be tried and the performance compared with a classical solution. The particularity is that only weak annotations are possible - we know whether a subject is healthy or not but a precise location of the lesion is not available. This leads to so-called multiple instance learning methods.

Recommended implementation languages are Python or Julia.
Pokyny k vypracovn:
Doporuen literatura:J. Hering, J. Kybic, and L. Lambert, “Detecting multiple myeloma via generalized multiple-instance learning,” SPIE Medical Imaging 2018, p. 22. F. Martínez-Martínez, J. Kybic, L. Lambert, and Z. Mecková, “Fully Automated Classification of Bone Marrow Infiltration in Low-Dose CT of Patients with Multiple Myeloma Based on Probabilistic Density Model and Supervised Learning,” Comput. Biol. Med., vol. 71, pp. 57–66, Apr. 2016.
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Deep learning for skin cancer classification
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Given a skin patch, (i) segment a lesion and (ii) determine, whether it is benign or malignant.
Several network architectures should be tried and the performance compared with a standard ABCD method. An additional task is to (iii) create a mobile phone or client/server application for the detection.
Pokyny k vypracovn:
Doporuen literatura:Esteva et al.: Dermatologist-level classification of skin cancer with deep neural networks, Nature, 2017 Fosu et al.: Mobile melanoma detection application for Android smart phones, NEBEC 2015
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Deep learning for tumor type classification from histopathological images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic , Jan Hering Dipl.-Math.
Oponent:
Popis:The input data are digitized microscopy histology slices of colorectal tissue, with manual or automatic segmentation of the cancerous tissue. The task is to develop a deep learning (convolutional neural network) method to distinguish different tumor types. Several network architectures should be tried and the performance  compared with a classical solution.
Pokyny k vypracovn:Recommended implementation languages are Python or Julia.
Doporuen literatura:
Forma realizace:
Datum vypsn:2018-05-29




Nzev:Digital histology microscopy image processing
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The input data are digitized microscopy histology slices, from e.g. colorectal or breast tissue. The tasks is to develop image processing algorithms for detection of tissue cells and their nuclei and evaluation of their shape, spatial distribution and other parameters. The next step is to use these parameters (aka features) to classify the tissue into tumor and healthy, and to distinguish between several tumor classes. Students will be able to compare their results with other authors in the frame of the CAMELYON challenge (https://camelyon17.grand-challenge.org)
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Efficient finding of nearest neighbors for binary vectors
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Binary keypoint descriptors, such as BRIEF or Boosting Binary Keypoint descriptors, are very compact and thus memory efficient. In the image matching task, keypoints are matched using their descriptors. The task is to find an efficient method for finding nearest neighbors for a given query binary vector and to compare it with alternative approaches, e.g. exhaustive comparison or a binary search.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:sw projekt
Datum vypsn:2018-05-29




Nzev:Fast sparse hierarchical B-spline interpolation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The task of interpolation from a sparse set of points is usually approached by using kriging, i.e. radial basis functions, or a uniform grid of basis functions such as B-splines. To get the best of both worlds, we will attempt to use a sparse set of B-splines are various scales. The non-zero B-splines to be used should be determined automatically. The task is to develop an efficient algorithm for calculating the spline coefficients and to compare this method with alternatives.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:sw projekt
Datum vypsn:2018-05-29




Nzev:Finding objects of known shapes from oversegmentation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The task is to segment an object with clear edges and of approximately known shape, where the shape is described by statistics over some shape descriptors, e.g. moments. We suggest a method which starts by oversegmentating the image into superpixels and then tries to find a  compact subset of the superpixels which corresponds to the shape model. We shall try to find efficient algorithms for this task.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:From pairwise image registration to sequence image registration
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The task is to align a sequence of N images onto a common reference. It is possible to register all images simultaneously, or all possible N^2 pairs but it is very computationally expensive. On the other hand, it is enough to register N-1 pairs and compose the transformations, which is fast but may lead to suboptimal accuracy. We shall (theoretically and practically) explore various ways of choosing the subsets of image pairs to register and how to estimate the individual deformations.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Functional MRI of hypercapnia data
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Hypercapnia is a condition of increased presence of carbon dioxide in the
blood. Normal reaction of brain to this condition is vessel dilation that will
increase the blood flow in the brain in order to compensate for the decreased
presence of oxygen in blood. This processes can be monitored over time using a
special MRI sequence called BOLD. The BOLD sequence is sensitive to the level
of oxygen in blood and increased oxygen concentration shows as increased signal
in the images. Hypercapnia BOLD imaging can used to study the vasoreactivy
of vessels to the fluctuating level of carbon dioxide in blood. It can be used
to identify brain regions with non-standard reaction and as such to identify
problematic vessels that may contain stenos or some other vascular pathology.
The hypercapnia is usually induced by letting the subjects breath air with
increased carbon dioxide concentrations during MRI examination. In our data,
we have used several periods of controlled breatholds which is more convenient
for use in clinical practice. This, however, brings additional issues in data
evaluation as the patients are not always capable to dutifully follow the protocol.
The aim of this thesis is to evaluate clinical data from 50+ patients obtained
during one or more sessions. The brain of each patient is supposed to contain
normal regions and it may contain also pathological regions. The time course
of BOLD signal in each patient needs to be examined first to identify what is
the normal reaction for each patient (as being close to the expected response).
Subsequently, the whole brain of each patient needs to be studied to identify if
there are regions with no reaction and with pathological reaction. The result
of the automatic analysis of the hypercapnia fMRI data will be compared with
clinical findings and the sensitivity and specificity of the automatic method and
the BOLD examination will be assessed.
Data and clinical findings will be supplied by University hospital in Dresden.
The results will be evaluated in close collaboration with medical doctors from
the hospital. The aplicant is expected to visit Dresden regularly.

The applicant is expected to be fluent in English and have good
programming skills in Matlab. Willingness to learn basic
principles of fMRI and BOLD imaging as well as to learn the basic
medical background of the problem is expected.

[In collaboration with Mgr. Jan Petr, Ph.D.]
Pokyny k vypracovn:1. Learn the principles of functional MR imaging and data processing.

2. Design and implement a method for evaluation of hypercapnia sequences, to distinguish between normal and pathological regions.

3. Experimentally evaluate the developed method on provided clinical data.
Doporuen literatura:-Bernstein, King, Zhou: Handbook of MRI pulse sequences. -McRobbie, Moore, Graves, Prince: MRI From picture to proton. -U. S. Yezhuvath, K. Lewis-Amezcua, R. Varghese, G. Xiao, and H. Lu, “On the assessment of cerebrovascular reactivity using hypercapnia BOLD MRI.,” NMR in biomedicine, vol. 22, no. 7, pp. 779–86, Aug. 2009.
Forma realizace:kod v Matlabu, vysledky experimentu
Datum vypsn:2018-05-28




Nzev:Learning multilayer classifiers with weak annotations
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:This topic is similar to deep learning but without neural networks. We chain several classifiers together - for example the first one will do a pixel-wise segmentations and the second will evaluate the shape of the detected objects. The challenge is to train all classifiers in the chain when training data is only available for the final output - a so-called weak labels. We shall start by simulating several simple cases, gradually moving towards a practical method.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW project, theoretical analysis
Datum vypsn:2018-05-29




Nzev:Lung nodule analysis from time series
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Lung nodules are tissue masses in the lungs, which may be cancerous. A malignant nodule will grow quickly in time, so it is helpful to compare its image from several time points. A method should be developed to detect nodules, match them across acquisition, and evaluate their growth.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Magnetic particle imaging - using automatically calibrated test targets
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Magnetic particle imaging is a recent imaging techniques, which can visualized tiny magnetic particles with high spatial resolution. The bottleneck is the calibration, which is currently performed by moving a point target around the acquisition region. The calibration can be speeded up by using several targets, with known spatial structure. We shall attempt to develop an algorithm which could at the same time identify the spatial structure of the calibration target and the motion of the pattern, simplifying the procedure considerably.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:sw projekt
Datum vypsn:2018-05-29




Nzev:Markov chain Monte Carlo segmentation for fitting geometrical model
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Some objects have internal structure - they contain subobjects with a particular geometric relationship. To segment such objects, Markov chain Monte Carlo (MCMC) methods can be used to generate data-driven hypotheses with statistical shape priors. We shall explore methods of this type, first on synthetic data and then to segment real structured objects such as Drosophila eggs, which are known to contain 15 so-called nurse cells. A particular attention will be paid to MCMC efficiency.
Pokyny k vypracovn:
Doporuen literatura:Erdil et al: MCMC Shape Sampling for Image Segmentation with Nonparametric Shape Priors. CVPR 2016
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Piecewise registration for histological slices
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:When histological specimen is cut into thin slices for subsequent microscopy images, the slice can be broken into several pieces. A specialized image registration algorithm should be developed, which allows very large and uncorrelated displacement of the pieces and much more constrained movement within the pieces.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2018-05-29




Nzev:Registration of ophthalmological sequences
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:The task is to develop an algorithm for motion compensation of ophthalmological sequences. The task is challenging because the motion is not smooth in time and because there are artifacts due to illumination.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2018-05-29




Nzev:Segmentation and joint-segmentation of aorta from histological and ultrasound images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic , Jan Hering Dipl.-Math.
Oponent:
Popis:We have a dataset of ex vivo ultrasound and histological images of the aorta. The final task is to non-invasively detect arteriosclerosis and its prognosis. Current image processing tasks include:

1. Identifying the lumen and different tissue types (including plaques) in the histological images

2. Identifying the lumen and hopefully also other tissue types in the ultrasound images.

3. Reconstruct 3D volumes and spatially register microscopy and ultrasound data.

4. Joint segmentation of the ultrasound and histological images.

5. Image-based classification of the disease from both the microscopical and ultrasound data.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Thickness measurement from ultrasound RF images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:For applications such as arteriosclerosis detection, it is interesting to estimate thickness of layers in the blood vessel walls. However, the limited spatial resolution from a standard B-mode image does not allow sufficient accuracy. Processing directly the raw RF signal should enable a better accuracy. This work is a combination of practical experiments with a portable ultrasound machine and implementation of signal processing algorithms.
Pokyny k vypracovn:
Doporuen literatura:Shung, Smith, Tsui: Principles of Medical Imaging. Academic Press, 1992. Angelsen. Ultrasound Imaging. Emantec, 2000
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Ultrasound vessel wall texture classification
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Analyze ultrasound images and sequences of carotid arteries to extract the layer thickness, motion and texture of the vessel wall from in-vivo ultrasound images in an attempt to detect and distinguish different types of arteriosclerosis. This is an exploratory work, the challenge is the limited spatial resolution of the ultrasound.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2018-05-29




Nzev:Unsupervised joint segmentation of two images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Given two images of the same scene but from different modalities, the task is to find their common segmentation. This problem is encountered for example in multimodality imaging, or as a subtask of iterative segmentation/registration. One possible formulation is that we want to approximate as well ass possible the target image using a segmentation and an appearance model for each class. We shall study various variations of this idea, e.g. how the approximation quality should be measured and how the resulting optimization should be performed.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:sw projekt
Datum vypsn:2018-05-29




Nzev:Web based infrastructure for image processing and analysis
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Oponent:
Popis:Develop a modular web-based software system for image processing and analysis. The idea is that clients, e.g. clinicians, would not need to install any special software to use our image processing algorithms, and would use a web browser instead. Image processing modules will run on a server as a web service and can be written in a variety of programming languages (Python, Matlab, C, Julia,...). It should be easy to plug-in existing tools such as ImageJ(Fiji), or Ilastik. Clients will connect using their web browser and will be able to have their images processed. The web client should also support efficient annotations, i.e. manual labeling and segmentation. The system should support large number of large images, images in both 2D and 3D remote image servers, including DICOM servers.


The project may be based on extending existing similar systems such as Bisque (http://bioimage.ucsb.edu/bisque) or Omero (https://www.openmicroscopy.org/omero/).
Pokyny k vypracovn:The exact scope of the project will be determined based on the interests of the student/team.
Doporuen literatura:Bisque (http://bioimage.ucsb.edu/bisque) Omero (https://www.openmicroscopy.org/omero/) Antonelli et al: Design and Implementation of Web-Based Systems for Image Segmentation and CBIR. IEEE Trans. Instrum. Meas., 2006
Forma realizace:SW projekt
Datum vypsn:2018-05-29




Nzev:Action recognition in long videos
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:The millions of cameras that are deployed every year generate a large amount of recorded, stored and transmitted video. In particular, a large proportion of this video depicts events about people, their activities, and behaviors. In order to effectively interpret this data, computer vision algorithms need the ability to understand and recognize human actions.

Web skolitele: http://cmp.felk.cvut.cz/~zimmerk/

Preffered qualification:
- B or better result achieved in a programming oriented subject or even better: the active participation in a programming competition (e.g. CTU Open Contest, ACM ICPC).
- B or better result achieved in a computer vision oriented subject.
- experience with Python and Tensorflow
- good mathemathical background.
Pokyny k vypracovn:(1) Study state-of-the-art methods and publicly available implementations [1,2]
(2) Propose you own method.
Doporuen literatura:[1] http://vision.stanford.edu/pdf/buch2017cvpr.pdf [2] https://arxiv.org/pdf/1511.06984.pdf
Forma realizace:
Datum vypsn:2017-10-10




Nzev:Automatick vyhodnocovn algoritm potaovho vidn
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:Nedílnou součástí výzkumu algoritmů počítačového vidění je schopnost
rychle a automaticky vyhodnocovat výsledky. To vyžaduje (i) tzv ground
truth, tj. obrazová data opatřená znalostí pravdy (např. přítomnost
objektů na daných pozicích pro úlohu detekce) a (ii) metriku
popisující kvalitu výsledků. Získávání ground truth je časově velmi
náročné proto se často volí poloautomatická metoda, kdy člověk pouze
opravuje/doplňuje automaticky pořízené výsledky. Vhodné měření kvality
výsledků je také netriviální problém, například vyhodnocování kvality
algoritmu pro detekci a sledování mnoha podobných objektů (např. lidí
ve videosekvenci) může měřit počet záměn trajektorií, počet
nenalezených objektů či počet falešných detekcí.

Navrhněte vhodnou metriku pro měření kvality algoritmů detekce
sledování a vhodnou metodu pro získávání ground truth. Řešemí
naimplementujte nejlépe v prostředí MATLAB.
Pokyny k vypracovn:Nastudujte metody automatického vyhodnocování např. [1]. Navrhněte vhodnou metriku pro měření kvality algoritmů detekce sledování a vhodnou metodu pro poloautomatické získávání ground truth. Řešení naimplementujte nejlépe v prostředí MATLAB.
Doporuen literatura:[1] Keni Bernardin and Rainer Stiefelhagen, Evaluating Multiple Object Tracking Performance: The CLEAR MOT Metrics, EURASIP Journal on Image and Video Processing Volume 2008
Forma realizace:kod v matlabu
Datum vypsn:2010-05-28




Nzev:Autonomn zen robotu na nestrukturovanm ternu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:V Centru Strojového Vnímaní (CMP) na Katedře Kybernetiky vyvíjíme v rámci Evropského projektu TRADR robota záchranáře (http://cmp.felk.cvut.cz/demos/robotics/mobile-robots). Jednou z důležitých funkcionalit je autonomní řízení robotu a odhad tvaru přejížděného terénu (a to i v případě kdy lidar selhává např. kvůli hustému kouři, či velké odrazivosti povrchu). Znalost terénu umožňuje autonomní prediktivní řízení fliperů. Navrhněte a prakticky ověřte algoritmus pro autonomní mapování a řízení robotu na nestrukturovaném terénu.





Web skolitele: http://cmp.felk.cvut.cz/~zimmerk/

Preffered qualification:
- B or better result achieved in a programming oriented subject or even better: the active participation in a programming competition (e.g. CTU Open Contest, ACM ICPC).
- B or better result achieved in a computer vision oriented subject.
- experience with Python and Tensorflow
- good mathemathical background.
Pokyny k vypracovn:(1) Study state-of-the-art methods such as [1,2].
(2) Propose and implement you own algorithm.
(3) Evaluate proposed method on a selected dataset such as [3].
Doporuen literatura:[1] Sergey Levine, Chelsea Finn, Trevor Darrell, and Pieter Abbeel. 2016. End-to-end training of deep visuomotor policies JMLR, 2017, https://arxiv.org/pdf/1504.00702.pdf [2] Ziyu Wang, Josh Merel, Scott Reed, Greg Wayne, Nando de Freitas, Nicolas Heess, Robust Imitation of Diverse Behaviors https://arxiv.org/pdf/1707.02747.pdf [3] Lei Tai, and Giuseppe Paolo and Ming Liu2, Virtual-to-real Deep Reinforcement Learning: Continuous Control of Mobile Robots for Mapless Navigation https://arxiv.org/pdf/1703.00420.pdf [4] Kostantinos Bousmalis, Nathan Silberman, David Dohan, Dumitru Erhan, Dilip Krishnan, Unsupervised Pixel–Level Domain Adaptation with Generative Adversarial Networks https://arxiv.org/pdf/1612.05424.pdf
Forma realizace:Implementace v simultoru + reln expriment v ternu
Datum vypsn:2017-10-10




Nzev:Kalibrace kamery a 3D laserovho scaneru pro robota zchrane
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.,Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis: V současné době se v Centru Strojového vnímání pracuje na Evropském výzkumném projektu Nifti, ve které je budován robot pomáhající lidem při nebezpečných zachranných operacích, kde hrozí například nebezpečí výbuchu či kolapsu budovy. Robot bude (mimo jiné) vybaven panoramatickou kamerou Ladybug 3, která bude snímat 360 stupňů široké okolí, termo kamerou a 3D laserovým scanerem.

Jednou z důležitých úloh je umísťování objektů nalezených v kamerách do online budované 3D mapy prouzkoumavaného světa získaného laserovým scanerem. Navrhněte a naimplementujte algoritmus umožňující přenášet objekty z prostoru kamer do 3D mapy (tj. kalibrace mezi kamerou a scanerem). Algoritmus navrhněte v prostředí MATLAB/C++.
Pokyny k vypracovn:
Doporuen literatura:dodá vedoucí
Forma realizace:kod v C++/MATLABu
Datum vypsn:2010-05-28




Nzev:Sledovn objektu ve 3D pro virtuln realitu.
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.,Doc. Ing. Tom Svoboda Ph.D.
Oponent:
Popis:Jedním ze slibných podproblémů projektu, na kterém se nyní pracuje v Centru Strojového Vnímání (CMP), je real-time trackování (např. cd_box nebo human_head) ve 3D prostoru z jedné či více kamer. V současné době se ukazuje, že trackování opakovanou detekcí dobře odlišitelných (též významných) bodů je nejrobustnější řešení, které je současně i efektivní. Cílem práce je implementace trackeru používajícího předem naučený geometrický model spolu s "přilepenými" význačnými body. Algoritmus v příchozím obrázku z kamery nejdříve detekuje význačné body a z určených korespondencí mezi obrazem a modelem určí pozici sledovaného objektu.

Případný zájemce může přímo kontaktovat vedoucího práce Karla Zimmermanna zimmerk@cmp.felk.cvut.cz. Literatura bude poskytnuta.


Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2007-11-01




Nzev:Sledovn vce objekt v multikamerovm systmu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:



V současné době v Centru Strojového Vnímání pracujeme na multikamerovém projektu, jehož nedílnou součástí je sledování několika nezávislých objektů. Cílem práce je navrhnout a implementovat systém, který je schopen zpracovat informaci z více kamer najednou a v reálném čase detekovat a případně sledovat objekty v zorném poli kamer. Modul pro snímání a segmentaci pohybujících se objektů v jednotlivých kamerách je k dispozici. Programování v C++ pod Linuxem a/nebo v MATLABu.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2007-10-31




Nzev:Detektor oblasti zaujmu pre hladanie korespondencii
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Michal Peroch Ph.D.,Prof. Ing. Ji Matas Dr.
Oponent:
Popis:Detekcia oblasti zaujmu je prvym krokom riesenia ulohy najdenia korespondencii medzi obrazkami. Sucasne detektory su uspesne pri hladani oblasti pre triedu kontrastnych scen s vyraznymi strukturami v obraze. Stale sa vsak hladaju nove metody ktore by triedu rozsirili.
Pokyny k vypracovn:Vasou ulohou bude prestudovat pracu [1], naimplementovat popisovanu metodu a experimentalne overit jej pouzitelnost pri hladani korespondencii. Na uspesne zvladnutie ulohy je potrebna znalost programovania v C,C++ a Matlabe.
Doporuen literatura:[1] http://www.cs.washington.edu/homes/shapiro/cvpr07final.pdf
Forma realizace:Kod v matlabu a MEX moduly.
Datum vypsn:2007-10-30




Nzev:Spolahliva detekcia kontury pre rozpoznavanie a segmentaciu objektov
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Michal Peroch Ph.D.,Prof. Ing. Ji Matas Dr.
Oponent:
Popis:Tvar je dolezitou vizualnou charakteristikou pre rozpoznavanie, segmentaciu objektov v obraze, resp. obecne pre porozumenie 3D struktury sceny. Vyuzitie informacii o tvare vsak vyzaduje spolahlivu metodu detekcie hranic objektov, co je samo o sebe zlozita uloha. Jednym z perspektivnych pristupov [1] je vyuzitie videa pre najdenie kontury objektu. V tejto metode je pre kazdy rozpoznavany objekt v dispozicii kratka sekvencia zachytavajuca pohyb kamery okolo objektu. Tato informacia je pouzita pre zvysenie spolahlivosti detekcie kontury objektu.
Pokyny k vypracovn:Prestudujte si pracu [1], implementujte detektor tvaru objektu a porovnajte vystup so standardnym hranovym detektorom. Pouzite standardnu metodu pre popis tvaru a experimentalne overte pouzitelnost metody pre rozpoznavanie objektov. Pre uspesne zvladnutie ulohy je potrebna znalost programovania v C,C++ a Matlabe.
Doporuen literatura:[1] http://www.ri.cmu.edu/pub_files/pub4/stein_andrew_2007_2/stein_andrew_2007_2.pdf
Forma realizace:Kod v matlabu s modulmi MEX
Datum vypsn:2007-10-30




Nzev:Curling Simulator
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Oponent:
Popis:

Curling Simulator je systém, který umožní hrát obdobu curlingu v omezeném prostoru bez ledu. Situace na virtuálním hřišti bude promítána projektorem na svislou plochu nebo zobrazena na monitoru. Hráč vyšle kámen (např. upravenou hračku - auto) po podlaze nebo po stole, vstříct obrazu virtuálního hřiště, po ujetí určité trajektorie se kámen zastaví o překážku. Na základě sledování z několika kamer (pro snížení pravděpodobnosti zákrytu a přesnější lokalizaci) bude vypočtena pozice a dráha kamene v prostoru. Pomocí dráhy a rychlosti skutečného kamene bude simulován pohyb virtuálního kamene na virtuálním hřišti, včetně případných srážek s již zahranými virtuálními kameny. Sledování a simulace nemusí nutně proběhnout "online", průběh vrhu může být zobrazen s určitým zpožděním.

MoĹžnĂŠ podĂşkoly v tomto projektu:


  • sledovĂĄnĂ­ rigidnĂ­ho objektu v jednĂŠ kameře
  • sloučenĂ­ informace z vĂ­ce kamer a vĂ˝počet pozice objektu v prostoru
  • fyzikĂĄlnĂ­ model pro pohyb a srĂĄĹžky virtuĂĄlnĂ­ch kamenĹŻ
  • rozmĂ­stěnĂ­ kamer pro optimĂĄlnĂ­ sledovĂĄnĂ­
  • zobrazenĂ­ virtuĂĄlnĂ­ho hřiĹĄtě
  • nĂĄvrh a konstrukce kamene a hracĂ­ho prostoru
  • automatickĂĄ kalibrace kamer bez speciĂĄlnĂ­ho kalibračnĂ­ho objektu
  • vzĂĄjemnĂĄ kalibrace kamer a zobrazovacĂ­ho systĂŠmu
  • vyhodnocenĂ­ stavu, implementace umělĂŠho soupeře
  • automatickĂŠ vytvořenĂ­ zkrĂĄcenĂŠho zĂĄznamu hry

Zadání bude dohodnuto na začátku projektu, v něm bude výše uvedené funkce rozděleny na nezbytné a volitelné. Pro některé bude možné využít existující kód vzniklý v projektu MultiCam.

Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2006-12-18




Nzev:Vyhodnocen rozvren stihu ve vcekamerov sekvenci
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Oponent:
Popis:

Chceme-li někomu prezentovat video z vícekamerového systému, narážíme na problém, že člověk není schopen sledovat obraz z většího množství pohledů současně. Je tedy vhodné ukázat vždy jen ten pohled, který nejlépe podá informaci o tom, co se ve scéně odehrává - tak to dělá např. režisér přímého televizního přenosu.

K dispozici je několik metod pro rozvržení střihu, hlavním úkolem práce je návrh metody pro automatické vyhodnocení výsledků na základě vzorového řešení rozmístění střihu provedeného člověkem. Druhým krokem je využití vytvořeného vzorového řešení pro optimalizaci parametrů metody rozvržení střihu pomocí strojového učení.

Předchozí DP. Téma je součástí projektu Multicam.

Pokyny k vypracovn:
Doporuen literatura:Cinematographic Rules Applied to a Camera Network. P. Doubek, I. Geys, T. Svoboda, L. Van Gool. Omnivis 2004.
Forma realizace:
Datum vypsn:2008-02-13




Nzev:Rolling shutter benchmark
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:RNDr. Zuzana Kkelov Ph.D.
Oponent:
Popis:CMOS sensors that are used in vast majority of today’s consumer cameras, smartphones etc. use the rolling shutter (RS) mechanism to capture images. The key difference is that with the global shutter, the entire image is exposed to the light at once, whereas when using the RS the individual image rows (or columns) are captured at different times. When a RS camera moves while capturing the image, several types of distortion such as smear, skew or wobble appear. A perspective camera model is no longer valid in this case and that can be a problem when using methods assuming this model.
Recently several algorithms for calibrating RS cameras have been proposed. These algorithms are usually evaluated on a very limited set of images (videos) without a ground truth. While there exist many benchmark datasets with ground truth camera calibrations and positions for perspective cameras, such datasets for RS cameras are still missing. The goal of this project is to create a benchmark dataset for RS cameras. The student/students will collect images/videos for different camera setups (a single RS camera, a stereo rig, two cameras with different rolling shutter directions or different frame rates, different types of camera movements (translations, rotations) during the image exposure….). Ground truth calibrations will be obtained using standard calibration methods, using a global shutter camera, and a controlled motion.
For bachelor/master thesis the student will evaluate different state-of-the-art methods for RS calibration on the new proposed dataset. Based on the obtained results, the student will try to address challenging configurations (degenerate configurations) for different RS models.
Pokyny k vypracovn:Requirements: Matlab, basic knowledge of calibration procedures
Doporuen literatura:
Forma realizace:
Datum vypsn:2018-05-27




Nzev:Vvoj fotografick aplikace klient-server pro chytr telefon
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Roman Sejkot ,Doc. Ing. Radim ra Dr. Tech.
Oponent:
Popis:Vytvořte podporu pro existující mobilní aplikaci typu klient-server, která sejme fotografii, pošle ji na server a na základě shody obrazu s databází zobrazí informaci v klientu (na obrazovce chytrého telefonu). V tomto projektu půjde zejména o to, vytvořit editor XML souboru v existující struktuře a překladač na binární soubor pro serverovou aplikaci. XML soubor reprezentuje strukturu objektů ve světě a překlad je nutný z důvodů efektivity načtení reprezentace na serveru. Editor může být založen na existující aplikaci a upraven podle potřeb projektu. Projekt má potenciál k pokračování na bakalářské práci při vývoji aplikace s klientem na platformě Android nebo iOS a serverem na infrastruktuře fakulty.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:
Datum vypsn:2015-10-01




Nzev:Rozpoznvn chemickch rovnic s pouitm neuronovch st a gramatik
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:RNDr. Daniel Pra Ph.D.
Oponent:
Popis:Cílem práce je návrh a implementace systému pro automatické rozpoznávání chemických rovnic v rastrovém obrázku, za předpokladu, že na obrázku je oskenovaná tištěná chemická rovnice. Prostředky pro realizaci systému jsou neuronové sítě a parser gramatiky popisující strukturu chemické rovnice.
Pokyny k vypracovn:1. Nastudujte strukturu základních chemických rovnic. Navrhněte pro jejich popis speciální gramatiku, která pracuje s terminály různých velikostí rozmístěnými v rovině. Vyjděte z již existující gramatiky [2].
2. Implementujte automatické generování trénovacích dat na základě navržené gramatiky.
3. Natrénujte neuronovou síť [1] pro rozpoznávání elementárních symbolů v daném obrázku.
4. Navrhněte a implementujte parser pro gramatiku, který pro množinu elementárních symbolů rozpozná strukturu reprezentované chemické rovnice.

Předpoklady: Python, C++, předmět Jazyky, automaty a gramatiky (A4B01JAG) nebo jeho ekvivalent.
Doporuen literatura:[1] YOLO - Detektor objektů v reálném čase, https://pjreddie.com/darknet/yolo/ [2] K. Nevolová: Online rozpoznávání chemických vzorců a rovnic, diplomová práce, MFF UK, 2016, https://is.cuni.cz/webapps/zzp/detail/115272/ [3] J.E. Hopcroft. R. Motwani, J.D. Ullman: Introduction to Automata Theory, Languages and Computation, Third Edition, Addison-Wesley, 2006
Forma realizace:
Datum vypsn:2018-05-25




Nzev:Langerhans islet counting from microscopy images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan vihlk Ph.D.
Oponent:
Popis:Evaluation of images of Langerhans islets is a crucial procedure for
planning an islet transplantation which is a promising diabetes treatment. This project deals with implementation of plugin for ImageJ software enabling an evaluation of images of Langerhans islets.
Pokyny k vypracovn:Subtasks:

- image segmentation into two classes (islet, background) using several classifiers (e.g. SVM, linear classifier)
- implementation of method serving for estimation of segmentation quality
- implementation of methods serving for estimation of quantitative islet parameters and their export to xls file
- implementation of user friendly graphical user interface
- creation of documentation in Latex typesetting software
Doporuen literatura:[1] Schlesinger, M. I. and Hlavac, V., [Ten Lectures on Statistical and Structural Pattern Recognition], Springer Netherlands, first ed. (2002). [2] Friberg, A. S., "Quanti cation of the islet product: Presentation of a standardized current good manufacturing practices compliant system with minimal variability," Transplantation 91(6), 677-683 (2011). [3] http://rsbweb.nih.gov/ij/
Forma realizace:Software, Plugin for ImageJ
Datum vypsn:2014-02-11




Nzev:Deep learning for automatic detection of multiple myeloma in CT of femurs
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc: Jan Hering Dipl.-Math.
Oponent:
Popis:The diagnostics of multiple myeloma (a type of bone marrow cancer) uses blood plasma tests as well as CT images of large bones (femurs in this case). From the methodical point of view, these data represent a situation to be found more often in next years -- we don't have fully annotated images at voxel level, since this work is very time consuming, but are provided only with a 'global' label (healthy / diseased), which comes naturally from the diagnosis. By means of Multiple-Instance Learning (MIL) we are able to reach reasonable precision in the classification.

However, the interesting question how a deep-learning system will perform is still without answer. The aim of this work is to implement a selected CNN architecture, or to compare multiple architectures, and evaluate it's performance against the current system.


This work thus brings the opportunity to learn more about the newest methods in machine learning, to improve own programming skills as well as to get in touch with the field of medical imaging and computer assisted diagnosis.
Pokyny k vypracovn:
Doporuen literatura:[1] J. Hering, J. Kybic, and L. Lambert, “Detecting multiple myeloma via generalized multiple-instance learning,” SPIE Medical Imaging 2018, p. 22. [2] F. Martínez-Martínez, J. Kybic, L. Lambert, and Z. Mecková, “Fully Automated Classification of Bone Marrow Infiltration in Low-Dose CT of Patients with Multiple Myeloma Based on Probabilistic Density Model and Supervised Learning,” Comput. Biol. Med., vol. 71, pp. 57–66, Apr. 2016.
Forma realizace:implementation in python
Datum vypsn:2018-05-23




Nzev:Hlubok uen pro klasifikaci histopatologickch dat
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc: Jan Hering Dipl.-Math.
Oponent:
Popis:Díky své úspěšnosti v řešení problémů – od klasifikace fotografií, rozpoznávání obličejů ale také např. detekce síťového útoku – se hluboké učení, tj. učení pomocí hlubokých konvolučních sítí do popředí při řešení problémů pomocí strojového učení.

Histopatologické vyhodnocení tkáně je jednou ze základních diagnostických metod v interní medicíně. Tenké vrstvy odebraných vzorků tkání se nejprve reakcí se specifickými barvivy obarví a posléze nasnímají na elektronovém mikroskopu. Velikost takových obrázků v digitální podobě dosahuje až miliardy pixelů, počty takových snímků v rámci běžné klinické praxe díky dostupnosti přístrojů se neustále zvětšují. Spolehlivý systém automatické diagnózy a detekce nádorem zasažené tkáně může výrazně usnadnit práci a ušetřit čas lidským expertům, kteří všechny snímky musí vyhodnotit manuálně.


Náplní a očekávaným výstupem práce je implementace vybrané architektury konvoluční sítě podle nejnovější literatury, a sice v jazyce Python a dále její evaluace pro klasifikaci histopatologických snímků datové sady PETACC, která obsahuje obarvené řezy tkáně tlustého střeva.
Pokyny k vypracovn:
Doporuen literatura:
Forma realizace:Python
Datum vypsn:2018-05-23




Nzev:Automatick kalibrace pomoc ?sebedotyku? a sebepozorovn u dvojrukho prmyslovho manipultoru
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Matj Hoffmann Ph.D.
Oponent:
Popis:Cílem práce je automatická kalibrace dvourukého průmyslového manipulátoru bez použití externích měřících zařízení. Robot se kalibruje sám a to za použití: a) sebepozorování pomocí kamer, které jsou součástí zařízení, b) “sebe-dotyku” s pomocí silové zpětné vazby, c) dotyku s prostředím (např. stůl). Úkolem je porovnat tyto metody mezi sebou a to jak teoreticky tak prakticky a zhodnotit jejich vhodnost pro nasazení v průmyslové praxi.

Ukázková videa:
https://youtu.be/7azecm1H2zQ
https://youtu.be/rd7c6T2HyMs
Pokyny k vypracovn:1. Seznámení se s dvourukým manipulátorem Yaskawa Motoman a softwarem (ROS, MoveIt!, RViz, inverzní kinematická úloha, využití zpětné vazby ze silových senzorů) a externími kamerami pozorujícími pracovní prostor obou ramen.
2. Sběr dat v sebe-dotykových konfiguracích (úhly ramen + kamera).
3. Studium literatury kinematické kalibrace, zejména za použití více kinematických řetězců.
4. Formalizace kalibračního problému pro různé kombinace protínajících se kinematických řetězců, jeho řešení metodami nelineárních nejmenších čtverců a vyhodnocení přínosu jednotlivých formulací problému.
5. Výběr konfigurací robota s největším přínosem pro sebe-kalibraci.
Doporuen literatura:Birbach, O.; Frese, U. & Bauml, B. (2015), 'Rapid calibration of a multi-sensorial humanoid’s upper body: An automatic and self-contained approach', The International Journal of Robotics Research 34(4-5), 420--436. Hollerbach, J.; Khalil, W. & Gautier, M. (2016), Model identification, in B. Siciliano & O. Khatib, ed., 'Springer Handbook of Robotics', Springer, , pp. 113--138. Joubair, A., & Bonev, I. A. (2015). Kinematic calibration of a six-axis serial robot using distance and sphere constraints. The International Journal of Advanced Manufacturing Technology, 77(1-4), 515-523. Roncone, A.; Hoffmann, M.; Pattacini, U. & Metta, G. (2014), Automatic kinematic chain calibration using artificial skin: self-touch in the iCub humanoid robot, in 'Robotics and Automation (ICRA), 2014 IEEE International Conference on', pp. 2305-2312. Stepanova, K. & Hoffmann, M. (2018), Robot self-calibration using multiple kinematic chains, in 'Intelligent Robots and Systems (IROS), 2015 IEEE/RSJ International Conference on'. [submitted]
Forma realizace:
Datum vypsn:2018-05-18




Nzev:Kalibrace uml ke na humanoidnm robotu Nao
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Matj Hoffmann Ph.D.
Oponent:
Popis:Máme k dispozici unikátní verzi robota Nao s taktilními senzory po celém povrchu těla (ruce, trup, obličej). Rozložení a rozměry kůže ve 2D jsou známy, ale jejich pozice na těle robota (ve 3D) nikoli. Cílem práce je získat souřadnice jednotlivých taktilních čidel na povrchu těla robota vzhledem k jeho kinematickému modelu. Výchozí možností je optimalizace kombinující omezující podmínky 2D modelu kůže a 3D CAD modelu, ze kterého známe umístění některých částí pole senzorů. Pro ověření či dokalibrování je možné použít další senzory na těle robota (kamery, inerciální senzory) či sebe-dotykové konfigurace.

ilustrační video (na robotu iCub): https://youtu.be/pfse424t5mQ
Pokyny k vypracovn:1. Seznámení se s robotem Nao, taktilními senzory a jejich vyčítáním.
2. 2D model kůže a pozice jednotlivých senzorů na jednotlivých částech kůže.
3. Definice optimalizačního problému ve 3D kombinací 2D a 3D omezujících podmínek.
4. Ověření či dokalibrování za pomoci dalších senzorů na těle robota (kamery, inerciální senzory) či sebe-dotykové konfigurace.
Doporuen literatura:Albini, A., Denei, S., & Cannata, G. (2017, September). Towards autonomous robotic skin spatial calibration: A framework based on vision and self-touch. In Intelligent Robots and Systems (IROS), 2017 IEEE/RSJ International Conference on (pp. 153-159). IEEE. Maiolino, P.; Maggiali, M.; Cannata, G.; Metta, G. & Natale, L. (2013), 'A flexible and robust large scale capacitive tactile system for robots', Sensors Journal, IEEE 13(10), 3910--3917. Mittendorfer, P. & Cheng, G. (2012), 3D surface reconstruction for robotic body parts with artificial skins, in 'Proc. IEEE/RSJ Int. Conf. Intelligent Robots and Systems (IROS)'. Roncone, A.; Hoffmann, M.; Pattacini, U. & Metta, G. (2014), Automatic kinematic chain calibration using artificial skin: self-touch in the iCub humanoid robot, in 'Robotics and Automation (ICRA), 2014 IEEE International Conference on', pp. 2305-2312.
Forma realizace:
Datum vypsn:2018-05-18




Nzev:Sebe-explorace a tvorba modelu tla u humanoidnho robota s umlou k
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Matj Hoffmann Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Oponent:
Popis:Cílem práce je na simulátoru humanoidního robota s umělou kůží a poté na skutečném robotovi vyvinout algoritmy, které efektivně generují konfigurace, kde dochází k "sebedotyku", a zároveň učit model robota (přímá a inverzní kinematika). K prohledávání lze použít tzv. "active goal babbling" či učení s posilováním.
Videopříklady:
https://youtu.be/7f9Mfl7sO18
https://youtu.be/a81K1kAD_gM
https://youtu.be/pfse424t5mQ
Pokyny k vypracovn:Pokyny k vypracování:
1. Instalace a otestování již vyvinutého simulátoru robota Nao (Gazebo) s taktilními senzory.
2. Vyčítání aktivací umělé kůže a jednoduchá vizualizace.
3. Vývoj a testování algoritmů pro sebe-průzkum těla robota (sebe-dotyk) a současné učení modelu přímé a inverzní kinematiky z dat (data-driven / black-box přístup).
4. Diskuze formulace problému, zejména pak různých kriteriálních funkcí - např. rychlost navštívení povrchu kůže vs. chyba v aktuálně naučeném přímém vs. inverzním modelu.
5. Porovnání algoritmů na bázi posilovaného učení a “(active) goal babbling” (Sutton & Barto 1998; Baranes & Oudeyer 2010; Rolf et al. 2010) .
6. Diskuze vhodnosti metod pro učení modelu přímé a inverzní kinematiky z dat (data-driven / black-box přístup) pomocí např. hlubokých neuronových sítí, Gaussovských procesů, či regrese a hodnocení použitého řešení porovnáním s řešeními z literatury s ohledem na např. nakládání s více řešeními IK.
7. Testování na na fyzickém robotu Nao s umělou kůží.

Doporuen literatura:Baranes, Adrien, and Pierre-Yves Oudeyer. "Active learning of inverse models with intrinsically motivated goal exploration in robots." Robotics and Autonomous Systems 61.1 (2013): 49-73. Rolf, Matthias, Jochen J. Steil, and Michael Gienger. "Goal babbling permits direct learning of inverse kinematics." IEEE Transactions on Autonomous Mental Development 2.3 (2010): 216-229. Roncone, A.; Hoffmann, M.; Pattacini, U. & Metta, G. (2014), Automatic kinematic chain calibration using artificial skin: self-touch in the iCub humanoid robot, in 'Robotics and Automation (ICRA), 2014 IEEE International Conference on', pp. 2305-2312. Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. Cambridge: MIT press, 1998.
Forma realizace:
Datum vypsn:2018-05-18