Bakalsk prce - Bachelor Theses


Nzev:Fast image registration using linear programming and sparse sampling
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:
Popis:We shall start from a very fast registration technique [1], which is based on choosing keypoints on class boundaries, sampling their neighborhood in a normal direction, approximating the criterion using piecewise linear functions, and linear programming. Possible tasks include: coupling with a very fast segmentation method, extension to 3D, automatic choice of reliable keypoints, tailor-made innerpoint method optimization, optimized multiresolution and termination criterion, etc.
Datum vypsn:2018-05-29




Nzev:3D face model from a video or multiple images of a subject
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:faces

Having a collection of multiple images or a short video of a subject, it is possible to reconstruct a 3D model of his/her face. Such reconstructed model can be used in computer graphics applications, e.g. new view generation, relighting, face texture transfer, etc. Alternatively, the model can be used for identity recognition, e.g. by constructing a face signature from geometric characteristics or by generating a virtual frontal-view.

There are several approaches in the literature to reconstruct the model of a face. Very good results can be obtained by fitting a parametric 3D morphable [1] model by using stereo images [2]. Alternatively, facial features (nose, mouth corners, eye corners), can be reconstructed automatically using classical structure from motion techniques even in uncalibrated setup. A 3D reconstruction of a face from video has already been investigated, e.g. [3]. There exist a commercial solution, however it requires a non-negligible manual effort, e.g. [4]. Nevertheless our goal is to estimate the model automatically.

We will provide a code for detection the facial landmarks which also simultaneously estimate a pose of the camera (position+orientation) [5]. This will be a starting point for the reconstruction algorithm design. Promising results were already obtained with rather naive methods, so impressive results are expected.

References

[1] V. Blanz and T. Vetter. A morphable model for the synthesis of 3d faces. In SIGGRAPH 1999.
video.
[2] B. Amberg, A. Blake, A. Fitzgibbon. Reconstructing High Quality Face-Surfaces using Model Based Stereo. In ICCV 2007.
[3] Douglas Fidaleo and Gerard Medioni. Model-Assisted 3D Face Reconstruction from Video. In AMFG, 2007.
[4] Looxis Faceworks: video.
[5] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Datum vypsn:2014-05-13




Nzev:Facial video super-resolution
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:faces


The super-resolution is a technique which allows to reconstruct high-resolution image from multiple low-resolution images or a video. A basic principle is registering the images into a common coordinate frame, deconvolution, and final aggregation. An introductory overview can be found in [1].

This technique has natural applications in forensics, e.g. license plate reading from low definition videos [2], facial image super-resolution [3,4], etc. There exist many different approaches in the literature. A code for algorithm [5] is included in OpenCV. Faces are non-rigid 3D objects, so the registration is not straightforward. We will provide a code for precise facial landmark detection in the images [6], which will be a basic tool for the registration.

The beauty of this topic is that the final result could be very impressive in the sense that human does not have this ability. Nevertheless this topic is not easy to handle. The work could start from simple experiments with planar scenes, comparing with OpenCV, until the super-resolution of faces with frontal and non-frontal videos of a subject speaking or changing expressions. Therefore this topic can be chosen for semestral, bachelor, or master project.

References

[1] Super-Resolution Image Reconstruction: A Technical Overview. IEEE Signal Processing Magazine, May 2003.
[2] Filip Sroubek, Gabriel CristĂłbal, Jan Flusser. A Unified Approach to Superresolution and Multichannel Blind Deconvolution. IEEE Trans. on Image Processing, 16(9), 2007.
[3] Kui Jia and Shaogang Gong. Generalized Face Super-Resolution. IEEE Trans. on Image Processing, 17(6), 2008.
[4] Shuowen Hu, Robert Maschal, S. Susan Young,Tsai Hong Hong, and P. Jonathon Phillips. Face recognition performance with superresolution. Applied Optics / Vol. 51, No. 18 / 20 June 2012.
[5] Mitzel, T. Pock, T. Schoenemann, D. Cremers. Video super resolution using duality based TV-L1 optical flow. DAGM, 2009. http://docs.opencv.org/modules/superres/doc/super_resolution.html
[6] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Datum vypsn:2014-05-13




Nzev:Gaze direction estimation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:gaze

Estimating the gaze direction, i.e. estimating where a person is looking from a single monocular camera is a challenging problem with potentially large applicability. For some applications it could replace expensive eye-trackers or other intrusive 'wearable' devices. In theory, not only the direction, but also the depth of the target view can be estimated, when enough resolution is available to get the eye vergence [1].

The applications include psycho-social studies, marketing applications (e.g. contactless interaction with advertising panels), alternative mouse pointer control for disabled people, vigilance monitoring for driver assistance systems, etc. If the work is successful, there is a potential for commercialization.

Multiple approaches exist in the literature to solve this problem. A good survey can be found in e.g. [2], nice results are obtained with a help of a range sensor [3]. We will provide a code for detecting facial landmarks (nose tip, eye corners, mouth corners) in images and estimating a pose (position and orientation) of the face with respect to the camera [4]. A candidate will investigate a fusion of the head pose with the eye vergence estimation and will design a ground-truth experiment in order to evaluate the method accuracy, and to study impact of subject distance, pose, and camera resolution.

References

[1] Zakia Hammal, Corentin Massot, Guillermo Bedoya, and Alice Caplier. Eyes Segmentation Applied to Gaze Direction and Vigilance Estimation. In ICAPR 2005.
[2] Sileye O. Ba, and Jean-Marc Odobez. Multiperson Visual Focus of Attention from Head Pose and Meeting Contextual Cues. IEEE Trans. on PAMI, 33(1), 2011.
[3] Kenneth Alberto Funes Mora and Jean-Marc Odobez. Gaze Estimation from Multimodal Kinect Data. In Face and Gesture, and Kinnect CVPR Workshop. 2012.
[4] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Datum vypsn:2014-05-13




Nzev:Lip activity detector
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:lip activity
Lip activity detector (also called speech activity detector) [1] is an algorithm which automatically identifies whether a person in a video speaks at a time. This task is important in audio-visual diarization problem [2,3], i.e. recognizing who speaks when, and in audio-visual cross modal identity recognition and learning. There are typical situations when multiple people is in a camera field of view and an audio signal is perceived. Then the question is who is speaking.

The speech activity detector can be visual only (based on observing the statistics of intensity variations in the mouth region), or audio-visual (which exploits the audio-visual synchrony between these modalities [4]). A basic study of these approaches is needed together with a detailed analysis of the impact of video resolution and a camera viewpoint. We will also provide a simple ground-truth annotated dataset containing examples of positive (speaking people) and negative (non-speaking, listening people) cases.

A code for precise localization of facial landmarks will be provided [5], and [6].

If this work is successful, the task can be naturally extended to a broader Audio-Visual digitization algorithm, which would integrate multiple audio-visual cues as e.g. video identity from face recognition, visual identity from clothing models, audio identity from voice recognition, direction estimate from a microphone array, etc. Therefore this topic can be chosen as a semestral, bachelor, or master project.

References

[1] K. C. van Bree. Design and realisation of an audiovisual speech activity detector. Technical Report PR-TN 2006/00169, Philips research Europe, 2006.
[2] Felicien Vallet, Slim Essid, and Jean Carrive. A Multimodal Approach to Speaker Diarization on TV Talk-Shows. IEEE Trans. on Multimedia, 15(3), 2013.
[3] Athanasios Noulas, Gwenn Englebienne, and Ben J.A. Kroese. Multimodal Speaker Diarization. IEEE Trans. on PAMI, 34(1), 2012.
[4] Einat Kidron, Yoav Y. Schechner, and Michael Elad. Pixels that sound. In CVPR, 2005.
[5] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
[6] M. Uricar, V. Franc and V. Hlavac, Detector of Facial Landmarks Learned by the Structured Output SVM. In VISAPP 2012. http://cmp.felk.cvut.cz/~uricamic/flandmark/
Datum vypsn:2014-05-13




Nzev:Lip reading
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:faces
Lip reading (also called speech reading) is a ability to understand human speech by looking at mouth and lips, without actually hearing the audio. This ability is sometimes present at deaf people. There are evidences in literature that audio-visual speech recognition, i.e. a fusion of classical auditory and video recognition methods, can lead to improvement in speech recognition algorithms [1], especially in case of low quality audio or overlapping speech.

There are works that employs video channel to understand isolated spoken phrases, uttered digit, or simple commands, e.g. to control mobile devices or audio system in a car, [2,3].

First, the target will be the isolated word recognition. A design of a basic method, feature extraction, classifier, ground-truth experiment with emphasis on studying the effect of camera resolution, angle, and subject distance. We will provide a code for precise estimation of facial landmarks (nose tip, eye corners, mouth corners) from images or videos [4]. Then it should be straightforward to extract representative features from the mouth regions.

If the work is successful it can be further extended and integrated with automatic speech recognizers to disambiguate the overlapping speech. Therefore the topic can be chosen as semestral, bachelor, or master project.

The image is a reproduction from [1].

References

[1] Petr Cisar, Milos Zelezny. Using of Lip-Reading for Speech Recognition in Noisy Environments. In Speech Processing, 2003. http://musslap.zcu.cz/en/audio-visual-speech-recognition/
[2] Kate Saenko, Karen Livescu, Michael Siracusa, Kevin Wilson, James Glass, and Trevor Darrell. Visual Speech Recognition with Loosely Synchronized Feature Streams. In ICCV, 2005.
[3] Dana Segev, Yoav Y. Schechner, Michael Elad. Example-based Cross-Modal Denoising. In CVPR, 2012.
[4] Jan Cech, Vojtech Franc, Jiri Matas. A 3D Approach to Facial Landmarks: Detection, Refinement, and Tracking. In Proc. ICPR, 2014.
Datum vypsn:2014-05-13




Nzev:Pesn stereoskopick provn
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:dvere_vyrez_2Fotogrammetrické stereo je jedna z metod umožňující vytvořit 3D model scény na základě jejích několika obrazů. Základním problémem stereovidění je nalezení vzájemně korespondujících bodů, tj. bodů v obrazech, které odpovídají témuž 3D bodu ve scéně. Nalezení sub-pixelové polohy korespondencí umožňuje několikanásobné zpřesnění výsledného 3D modelu.

Váš úkol bude seznámit se s problematikou sub-pixelového stereoskopického párování, (re)implementovat jednu z metod a provést experimenty demonstrující požadované vlastnosti.

Očekává se implementace v Matlabu nebo v C.
Datum vypsn:2005-09-12




Nzev:Range camera - stereo fusion
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Jan ech Ph.D.
Popis:faces

Recently range sensors, such as time-of-flight cameras, binary-coded range finders (MS Kinnect), has become broadly available. They provide reliable depth measurement for smooth textureless surfaces with enough reflectance, however their resolution is not outstanding. On the other hand classical stereo setup with HD cameras, provides high resolution depth maps, however has difficulties in textureless or repetitive patterns. Therefore, these sensors are complimentary and a fusion of them should gain higher quality results.

A classical work related to this topic is based on low resolution upsampling using a single high resolution intensity image [1], their code is available and should be used as a reference method. A basic stereo - time-of-flight camera fusion is proposed in [2]. A task of the candidate will be to calibrate the range sensor and the stereo rig together, then use the depth map to initialize the global sub-pixel stereo matching [3] and evaluate the results with respect to [1,2].

References

[1] J. Kopf, M.F. Cohen, D. Lischinski, M. Uyttendaele. Joint bilateral upsampling. In SIGGRAPH, 2007.
[2] Vineet Gandhi, Jan Cech, Radu Horaud. High-Resolution Depth Maps Based on TOF-Stereo Fusion. In Proc. ICRA, 2012.
[3] Jan Cech. Accurate and Robust Stereoscopic Matching in Efficient Algorithms. PhD Thesis. Department of Cybernetics, Faculty of Electrical Engeneering, Czech Technical University. June 16, 2009. (Chapter 4.4, pp. 47--50).

Datum vypsn:2014-05-13




Nzev:Rychl 2D konvoluce, v Matlabu, modul do souboru pklad
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Vclav Hlav CSc.
Popis:Práce přispěje k budovanému systému ilustračních příkladů pro cvičení ke 3. vydání knihy Šonka, Hlaváč, Boyle: Image Processing, Analysis, and Machine Vision, Thomson Publishers, 2007. V práci budou reimplementovány známé algoritmy, ověřeny na ukázkových příkladech a zdokumentovány v angličtině.

Konkrétní náplní této BP bude implementace několika metod zrychlení konvoluce.
Datum vypsn:2010-02-11




Nzev:Vektorizace kivek, v Matlabu, modul do souboru pklad
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Vclav Hlav CSc.
Popis:Práce přispěje k budovanému systému ilustračních příkladů pro cvičení a také 3. vydání knihy Šonka, Hlaváč, Boyle: Image Processing, Analysis, and Machine Vision. V práci budou reimplementovány známé algoritmy, ověřeny na ukázkových příkladech a zdokumentovány v angličtině.

Tato BP se zaměří na vektorizaci křivek a implementuje asi tři metody podle pokynu vedoucího práce.
Datum vypsn:2009-09-02




Nzev:Algoritmy potaov grafiky pro potaov vidn
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Mgr. Ondej Chum Ph.D.
Popis:Implementace algoritmů počítačové grafiky využitelných pro počítačové vidění s využitím HARDWAROVÉ akcelerace.
Datum vypsn:2014-01-23




Nzev:Sketch to image search tablet front-end
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Mgr. Ondej Chum Ph.D.
Popis:Implement a front-end for sketch to image search on Android and iOS. This includes an interface for sketch drawing, communication with search engine server and display of the results.
Datum vypsn:2016-01-04




Nzev:Animace VRML modelu relnch objekt
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Jana Kostliv Ph.D.
Popis:HeadCílem práce je navrhnout generátor animace pro trojrozměrný VRML model reálného objektu získaného automaticky z množiny fotografií.Práce bude součástí projektu 3D fotografie řešeného v Centru strojového vnímání katedry kybernetiky, který je podpořen Grantovou agenturou Akademie věd.

Program dostane VRML model v nezname souradne soustave, mnozinu kamer (danych polohou orientaci a vnitrnimi parametry) v teze souradne soustave a data z EXIF hlavicek obrazovych souboru. Souradna soustava nebude nijak svazana s objektem. Vysledkem bude mnozina statickych pohledu na 3D model z mist, ze kterych byl objekt fotografovan a dale trajektorie minimalni delky, ktera "ukaze" objekt ze vsech stran.

Student se nauci:
1. sestavit specifikaci ulohy,
2. geometrii pro popis 3D modelu a systemu perspektivnich kamer
3. psat C moduly pro prostredi Matlab,
4. profesionalne dokumentovat svou praci.

Podminkou uspesneho obhajeni prace je prubezna prace na projektu.
Datum vypsn:2005-09-04




Nzev:Kalibrace radialnho zkreslen digitlnho fotoapartu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Jana Kostliv Ph.D.
Popis:StGeorgeNa základě existujících modulů a existujícího laboratorního vybavení sestavte program pro kalibraci radialního zkreslení obrazu z digitálního fotoaparátu. Dále realizujte proceduru, která radialní zkreslen odstraní. Opakovaně zkalibrujte všechny kamery, které dostanete k dispozici (asi tři typy, vesměs Canon). Vyhodnoťte stálost parametrů radiálního zkreslení vzhledem k opakovanému přeostření a změně ohniskové vzdálenosti.
Tento projekt bude součástí projektu 3D fotografie, řešeného v Centru strojového vnímání katedry kybernetiky, který je podpořen Grantovou agenturou Akademie věd.
Student se naučí: 1.modelovat a odstraňovat radiální zkreslení z obrazu, 2.realizovat a profesionálně dokumentovat inženýrský experiment, 3.pracovat s několika typy digitálních fotoaparátů, včetně jejich ovládání z počítače.
Podmínkou úspěšné obhajoby práce je průběžná práce na projektu.
Datum vypsn:2005-09-04




Nzev:Aplikce rozpoznvn textu v obrazech.
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:Práce naváže na oceněnou diplomovou práci [pdf][ konf. článek], jejíž výsledkem je špičkový detektor a rozpoznávací systém textů v obrazech.

Student si v projektu, bakalářské, či diplomové práci vybere některý směr rozvoje tohoto systému.
1. Z pomocí informací dostupných na WWW (google, Wiki) a případně GPS implementujte systém, který bude automaticky opravovat výstupy rozpoznávání (korekce adres, názvů ulic, obchodů)
2. Implementujte (např. pro mobilní telefon) aplikace pro automatický překlad. Rozpoznaný text je odeslán po souvisejících skupinách na stránku Google Translate a výsledek zobrazen v overlay-i obrázku
3. Aplikace vlastního nápadu

Datum vypsn:2010-10-10




Nzev:Automatick analza snmk z leteck archeologie
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:Za příznivých klimatický podmínek se v leteckých a satelitních snímcích krajiny objevují jinak neviditelné stopy činnosti člověka, od doby neolitu až po současnost, např. poblíž hory Říp,
View Larger Map
Cílem diplomové práce je pomocí metod zpracování obrazu a strojového učení částečně automatizovat a zároveň zkvalitnit výsledky průzkumu. Práce se zaměří na některou z těchto úloh:
1. Optimální transformace mutlispektrálních snímků na základě strojového učení.
2. Automatické hledání struktur způsobených činností člověka.
Datum vypsn:2010-10-10




Nzev:Evaluation of state-of-the-art registration techniques for fitting models to 3D point clouds
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:The most commonly used plastic molding process, injection molding, is used to create a large variety of products like wire spools, packaging, automotive dashboards etc. with different shapes and sizes.Particularly for automotive industry the quality requirements are very high, so that an automated inspection of geometric properties is desirable.

There are special challenges for injecting molding parts due to the temperature depending shrinkage or regions of occlusions. The point cloud in the figure is captured by laser triangulation and a multi-camera system.

The task is to study and evaluate state-of-the-art registration methods in this application context.

More in the full description
Datum vypsn:2010-12-08




Nzev:Mobiln telefon jako dlkomr-hloubkomr-pravtko
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:Cílem práce je (re)implementovat v mobilním telefonu aplikaci, která pomocí metod počítačového vidění umožní využití telefonu jako nástroje na měření velikostí a vzdáleností.
Datum vypsn:2010-10-10




Nzev:Modelovn a sledovn identity s pomoc detektoru obliej ve videu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:V Centru stojového vnímání (CMP) je k dispozici kvalitní detektor obličejů ve videu. Vytvořte z jeho pomocí program, který automaticky vytvoří model pro detekovaný obličej a bude sledovat pohyb daného obličeje (osoby) i detektovat nepřítomnost a opětnou přítomnost daného obličeje v obraze. Podobný systém ma řadu aplikací např. při automatické anotaci filmů či sledování pohybu osob.
Datum vypsn:2010-10-10




Nzev:Rozpoznn typu automobilu z jednoho snmku
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:Cílem diplomové práce je navrhnout a ověřit metodu pro rozpoznávání typu automobilu z jednoho snímku, a to bez omezení na místo pohledu a osvětlení. Práce využije detektor lokálních afinních rámců, který je k dispozici v Centru strojového vnímání. Jádrem práce bude nalezeni reprezentace 3D objektu a návrh metody matchování modelu a lokálních rámců detekovaných v obraze.
Datum vypsn:2007-01-03




Nzev:Rozpoznvn rostlin z obrzk (na mobilnm telefonu)
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:V rámci bakalářské práce se budete podílet na projektu jehož cílem je rozpoznávání rostlin, a to buď z fotografií listu, kůry, plodu, atd. V projektu se můžete zaměřit na řadu problémů, od vlastního rozpoznávání z fotografii, po vývoj aplikace na mobilním telefonu (uživatelské rozhraní) a pro webový server s přístupem ke sdílené databázi nasnímaných dat celou komunitou uživatelů. Dosavadní výsledky projektu jsou shrnuty na stránce http://cmp.felk.cvut.cz/~sulcmila/plants/.

Řešitelé budou mít po celou dobu projektu zapůjčen mobil s OS Android (Samsung Galaxy II nebo podobný)
Datum vypsn:2012-03-15




Nzev:Tracking players in low-resolution videos of soccer games.
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Ji Matas Dr.
Popis:Evaluation and adoption of state-of-the-art tracking methods for tracking players in low-resolution videos of soccer games.

A common problem during player tracking is the change of the players appearance because of changing illumination conditions (e.g. shadow) or because parts of the player are temporarily occluded. Under such circumstances classical tracking methods have a higher risk to fail.

However, the player will be redetected after some frames and the question arise, how to maintain the correct identity of the players despite the low resolution and the similar color of players of the same team.
low resolution image
of soccer players
The task is to study and evaluate state-of-the-art tracking methods in this application context. At SCCH there ground-truth data are available which are acquired by means of a high-resolution transponder system.

For more, see
full description

Datum vypsn:2010-12-08




Nzev:Aproximace hodnot fuzzy konjunkc
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Mirko Navara DrSc.
Popis:Seznamte se s technikami konstrukce fuzzy konjunkcí (trojúhelníkových norem). Prostudujte kvalitativní a kvantitativní možnosti proložení daných hodnot fuzzy konjunkcí.
Datum vypsn:2008-09-22




Nzev:Archiv fuzzy logickch operac
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Mirko Navara DrSc.
Popis:Seznamte se se základními typy operací ve fuzzy logice. Implementujte co nejúplnější soubor těchto operací. Výsledný archiv použijte k otestování hypotéz o dominanci fuzzy konjunkcí (trojúhelníkových norem).
Datum vypsn:2008-09-22




Nzev:Statistick metody rozpoznvn
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Ing. Mirko Navara DrSc.
Popis:Seznamte se s metodami odhadu parametru pravděpodobnostních modelů (metoda maximální věrohodnosti, metoda momentů atd.).
Na zvolených umělých i skutečných úlohách demonstrujte jejich přednosti i vady, tedy příklady, na kterých metoda selhává, nebo dává neuspokojivé výsledky.
Datum vypsn:2008-09-22




Nzev:3D Reconstruction of Mars & Moon
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:doc. Ing. Tom Pajdla Ph.D.
Popis:Review the state of the art in 3D reconstruction from images. Get acquainted with methods at ptak.felk.cvut.cz/sfmservice. Carry out experiments with reconstructing the Mars and Moon surface from data acquired MER and Lunokhod rovers. Suggest and implement an improvements of the standard technology of 3D reconstruction from images to be applicable for the Mars and Moon conditions.
Datum vypsn:2013-09-16




Nzev:3D Reconstruction on GPU
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:doc. Ing. Tom Pajdla Ph.D.
Popis:dino_white_bg
Review the state of the art in 3D reconstruction from images. Get acquainted with methods at ptak.felk.cvut.cz/sfmservice. Propose and implement improvements for 3D reconstruction to work with more difficult indoor situations and with gradually changing environments using GPU.
Datum vypsn:2013-09-16




Nzev:3D reconstruction on iPhone
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:doc. Ing. Tom Pajdla Ph.D.
Popis:dino_white_bgReview the state of the art in 3D reconstruction from images. Get acquainted with methods at ptak.felk.cvut.cz/sfmservice. Suggest and implement an improvements of the standard technology of 3D reconstruction from images on a GPU.
Datum vypsn:2013-09-16




Nzev:Modelovn prchodu svtla diamantem
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Vladimr Smutn Ph.D.
Popis:Pro analýzu výrobních vad a návrh změny technologie výroby je třeba rozumět jevům při průchodu světla broušeným kamenem, například diamantem. Problém má dvě stránky, jednak modelování (raytracing) průchodu světla počítačovým modelem, jednak analýza obrazu laserového paprsku po průchodu kamenem. První část je blízká počítačové grafice, druhý problém spadá do počítačového vidění.

broušené kameny

simulace světla v kameni
Datum vypsn:2018-06-29




Nzev:Navigace autonomnho robotu ve vnitnm prosted
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Vladimr Smutn Ph.D.
Popis:Existuje mnoho akademických řešení navigace robotu například v továrně. Zároveň existují komerční řešení, která jsou ale buď příliš drahá nebo nejsou dostatečně flexibilní pro uživatele. Cílem je navrhnout metodu, která bude dostatečně flexibilní, mít nízkou cenu potřebného HW a zároveň bude vyžadovat jen minimální či žádné úpravy okolí.

V laboratoři algoritmy vyvíjíme za pomoci robotu Jackal (na obrázku) vybaveného kamerou, lidarem a dalším HW. Robot je řízen v prostředí ROS.

Možná temata zahrnují jak úlohy většího rozsahu, např. navigace za použití obrazu z kamery, tak středního rozsahu, jako implementace a doplňování alternativních metod plánování až po drobnější úlohy jako například rozšiřování možností komunikace robotu s okolím.

robot Jackal

autonomní robot
Datum vypsn:2018-06-29




Nzev:Pesn navigace autonomnho robotu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Vladimr Smutn Ph.D.
Popis:Existují člověkem řízené stroje, které vyžadují přesné navádění. Mezi jejich aplikace patří řezání drážek v betonu a asfaltu, nanášení vodorovného značení na silnice, parkoviště, podlahu továren a podobně. Cílem projektu je z manuálně řízeného stroje udělat autonomního robota. Přesnost navigace současných autonomních mobilních robotů většinou nedostačuje.
Cílem práce je navrhnout a experimentálně vyzkoušet metody navigace a řízení robotu, které jsou pro dané aplikace dostatečně přesné, zároveň ale v praxi použitelné.

značení vozovka

značení v hale

požadovaný výsledek

řezání asfaltu
Datum vypsn:2018-06-29




Nzev:Chytr prohledvn videoobsahu - Smart Videobrowsing and Search
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:Adaptivní lineární prediktory umožňují sledovaní objektu zájmu i při změně vzhledu. Vstupem je několik ukázek toho, jak by mohl objekt případně vypadat. Hlavní inteligence je skryta v procesu off-line učení vlastní sledovánní je pak extrémně efektivní. Existuje také prototyp automatické inicializace sledovače. Pro rutinní nasazení algoritmu je potřeba zrobustnit automatickou re-inicializaci a zefektivnit I/O operace přístupu k videosekvencím. Výstupem bude program, který automaticky indexuje, tj. přiřazuje popisky k jednotlivým video sekvencím.

Zájemci mohou přímo kontaktovat
vedoucího práce a domluvit si nezávaznou schůzku.
Datum vypsn:2009-12-12




Nzev:Detekce a sledovn hlavy v kognitivnm multikamerovm systmu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:multicam_logoV Centru strojového vnímání běží v současné době projekt vývoje multikamerového systému pro aplikace telepresence, inteligentního rozhraní člověk-stroj a virtuální reality. Systém skládající se z několika jedoduchých kamer a jednoho či více počítačů se bude snažit "porozumět" dění ve scéně a poskytne výstup dle dané aplikace.

Jednou z nejdůležitějších informací je pozice a orientace hlavy (hlav). Toto téma umožňuje dvě varianty práce. Teoretičtěji zaměření studenti mohou dále vyvíjet existující prototyp SW. Praktičtěji orientovaní studenti mohou implementovat stávající algoritmus a integrovat ho do real-time multikamerového systému.
multicam_head_tracking
Zájemci mohou kontaktovat vedoucího projektu: svoboda@cmp.felk.cvut.cz
Datum vypsn:2007-10-31




Nzev:Klasifikace siluet pro kognitivn multikamerov system
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Popis: centru strojového vnímání se v současné době pracuje na projektu rozpoznávání činností/událostí z multikamerového systému. Nedílnou součástí je nalezení parametrů 3D artikulovaného modelu člověka (model skládající se z kloubově propojených rigidní částí). Vstupem algoritmu je multikamerová sekvence, ve které jsou segmentovány siluety člověka (metodou background separation). Výstupem jsou parametry modelu člověka (např. úhly mezi navazujícími rigidními částmi nebo jejich rozměry). Úloha je obvykle řešena minimalizací kriteriální funkce, která vyjadřuje překryv projekce modelu s obrazem v kamerách. Klíčovým problémem je, že přiřazení bodů k jendotlivým částem modelu není známo předem, což způsobuje mnoho lokálních minim kriteriální funkce a tím podstatně stěžuje její minimalizaci. Cílem práce diplomanta je popsat, implementovat a experimentálně ověřit inovativní způsob, který je založen na naučení množiny klasifikátorů, které předklasifikují body každé siluety a tak označí jejich příslušnost k rigidním částem artikulovaného modelu člověka. Takto definovaná úloha má téměř konvexní kriteriální funkci jejíž minimalizace je zvládnutelná běžnými gradientními metodami.

Více informací.

Datum vypsn:2007-03-16




Nzev:Learnable predictors for detection and tracking in images and videos
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:We will follow the idea of learnable predictors/detectors. Simply
speaking the principle is to collect a few training images and learn a
direct mapping between observations and parameters, e.g. motion. The
learning process explicitly optimizes the predictor complexity
w.r.t. predefined accuracy and operating range (basin of attraction)
The approach proved to be extremely efficient and robust for objects
whose appearance were available for off-line learning in advance. We
focus on paradigm person generic detector by appearance encoded
regression. The learning procedure will separate appearance variations
in unsupervised manner. The approach will allow for learning on few
class examples (people) and detection/tracking on the complete class
Datum vypsn:2009-12-12




Nzev:Modelovn pohybu lovka pro kognitivn multikamerov systm
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Popis:multicam_logo V centru strojového vnímání se v současné době pracuje na projektu rozpoznávání činností/událostí z multikamerového systému. Vzhledem k tomu, že není předem známo jaké objekty budou ve scéně vystupovat, je potřeba automaticky rozpoznat artikulovanou strukturu každého objektu. Navrhovaný systém by měl být limitně funkční i pro případ, kdy je scéna snímána pouze jednou kamerou.

Vzhledem k tomu, že je struktura objektu předem neznámá, není možné přímo sledovat pohyb jednotlivých rigidních částí. Cílem práce je navržení metody, která automaticky faktorizuje nezávisle se pohybující oblasti do shluků příslušejícím rigidním částem objektu na základě jejich pohybu v čase. Do takto faktorizováných dat vloží artikulovaný model, který nejlépe vysvětluje pozorovaná data.

Domácí stránka projektu.

Datum vypsn:2006-10-30




Nzev:Multimodal recognition of objects and victims
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:
Center for Machine Perception, Department of Cybernetics, contributes to the EU project NIFTi by developing visual algorithms for object/victim detection and robot localization. Among many other sensors, The robot carries an omnidirectional camera, a thermo camera, rotating 3D lidar, and optionally also RGB-Depth sensor on board.

During a search and rescue mission the robot is expected to locate victims and objects and computer their positions in 3D. CMP developed several methods. The goal of this work is mainly robustifying algorithms by combinigng multiple data (thermal, visual, depth, ...)
Datum vypsn:2013-04-04




Nzev:Nelinern a neinteraktivn pstup ke snmkm ve videu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis: Cílem práce je naprorgamovat rozhraní, které by umožnilo aplikacím přistup k libovolnému snímku ve videou. Indexem může být číslo snímku či časový údaj relativní k začátku či konci videa. Interaktivní střihové nástroje toto umožňují. Rozhraní by umožnilo takovýto přitup pro aplikace běžící například v Matlabu. Práce by přispěla k projektu na vyhledávání objektů či osob ve videu.

Zájemci mohou přímo kontaktovat
vedoucího práce a domluvit si nezávaznou schůzku.
Datum vypsn:2009-12-12




Nzev:Odhad parametr obrazovho strukturlnho modelu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:multicam_logoV Centru strojového vnímání běží v současné době projekt vývoje multikamerového systému pro aplikace telepresence, inteligentního rozhraní člověk-stroj a virtuální reality. Systém skládající se z několika jedoduchých kamer a jednoho či více počítačů se bude snažit "porozumět" dění ve scéně a poskytne výstup dle dané aplikace.

Jedním z nejzajímavějších problémů je bezesporu detekce a sledování artikulovaných objektů, nejčastěji člověka. Člověk je modelován stromovou strukturou rigidních oblastí, parametry modelu jsou učeny na trénovacích datech. Vlastní nalezení skutečné pozice modelu je řešeno pokročilou metodou vzorkování z mnohadimenzionální aposteriorní pravděpodobnostni.


pictorial matching


Výzkum v této oblasti má různé úrovně a lze formulovat zadání jak pro bakalářskou, tak i semestrální a diplomovou práci. Zájemci mohou kontaktovat vedoucího projektu: svoboda@cmp.felk.cvut.cz

Domácí stránka projektu: http://cmp.felk.cvut.cz/projects/multicam
Datum vypsn:2007-08-17




Nzev:pagemove plugin pro dokuwiki
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Ing. Jan Kreps
Popis:DokuWiki je souborově orientovaná Wiki pro kolaborativní přípravu webu. Používá ji také např. CourseWare. Základní možnosti značně rozšiřuje množství pluginů. Bohužel mezi funkčními pluginy zatím chybí pagemove/pagecopy plugin který by dovolil komfortní přesuny stránek i celých prostorů (adresářů) pro autentikovaného uživatele. Hlavní obtížnost spočívá ve spolehlivé opravě všech odkazů, které na stránky odkazují z jiných míst v dané dokuwiki. Existuje prototyp, který přesouvá jednotlivé stránky. V případě úspěchu bude mít práce velký praktický dopad a plugin se stane velmi pravděpodobně hodně populární.
Datum vypsn:2011-05-18




Nzev:Porovnn algoritm pro sledovn pohybujcch objekt
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:multicam_logo Cílem práce je instalace volně dostupného balíku "Reading People
Tracker" a jeho kritické porovnání se současnou implementací CMP
trackeru. Aplikace poběží pod OS Linux.

Práce je součástí MultiCam_IS projektu na vývoj kognitivního
multikamerového systému.

Více informací
Datum vypsn:2007-11-01




Nzev:Programov rozhran pro Matlab a digitln kamery v Linuxu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis:multicam_logoNaprogramujte funkci, která zprostředkuje Matlabu on-line signál z digitální kamery. Primárním zdrojem dat budou FireWire kamery, jako např. Fire-i kamera nebo USB kamery. Open-source knihovny a programy, jako např. Coriander, jsou volně k dispozici.

Rozhraní by mělo být transparentní a nezávislé na typu připojené kamery. Součástí rozhraní bude i možnost ovládání parametrů kamery.

Domácí stránka projektu.

Práce má implementační charakter a je vhodná pro studenta s kladným vztahem ke GNU/Linuxu a OpenSource obecně.
Datum vypsn:2007-10-31




Nzev:PTZ virtuln kamera z vesmrovho obrazu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis: V současné době se v Centru Strojového vnímání pracuje na Evropském výzkumném projektu Nifti, ve které je budován robot pomáhající lidem při nebezpečných zachranných operacích, kde hrozí například nebezpečí výbuchu či kolapsu budovy. Robot bude (mimo jiné) vybaven panoramatickou kamerou Ladybug 3, která bude snímat 360 stupňů široké okolí, termo kamerou a 3D laserovým scanerem.

Robot bude částečně řízen vzdáleným operátorem. Ačkoli všesměrová kamera poskytuje maximální možnou visuální informaci o okolí robota, není přímo vhodná pro interaktivní spolupráci. Všesměrový obraz je jednoduš příliš vzdálen tomu, co vidí lidské oko. Navrhnětě vhodnou virtuální kameru, které bude používat všesměrová data, ale operátorovi je předloží ve vhodné formě, simulující klasickou perspektivu s variabilním zvětšením (zoom).
Datum vypsn:2010-10-15




Nzev:Robustn trackovn pznakovch oken rigidnch objektu pro 3D rekonstrukci
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Popis:
Jedním z hlavních směrů v počítačovém vidění je automatická 3D rekonstrukce objektů. Její neopomenutelnou součástí je i nalezení korespondencí mezi jednotlivými obrazy a to v co nejhustším pokrytí. Jedním z možných způsobů je právě trackování příznakových oken ve videosekvenci zachycující objekt, který má být zrekonstruován.

Vstupem algoritmu by měla být výše zmíněná videosekvence a výstupem co nejv?tší počet korespondencí mezi každými dvěma obrazy. Narozdíl od úlohy obecného trackingu, v této úloze vzniká omezení plynoucí z rigidity rekonstruovaného objektu, které chceme využít. Je známo, že pohyb bodů ležících na rigidním objektu je po projekci svázán fundamentální maticí. Tj. pro všechny body musí existovat matice 3x3 o hodnosti 2 taková, že x_1*F*x_2=0. Výsledná rovnice trackingu musí zahrnovat toto omezení. Navrhujeme zkombinovat Kanade-Lucas-Tomasi (KLT) tracker s touto rovnicí což vede na 3x3 lineární systém.
Datum vypsn:2006-10-30




Nzev:Trackovn rigidnch st lovka pro kognitivn multikamerov systm
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Popis:V centru strojového vnímání se v současné době pracuje na projektu rozpoznávání činností/událostí z multikamerového systému. Jedním ze slibných podproblémů celého projektu je real-time trackování 3D rigidních částí ze sterea 3dtracker.mpeg. Cílem úlohy je implementace real-time trackeru v jazyce C/C++, respektive mex-file (tj. funkce v C++ kompilovaná pro prostředí MATLAB). Vstupem do funkce je seznam 3D bodů a jejich barev, obraz a kalibrace kamer(y). Výstupem je translace a rotace těchto bodů nejvíce odpovídající pozorované skutečnosti (tj. jejich zpětná projekce do kamer minimalizující barevný rozdíl). Charakter práce je především implementační, funkční prototyp je již implementován v prostředí MATLAB. Student by měl mít alespon základní zkušenosti s programováním v C/C++.
Datum vypsn:2007-11-01




Nzev:Visual odometry (SLAM) from omnidirectional camera
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Tom Svoboda Ph.D.
Popis: Center for Machine Perception, Department of Cybernetics, contributes to the EU project NIFTi by developing visual algorithms for object/victim detection and robot localization. Among many other sensors, The robot carries an omnidirectional camera on board.

On of the important taks is the robot localization in an unknown terrain. The goal of this work is to develop and implement a real-time robut method for visual based localization of the robot. The method will complement and robustifies the laser based mapping and robot odometry filtering
Datum vypsn:2013-03-29




Nzev:Automobil, kter vid kolem sebe
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Radim ra Dr. Tech.
Popis:Tato práce bude součástí aplikačního projektu interactIVe, ve kterém se vyvíjí systém asistující při řízení automobilu. Základním cílem naší části projektu je za jízdy měřit vzdálenost k okolním objektům pomocí standardní kamery umístěné na vozidle a rozpoznávat objekty v okolí vozidla. Takový senzor je velmi kompaktní a může nahradit dosud používané sonary, radary a rangefindery, jaké známe například z vozidel, které soutěžily na DARPA Grand Challenge. Možnost pracovat s obrazem dovoluje rozšířit funkci o "porozumění scéně", například o rozeznání chodce od pasivní překážky a o predikci jeho chování.

hloubkova-mapa

Zájemce bude bude součástí výzkumného týmu, v kterém se pracuje s metodami počítačového vidění, digitálního zpracování obrazu, sledování pohybu (tracking), odhadování vlastního pohybu z videosekvence a rozpoznávání objektů

Konkrétní téma práce bude upřesněno na základě vzájemných preferencí.

Dotazy na sara@cmp.felk.cvut.cz.
Datum vypsn:2010-08-31




Nzev:Programov rozhran servopohon pro Matlab
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Pavel Krsek Ph.D.
Popis:Cílem práce je sjednotit a doplnit programové vybavení tvořící rozhraní pro ovládání servo-mechanických pohybových stolků z Matalbu.Rozhraní předává příkazy řídícímu automatu prostřednictvím sériové linky. Doplnění spočívá v realizaci širší množiny instrukcí umožňující měření servo-mechanizmů s cílem vytvořit technické předpoklady pro jejich identifikaci.
Datum vypsn:2013-01-07




Nzev:Analyza obrazu gelove elektroforezy
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Predmetem prace je zpracovani obrazku z gelove elektroforezy.
Ukolem je odstraneni sumu, detekce znacek odpovidajicich jednotlivym
soucastem smesi, automaticke odecitani jejich poloh, a automaticka
kompenzace geometrickeho zkresleni vznikleho nehomogenitou proudu.
Vysledkem bude jednoduse ovladatelny samostatny program pripadne
s program typu klient-server s ovladanim pres www.
Datum vypsn:2018-05-28




Nzev:Automatic analysis of gel electrophoresis data
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task is to automatically process images from gel electrophoresis data - suppress noise, detect and localize individual markers, compensate electric current inhomogeneity. Several alternative methods should be tested and results compared. The result should be a standalone program or a web-based application. The method should be applicable to different kind of gels and staining.
Datum vypsn:2018-05-29




Nzev:Automatic nuchal translucency measurements
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Nuchal translucency is a diagnostics measurement performed on fetal ultrasound to determine certain abnormalities. The task is to perform this measurement automatically and reliably, by first assessing the correctness of the pose, identify the correct measurement spot, locally identifying the tissue boundaries and performing the measurement.
Datum vypsn:2018-05-29




Nzev:Biomedical image analysis competitions
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:This is a meta-topic. The idea is to choose a  medical imaging-related task from either Grand Challenges or Kaggle competitions, solve it and submit a solution.  The advantage is that you get an feedback, how well your solution compares to the true state of the art. A motivated team should be able to meet the deadline and actually compete. An individual student might not be able to solve the problem in time to win anything but the comparison should still be possible.
Datum vypsn:2018-05-29




Nzev:Creation of 3D meshes for mechanical modeling from 3D medical data
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task can be divided into several subtasks:
1. Automatic or semi-automatic tissue segmentation based on intensities and shape priors. The input are 3D volume data from MRI, CT, or ultrasound.
2. Creating a good quality triangular 2D mesh describing the surface.
3. Creating a good quality tetrahedral 3D mesh of the object interior.
4. Creating a GUI.
5. Practical example applications - visualizations or mechanical or electrical modeling.
Datum vypsn:2018-05-28




Nzev:Deep learning for 3D drosophila egg segmentation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task is to detect and segment Drosophila eggs from microscopy images using deep learning (convolutional neural networks). The challenge is that the data are 3D and standard CNN methods cannot be used directly because of memory limitations in available GPU cards.
It is therefore necessary to find other methods or reimplement existing ones.

Datum vypsn:2018-05-29




Nzev:Deep learning for automatic detection of multiple myeloma from CT images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic , Jan Hering Dipl.-Math.
Popis:The task is to develop a deep learning (convolutional neural network) method to detect multiple myeloma in 3D CT images of long bones, especially femurs. Several network architectures should be tried and the performance compared with a classical solution. The particularity is that only weak annotations are possible - we know whether a subject is healthy or not but a precise location of the lesion is not available. This leads to so-called multiple instance learning methods.

Recommended implementation languages are Python or Julia.
Datum vypsn:2018-05-29




Nzev:Deep learning for skin cancer classification
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Given a skin patch, (i) segment a lesion and (ii) determine, whether it is benign or malignant.
Several network architectures should be tried and the performance compared with a standard ABCD method. An additional task is to (iii) create a mobile phone or client/server application for the detection.
Datum vypsn:2018-05-29




Nzev:Deep learning for tumor type classification from histopathological images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic , Jan Hering Dipl.-Math.
Popis:The input data are digitized microscopy histology slices of colorectal tissue, with manual or automatic segmentation of the cancerous tissue. The task is to develop a deep learning (convolutional neural network) method to distinguish different tumor types. Several network architectures should be tried and the performance  compared with a classical solution.
Datum vypsn:2018-05-29




Nzev:Digital histology microscopy image processing
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The input data are digitized microscopy histology slices, from e.g. colorectal or breast tissue. The tasks is to develop image processing algorithms for detection of tissue cells and their nuclei and evaluation of their shape, spatial distribution and other parameters. The next step is to use these parameters (aka features) to classify the tissue into tumor and healthy, and to distinguish between several tumor classes. Students will be able to compare their results with other authors in the frame of the CAMELYON challenge (https://camelyon17.grand-challenge.org)
Datum vypsn:2018-05-29




Nzev:Efficient finding of nearest neighbors for binary vectors
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Binary keypoint descriptors, such as BRIEF or Boosting Binary Keypoint descriptors, are very compact and thus memory efficient. In the image matching task, keypoints are matched using their descriptors. The task is to find an efficient method for finding nearest neighbors for a given query binary vector and to compare it with alternative approaches, e.g. exhaustive comparison or a binary search.
Datum vypsn:2018-05-29




Nzev:Elastick registrace obraz za pouit kritria vzjemne informace ve vysok dimenzi
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis: Seznamte se s úlohou registrace obrazů,
implementací registračních algoritmů v knihovně ITK (www.itk.org) a
metodami registrace obrazů a použitím podobnostních kritéria
založeného na vzájemné informace vyšších dimenzí [1]. Implementujte
modul do knihovny ITK, který umožní použití těchto kritérií pro
velkou část registračních algoritmů implementovaných v ITK.

Výsledkem práce by měla být dobře dokumentovaná a funkční
implementace připravená a poskytnutá k začlenění do knihovny ITK,
popis metody v textové podobě. Součástí práce by dále mělo být
experimentální ověření výsledků metody a porovnání se standardními
kritérii podobnosti. V případě úspěšné realizace možnost publikace
na některé mezinárodní konferenci, eventuelně i v odborném časopise.
Možnost pokračování ve formě doktorského studia.
Datum vypsn:2018-05-28




Nzev:Fast sparse hierarchical B-spline interpolation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task of interpolation from a sparse set of points is usually approached by using kriging, i.e. radial basis functions, or a uniform grid of basis functions such as B-splines. To get the best of both worlds, we will attempt to use a sparse set of B-splines are various scales. The non-zero B-splines to be used should be determined automatically. The task is to develop an efficient algorithm for calculating the spline coefficients and to compare this method with alternatives.
Datum vypsn:2018-05-29




Nzev:Finding objects of known shapes from oversegmentation
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task is to segment an object with clear edges and of approximately known shape, where the shape is described by statistics over some shape descriptors, e.g. moments. We suggest a method which starts by oversegmentating the image into superpixels and then tries to find a  compact subset of the superpixels which corresponds to the shape model. We shall try to find efficient algorithms for this task.
Datum vypsn:2018-05-29




Nzev:From pairwise image registration to sequence image registration
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task is to align a sequence of N images onto a common reference. It is possible to register all images simultaneously, or all possible N^2 pairs but it is very computationally expensive. On the other hand, it is enough to register N-1 pairs and compose the transformations, which is fast but may lead to suboptimal accuracy. We shall (theoretically and practically) explore various ways of choosing the subsets of image pairs to register and how to estimate the individual deformations.
Datum vypsn:2018-05-29




Nzev:Learning multilayer classifiers with weak annotations
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:This topic is similar to deep learning but without neural networks. We chain several classifiers together - for example the first one will do a pixel-wise segmentations and the second will evaluate the shape of the detected objects. The challenge is to train all classifiers in the chain when training data is only available for the final output - a so-called weak labels. We shall start by simulating several simple cases, gradually moving towards a practical method.
Datum vypsn:2018-05-29




Nzev:Lung nodule analysis from time series
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Lung nodules are tissue masses in the lungs, which may be cancerous. A malignant nodule will grow quickly in time, so it is helpful to compare its image from several time points. A method should be developed to detect nodules, match them across acquisition, and evaluate their growth.
Datum vypsn:2018-05-29




Nzev:Magnetic particle imaging - using automatically calibrated test targets
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Magnetic particle imaging is a recent imaging techniques, which can visualized tiny magnetic particles with high spatial resolution. The bottleneck is the calibration, which is currently performed by moving a point target around the acquisition region. The calibration can be speeded up by using several targets, with known spatial structure. We shall attempt to develop an algorithm which could at the same time identify the spatial structure of the calibration target and the motion of the pattern, simplifying the procedure considerably.
Datum vypsn:2018-05-29




Nzev:Markov chain Monte Carlo segmentation for fitting geometrical model
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Some objects have internal structure - they contain subobjects with a particular geometric relationship. To segment such objects, Markov chain Monte Carlo (MCMC) methods can be used to generate data-driven hypotheses with statistical shape priors. We shall explore methods of this type, first on synthetic data and then to segment real structured objects such as Drosophila eggs, which are known to contain 15 so-called nurse cells. A particular attention will be paid to MCMC efficiency.
Datum vypsn:2018-05-29




Nzev:Odhadovn entropie pro vysocedimenzionln data s konenou pesnost
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis: Jednou z možností odhadování entropie mnohorozměrných dat (která
nalézá aplikace například při registraci obrazů) je
Kozačenko-Leoněnkovův (KL) odhad na základě vzdálenosti nejbližších
sousedů [1]. Ten ovšem selhává u kvantizovaných dat, která obsahují
několik identických položek. Analyzujte existující možnosti
rozšíření KL odhadu pro kvantizovaná data [1,2], vyzkoušejte metodu
založenou na integraci v původní (nekvantované) oblasti, případně na
základě teoretické analýzy navrhněte metodu vlastní. Pokuste se
zlepšit numerickou stability metody [2]. Všechny metody
implementujte a důkladně otestujte.

Výsledkem má být dobře dokumentovaná a funkční
implementace několika variant KL odhadu vhodných pro kvantovaná
data, jakož i dobře dokumentované a statisticky
vyhodnocené výsledky experimentálního porovnání. V případě úspěšné
realizace možnost publikace na některé mezinárodní konferenci,
eventuelně i v odborném časopise. Možnost pokračování ve formě
doktorského studia.
Datum vypsn:2018-05-28




Nzev:Piecewise registration for histological slices
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:When histological specimen is cut into thin slices for subsequent microscopy images, the slice can be broken into several pieces. A specialized image registration algorithm should be developed, which allows very large and uncorrelated displacement of the pieces and much more constrained movement within the pieces.
Datum vypsn:2018-05-29




Nzev:Registration of ophthalmological sequences
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:The task is to develop an algorithm for motion compensation of ophthalmological sequences. The task is challenging because the motion is not smooth in time and because there are artifacts due to illumination.
Datum vypsn:2018-05-29




Nzev:Segmentation and joint-segmentation of aorta from histological and ultrasound images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic , Jan Hering Dipl.-Math.
Popis:We have a dataset of ex vivo ultrasound and histological images of the aorta. The final task is to non-invasively detect arteriosclerosis and its prognosis. Current image processing tasks include:

1. Identifying the lumen and different tissue types (including plaques) in the histological images

2. Identifying the lumen and hopefully also other tissue types in the ultrasound images.

3. Reconstruct 3D volumes and spatially register microscopy and ultrasound data.

4. Joint segmentation of the ultrasound and histological images.

5. Image-based classification of the disease from both the microscopical and ultrasound data.
Datum vypsn:2018-05-29




Nzev:Thickness measurement from ultrasound RF images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:For applications such as arteriosclerosis detection, it is interesting to estimate thickness of layers in the blood vessel walls. However, the limited spatial resolution from a standard B-mode image does not allow sufficient accuracy. Processing directly the raw RF signal should enable a better accuracy. This work is a combination of practical experiments with a portable ultrasound machine and implementation of signal processing algorithms.
Datum vypsn:2018-05-29




Nzev:Ultrasound vessel wall texture classification
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Analyze ultrasound images and sequences of carotid arteries to extract the layer thickness, motion and texture of the vessel wall from in-vivo ultrasound images in an attempt to detect and distinguish different types of arteriosclerosis. This is an exploratory work, the challenge is the limited spatial resolution of the ultrasound.
Datum vypsn:2018-05-29




Nzev:Unsupervised joint segmentation of two images
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Given two images of the same scene but from different modalities, the task is to find their common segmentation. This problem is encountered for example in multimodality imaging, or as a subtask of iterative segmentation/registration. One possible formulation is that we want to approximate as well ass possible the target image using a segmentation and an appearance model for each class. We shall study various variations of this idea, e.g. how the approximation quality should be measured and how the resulting optimization should be performed.
Datum vypsn:2018-05-29




Nzev:Web based infrastructure for image processing and analysis
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Prof. Dr. Ing. Jan Kybic
Popis:Develop a modular web-based software system for image processing and analysis. The idea is that clients, e.g. clinicians, would not need to install any special software to use our image processing algorithms, and would use a web browser instead. Image processing modules will run on a server as a web service and can be written in a variety of programming languages (Python, Matlab, C, Julia,...). It should be easy to plug-in existing tools such as ImageJ(Fiji), or Ilastik. Clients will connect using their web browser and will be able to have their images processed. The web client should also support efficient annotations, i.e. manual labeling and segmentation. The system should support large number of large images, images in both 2D and 3D remote image servers, including DICOM servers.


The project may be based on extending existing similar systems such as Bisque (http://bioimage.ucsb.edu/bisque) or Omero (https://www.openmicroscopy.org/omero/).
Datum vypsn:2018-05-29




Nzev:Action recognition in long videos
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Popis:The millions of cameras that are deployed every year generate a large amount of recorded, stored and transmitted video. In particular, a large proportion of this video depicts events about people, their activities, and behaviors. In order to effectively interpret this data, computer vision algorithms need the ability to understand and recognize human actions.

Web skolitele: http://cmp.felk.cvut.cz/~zimmerk/

Preffered qualification:
- B or better result achieved in a programming oriented subject or even better: the active participation in a programming competition (e.g. CTU Open Contest, ACM ICPC).
- B or better result achieved in a computer vision oriented subject.
- experience with Python and Tensorflow
- good mathemathical background.
Datum vypsn:2017-10-10




Nzev:Automatick vyhodnocovn algoritm potaovho vidn
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Popis:Nedílnou součástí výzkumu algoritmů počítačového vidění je schopnost
rychle a automaticky vyhodnocovat výsledky. To vyžaduje (i) tzv ground
truth, tj. obrazová data opatřená znalostí pravdy (např. přítomnost
objektů na daných pozicích pro úlohu detekce) a (ii) metriku
popisující kvalitu výsledků. Získávání ground truth je časově velmi
náročné proto se často volí poloautomatická metoda, kdy člověk pouze
opravuje/doplňuje automaticky pořízené výsledky. Vhodné měření kvality
výsledků je také netriviální problém, například vyhodnocování kvality
algoritmu pro detekci a sledování mnoha podobných objektů (např. lidí
ve videosekvenci) může měřit počet záměn trajektorií, počet
nenalezených objektů či počet falešných detekcí.

Navrhněte vhodnou metriku pro měření kvality algoritmů detekce
sledování a vhodnou metodu pro získávání ground truth. Řešemí
naimplementujte nejlépe v prostředí MATLAB.
Datum vypsn:2010-05-28




Nzev:Autonomn zen robotu na nestrukturovanm ternu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Popis:V Centru Strojového Vnímaní (CMP) na Katedře Kybernetiky vyvíjíme v rámci Evropského projektu TRADR robota záchranáře (http://cmp.felk.cvut.cz/demos/robotics/mobile-robots). Jednou z důležitých funkcionalit je autonomní řízení robotu a odhad tvaru přejížděného terénu (a to i v případě kdy lidar selhává např. kvůli hustému kouři, či velké odrazivosti povrchu). Znalost terénu umožňuje autonomní prediktivní řízení fliperů. Navrhněte a prakticky ověřte algoritmus pro autonomní mapování a řízení robotu na nestrukturovaném terénu.





Web skolitele: http://cmp.felk.cvut.cz/~zimmerk/

Preffered qualification:
- B or better result achieved in a programming oriented subject or even better: the active participation in a programming competition (e.g. CTU Open Contest, ACM ICPC).
- B or better result achieved in a computer vision oriented subject.
- experience with Python and Tensorflow
- good mathemathical background.
Datum vypsn:2017-10-10




Nzev:Kalibrace kamery a 3D laserovho scaneru pro robota zchrane
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.,Doc. Ing. Tom Svoboda Ph.D.
Popis: V současné době se v Centru Strojového vnímání pracuje na Evropském výzkumném projektu Nifti, ve které je budován robot pomáhající lidem při nebezpečných zachranných operacích, kde hrozí například nebezpečí výbuchu či kolapsu budovy. Robot bude (mimo jiné) vybaven panoramatickou kamerou Ladybug 3, která bude snímat 360 stupňů široké okolí, termo kamerou a 3D laserovým scanerem.

Jednou z důležitých úloh je umísťování objektů nalezených v kamerách do online budované 3D mapy prouzkoumavaného světa získaného laserovým scanerem. Navrhněte a naimplementujte algoritmus umožňující přenášet objekty z prostoru kamer do 3D mapy (tj. kalibrace mezi kamerou a scanerem). Algoritmus navrhněte v prostředí MATLAB/C++.
Datum vypsn:2010-05-28




Nzev:Sledovn objektu ve 3D pro virtuln realitu.
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.,Doc. Ing. Tom Svoboda Ph.D.
Popis:Jedním ze slibných podproblémů projektu, na kterém se nyní pracuje v Centru Strojového Vnímání (CMP), je real-time trackování (např. cd_box nebo human_head) ve 3D prostoru z jedné či více kamer. V současné době se ukazuje, že trackování opakovanou detekcí dobře odlišitelných (též významných) bodů je nejrobustnější řešení, které je současně i efektivní. Cílem práce je implementace trackeru používajícího předem naučený geometrický model spolu s "přilepenými" význačnými body. Algoritmus v příchozím obrázku z kamery nejdříve detekuje význačné body a z určených korespondencí mezi obrazem a modelem určí pozici sledovaného objektu.

Případný zájemce může přímo kontaktovat vedoucího práce Karla Zimmermanna zimmerk@cmp.felk.cvut.cz. Literatura bude poskytnuta.


Datum vypsn:2007-11-01




Nzev:Sledovn vce objekt v multikamerovm systmu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Doc. Ing. Karel Zimmermann Ph.D.
Popis:



V současné době v Centru Strojového Vnímání pracujeme na multikamerovém projektu, jehož nedílnou součástí je sledování několika nezávislých objektů. Cílem práce je navrhnout a implementovat systém, který je schopen zpracovat informaci z více kamer najednou a v reálném čase detekovat a případně sledovat objekty v zorném poli kamer. Modul pro snímání a segmentaci pohybujících se objektů v jednotlivých kamerách je k dispozici. Programování v C++ pod Linuxem a/nebo v MATLABu.
Datum vypsn:2007-10-31




Nzev:Detektor oblasti zaujmu pre hladanie korespondencii
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Michal Peroch Ph.D.,Prof. Ing. Ji Matas Dr.
Popis:Detekcia oblasti zaujmu je prvym krokom riesenia ulohy najdenia korespondencii medzi obrazkami. Sucasne detektory su uspesne pri hladani oblasti pre triedu kontrastnych scen s vyraznymi strukturami v obraze. Stale sa vsak hladaju nove metody ktore by triedu rozsirili.
Datum vypsn:2007-10-30




Nzev:Spolahliva detekcia kontury pre rozpoznavanie a segmentaciu objektov
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Michal Peroch Ph.D.,Prof. Ing. Ji Matas Dr.
Popis:Tvar je dolezitou vizualnou charakteristikou pre rozpoznavanie, segmentaciu objektov v obraze, resp. obecne pre porozumenie 3D struktury sceny. Vyuzitie informacii o tvare vsak vyzaduje spolahlivu metodu detekcie hranic objektov, co je samo o sebe zlozita uloha. Jednym z perspektivnych pristupov [1] je vyuzitie videa pre najdenie kontury objektu. V tejto metode je pre kazdy rozpoznavany objekt v dispozicii kratka sekvencia zachytavajuca pohyb kamery okolo objektu. Tato informacia je pouzita pre zvysenie spolahlivosti detekcie kontury objektu.
Datum vypsn:2007-10-30




Nzev:Optimalizace parametr segmentanho algoritmu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Popis:

Při vývoji algoritmu, jako je segmentace obrazu na pozadí a pohybující se objekty, se nevyhneme použití parametrů, které ovlivňují fungování algoritmu. V různých situacích pak používáme různá nastavení na základě zkušenosti, která ovšem nemusí být optimální.

Úkolem této práce je navrhnout metodu pro vyhodnocení úspěšnosti segmentačního algoritmu při daném nastavení parametrů a vyzkoušet a porovnat několik různých metod (např. z oblasti evolučních algoritmů) optimalizace těchto parametrů. Porovnání nalezených optimálních parametrů pro různé situace (kancelář, továrna, exterier ...) může vést k zredukování jejich počtu případně nalezení automatické metody jejich stanovení bez nutnosti optimalizace.

Segmentace je již naimplementována (OS Linux), pro tuto práci bude použita pouze jako "černá skříňka".

Více informací.

Datum vypsn:2006-10-12




Nzev:Umstn kamer do pdorysu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Popis:


Prvním krokem k dobře fungujícímu vícekamerovému systému (nehledě na aplikaci) je dobré rozmístění kamer. Například pro interakci s projekční stěnou chceme co nejlépe pokrýt prostor před stěnou. Na druhou stranu není žádoucí, aby kamery zabíraly jiné části místnosti, ať už kvůli rušivému pozadí nebo zachovaní soukromí. K dispozici typicky méme jen omezený počet kamer, které mohou mít různou ohniskovou vzdálenost či rozlišení a chceme je co nejlépe využít.

Úkolem této práce je implementace existujicí metody pro nalezení optimálního rozmístění kamer pro danou aplikaci. Alternativně lze těžiště práce přesunout do tvorby interaktivního grafickeho nastroje, který umožní zadat půdorys mistnosti a požadované zóny pokrytí s cílem propojit ho s vícekamerovým systémem např. pro zobrazení pozice sledovaných objektů online.

Datum vypsn:2006-10-12




Nzev:Vyhodnocen rozvren stihu ve vcekamerov sekvenci
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Popis:

Chceme-li někomu prezentovat video z vícekamerového systému, narážíme na problém, že člověk není schopen sledovat obraz z většího množství pohledů současně. Je tedy vhodné ukázat vždy jen ten pohled, který nejlépe podá informaci o tom, co se ve scéně odehrává - tak to dělá např. režisér přímého televizního přenosu.

K dispozici je několik metod pro rozvržení střihu, hlavním úkolem práce je návrh metody pro automatické vyhodnocení výsledků na základě vzorového řešení rozmístění střihu provedeného člověkem. Druhým krokem je využití vytvořeného vzorového řešení pro optimalizaci parametrů metody rozvržení střihu pomocí strojového učení.

Předchozí DP. Téma je součástí projektu Multicam.

Datum vypsn:2008-02-13




Nzev:Vyuit grafick karty pro sledovn
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Popis:

Ačkoliv je grafická karta primárně navržena pro zobrazování, začíná být stále častěji používána i v počítačovém vidění pro real-time aplikace. Např. algoritmy pro segmentaci nebo stereo obsahují kroky, kdy se pro každý bod obrazu provádí nějaké základní operace, které je grafický hardware schopný provést řádově rychleji než CPU. Úkolem této práce je prozkoumat možnosti, které grafická karta nabízí, a demonstrovat je implementací vybraného algoritmu z oblasti počítačového vidění, v němž budou některé operace prováděny na grafickém procesoru. Implementace pro OS Linux, možné využití knihovny OpenVIDIA.

Datum vypsn:2006-10-12




Nzev:Zacleneni sitovych, USB a aktivnich kamer do MultiCam systemu
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Petr Doubek Dr.sc. ETH
Popis:Nas vicekamerovy system v soucasne dobe pracuje temer vyhradne s FireWire kamerami, ovsem v urcitych situacich muze byt z dovodu delky kabelu nebo ceny vyhodnejsi pouzit jiny typ kamer, napr. ethernetove sitove kamery nebo USB kamery. Z hlediska pridani dalsich funkci se nabizi i rozsireni na aktivni pan-tilt-zoom kamery.

Ukolem teto prace je implementace modulu, ktery prijima pozadavek na sejmuti obrazu z uvedenych typu kamer (resp. ze zvolene podmnoziny). Jako vzor je k dispozici modul pro FireWire kamery, nove vytvarene moduly prevezmou jeho rozhrani pro komunikaci s ostatnimi moduly systemu (TCP/IP, sdilena pamet), pripadne toto rozhrani dale vylepsi, tak aby system MultiCam mohl s kamerou pracovat nezavisle na jejim typu.

Dalsi problemy, ktere lze resit v navaznosti na tento ukol:

  • barevna kalibrace kamer (jeden predmet ma mit stejnou barvu ve vsech kamerach)
  • konstrukce panoramatickeho obrazu sceny pan-tilt-zoom kamerou
  • nasledne upresneni pozice pan-tilt-zoom kamery registraci vuci tomuto obrazu
Implementace pro OS Linux v C/C++.
Více informací.
Datum vypsn:2007-10-31




Nzev:Rolling shutter benchmark
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:RNDr. Zuzana Kkelov Ph.D.
Popis:CMOS sensors that are used in vast majority of today’s consumer cameras, smartphones etc. use the rolling shutter (RS) mechanism to capture images. The key difference is that with the global shutter, the entire image is exposed to the light at once, whereas when using the RS the individual image rows (or columns) are captured at different times. When a RS camera moves while capturing the image, several types of distortion such as smear, skew or wobble appear. A perspective camera model is no longer valid in this case and that can be a problem when using methods assuming this model.
Recently several algorithms for calibrating RS cameras have been proposed. These algorithms are usually evaluated on a very limited set of images (videos) without a ground truth. While there exist many benchmark datasets with ground truth camera calibrations and positions for perspective cameras, such datasets for RS cameras are still missing. The goal of this project is to create a benchmark dataset for RS cameras. The student/students will collect images/videos for different camera setups (a single RS camera, a stereo rig, two cameras with different rolling shutter directions or different frame rates, different types of camera movements (translations, rotations) during the image exposure….). Ground truth calibrations will be obtained using standard calibration methods, using a global shutter camera, and a controlled motion.
For bachelor/master thesis the student will evaluate different state-of-the-art methods for RS calibration on the new proposed dataset. Based on the obtained results, the student will try to address challenging configurations (degenerate configurations) for different RS models.
Datum vypsn:2018-05-27




Nzev:Rozpoznvn chemickch rovnic s pouitm neuronovch st a gramatik
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:RNDr. Daniel Pra Ph.D.
Popis:Cílem práce je návrh a implementace systému pro automatické rozpoznávání chemických rovnic v rastrovém obrázku, za předpokladu, že na obrázku je oskenovaná tištěná chemická rovnice. Prostředky pro realizaci systému jsou neuronové sítě a parser gramatiky popisující strukturu chemické rovnice.
Datum vypsn:2018-05-25




Nzev:Nvrh a implementace grafickho rozhran pro rozpoznvn vvojovch diagram
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Ing. Martin Bresler
Popis:Vývojový diagram je druh diagramu, který slouží ke grafickému znázornění jednotlivých kroků algoritmu nebo obecného procesu. Vývojové diagramy jsou často využívány v rozličných odvětvích a jejich tvorba může být těžkopádná. S nástupem tabletů a dotykových displejů obecně je cílem vytvářet diagramy člověku přirozeným způsobem - kresbou. Na tabletu nakreslený diagram je tedy nutné převést do vnitřní reprezentace programu (rozpoznat) a vizualizovat v určitém grafickém stylu.



Cílem práce je převést anotovanou databázi diagramů ve formátu XML do navržené vnitřní reprezentace a vytvořit grafické rozhraní, které na základě vnitřní reprezentace bude diagramy vizualizovat. Dalším možným krokem je propojení grafického rozhraní se stávajícími rozpoznávacími algoritmy. Aplikace bude implementována v jazyce C#.
Zájemci mohou přímo kontaktovat vedoucího práce a domluvit si nezávaznou schůzku.
Datum vypsn:2012-11-14




Nzev:Deep learning for automatic detection of multiple myeloma in CT of femurs
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc: Jan Hering Dipl.-Math.
Popis:The diagnostics of multiple myeloma (a type of bone marrow cancer) uses blood plasma tests as well as CT images of large bones (femurs in this case). From the methodical point of view, these data represent a situation to be found more often in next years -- we don't have fully annotated images at voxel level, since this work is very time consuming, but are provided only with a 'global' label (healthy / diseased), which comes naturally from the diagnosis. By means of Multiple-Instance Learning (MIL) we are able to reach reasonable precision in the classification.

However, the interesting question how a deep-learning system will perform is still without answer. The aim of this work is to implement a selected CNN architecture, or to compare multiple architectures, and evaluate it's performance against the current system.


This work thus brings the opportunity to learn more about the newest methods in machine learning, to improve own programming skills as well as to get in touch with the field of medical imaging and computer assisted diagnosis.
Datum vypsn:2018-05-23




Nzev:Hlubok uen pro klasifikaci histopatologickch dat
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc: Jan Hering Dipl.-Math.
Popis:Díky své úspěšnosti v řešení problémů – od klasifikace fotografií, rozpoznávání obličejů ale také např. detekce síťového útoku – se hluboké učení, tj. učení pomocí hlubokých konvolučních sítí do popředí při řešení problémů pomocí strojového učení.

Histopatologické vyhodnocení tkáně je jednou ze základních diagnostických metod v interní medicíně. Tenké vrstvy odebraných vzorků tkání se nejprve reakcí se specifickými barvivy obarví a posléze nasnímají na elektronovém mikroskopu. Velikost takových obrázků v digitální podobě dosahuje až miliardy pixelů, počty takových snímků v rámci běžné klinické praxe díky dostupnosti přístrojů se neustále zvětšují. Spolehlivý systém automatické diagnózy a detekce nádorem zasažené tkáně může výrazně usnadnit práci a ušetřit čas lidským expertům, kteří všechny snímky musí vyhodnotit manuálně.


Náplní a očekávaným výstupem práce je implementace vybrané architektury konvoluční sítě podle nejnovější literatury, a sice v jazyce Python a dále její evaluace pro klasifikaci histopatologických snímků datové sady PETACC, která obsahuje obarvené řezy tkáně tlustého střeva.
Datum vypsn:2018-05-23




Nzev:Automatick kalibrace pomoc ?sebedotyku? a sebepozorovn u dvojrukho prmyslovho manipultoru
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Matj Hoffmann Ph.D.
Popis:Cílem práce je automatická kalibrace dvourukého průmyslového manipulátoru bez použití externích měřících zařízení. Robot se kalibruje sám a to za použití: a) sebepozorování pomocí kamer, které jsou součástí zařízení, b) “sebe-dotyku” s pomocí silové zpětné vazby, c) dotyku s prostředím (např. stůl). Úkolem je porovnat tyto metody mezi sebou a to jak teoreticky tak prakticky a zhodnotit jejich vhodnost pro nasazení v průmyslové praxi.

Ukázková videa:
https://youtu.be/7azecm1H2zQ
https://youtu.be/rd7c6T2HyMs
Datum vypsn:2018-05-18




Nzev:Kalibrace uml ke na humanoidnm robotu Nao
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Matj Hoffmann Ph.D.
Popis:Máme k dispozici unikátní verzi robota Nao s taktilními senzory po celém povrchu těla (ruce, trup, obličej). Rozložení a rozměry kůže ve 2D jsou známy, ale jejich pozice na těle robota (ve 3D) nikoli. Cílem práce je získat souřadnice jednotlivých taktilních čidel na povrchu těla robota vzhledem k jeho kinematickému modelu. Výchozí možností je optimalizace kombinující omezující podmínky 2D modelu kůže a 3D CAD modelu, ze kterého známe umístění některých částí pole senzorů. Pro ověření či dokalibrování je možné použít další senzory na těle robota (kamery, inerciální senzory) či sebe-dotykové konfigurace.

ilustrační video (na robotu iCub): https://youtu.be/pfse424t5mQ
Datum vypsn:2018-05-18




Nzev:Sebe-explorace a tvorba modelu tla u humanoidnho robota s umlou k
Obor:Kybernetika a men
Katedra:Katedra kybernetiky
Vedouc:Mgr. Matj Hoffmann Ph.D.,Doc. Ing. Karel Zimmermann Ph.D.
Popis:Cílem práce je na simulátoru humanoidního robota s umělou kůží a poté na skutečném robotovi vyvinout algoritmy, které efektivně generují konfigurace, kde dochází k "sebedotyku", a zároveň učit model robota (přímá a inverzní kinematika). K prohledávání lze použít tzv. "active goal babbling" či učení s posilováním.
Videopříklady:
https://youtu.be/7f9Mfl7sO18
https://youtu.be/a81K1kAD_gM
https://youtu.be/pfse424t5mQ
Datum vypsn:2018-05-18