dc.contributor	Rott Michal, Ing. : 63020
dc.contributor.advisor	Paleček Karel, Ing. Ph.D. : 61120
dc.contributor.author	Novák, Zbyněk
dc.contributor.other	Matějů Lukáš, Ing. Konzultant : 64645
dc.date.accessioned	2019-08-23T08:33:42Z
dc.date.available	2019-08-23T08:33:42Z
dc.date.committed	2019-4-30
dc.date.defense	2019-05-29
dc.date.submitted	2018-10-18
dc.date.updated	2019-5-29
dc.degree.level	Bc.
dc.description.abstract	Tato práce se zabývá problematikou hlubokého učení a neuronových sítí v rámci detekce log v obraze. Cílem je vytvoření rešerše v oblasti aplikace neuronových sítí pro detekci objektů a log v obraze a otestování vybraných modelů pro detekci log v obraze na vybraných testovacích databázích.V rešeršní části je vysvětlen pojem hluboké učení a uvedeny příklady jeho konkrétního využití v praxi v rámci detekce objektů v obraze. Jsou popsány neuronové sítě, architektura dopředné neuronové sítě a typ učení s učitelem, které se využívají pro detekci objektů v obraze. Dále je popsána klasifikace objektů pomocí konvolučních neuronových sítí. Jsou představeny stávající systémy, používané pro detekci log v obraze, a trénovací databáze log.Pro otestování byly vybrány dva modely, a to YOLOv3, implementovaný pomocí frameworku PyTorch, a Faster R-CNN, implementovaný pomocí frameworku Tensorflow. V rešeršní části jsou tyto modely a použité frameworky popsány a navzájem porovnány. Pro testování byly vybrány dva datasety, a to dataset FlickrLogos-32 a dataset TopLogo-10.Detektor YOLOv3 byl testován ve dvou variantách - ve verzi YOLOv3-tiny, která je rychlejší a méně výpočetně náročná, a v plnohodnotné verzi YOLOv3. Tento detektor dosáhl ve verzi YOLOv3 nejvyšší přesnosti 45 % v čase 22 hodin na datasetu FlickrLogos-32 a přesnosti 59 % v čase 11 hodin na datasetu TopLogo-10. Verze YOLOv3-tiny byla čtyřikrát rychlejší, ale oproti plnohodnotné verzi měla na obou datasetech třetinovou přesnost.Detektor Faster R-CNN dosáhl nejvyšší přesnosti 60 % na datasetu FlickrLogos-32 a 67 % na datasetu TopLogo-10. V obou případech trvalo trénování 7 hodin. Z výsledků testování vyplývá, že ačkoli měl být detektor YOLOv3 rychlejší než detektor Faster R-CNN a měl dosahovat obdobné přesnosti, byl pomalejší a dosahoval menších přesností na obou datasetech. To mohlo být způsobeno implementací detektoru YOLOv3, která obsahovala implementační chyby. Detektor Faster R-CNN je tak v tomto případě lepší volbou pro detekci log v obraze.	cs
dc.description.abstract	This thesis deals with the topic of deep learning and neural networks. The aim is to do research in the field of application of neural networks for object and logo detection and to test the chosen models for logo detection on chosen databases. In the research part, the concept of deep learning is explained and examples of its practical use in object detection are given. Neural networks are described/explained, as well as Feed-Forward architecture and supervised learning, which are used for object detection. Next, object classification using convolutional neural networks is described. Existing systems, used for logo detection, and logo training databases are presented. Two models were selected for testing , namely YOLOv3, implemented with PyTorch framework, and Faster R-CNN, implemented with Tensorflow framework. In the research part these models and used frameworks are described and compared. Two datasets, the FlickrLogos-32 dataset and the TopLogo-10 dataset, were selected for testing. The YOLOv3 detector was tested in two versions - the YOLOv3-tiny version, which is faster and less computationally demanding, and in the full-featured version of YOLOv3. The YOLOv3 detector achieved the highest accuracy of 45 % at 22 hours on the FlickrLogos-32 dataset and accuracy of 59 % at 11 hours on the TopLogo-10 dataset. The YOLOv3-tiny version was four times faster, but compared to the full-featured version, it had a one-third accuracy on both datasets. The Faster R-CNN detector reached the highest accuracy of 60 % on the FlickrLogos-32 dataset and 67 % on the TopLogo-10. In both cases, model was trained for 7 hours. The test results indicate that although the YOLOv3 detector supposed to be faster than Faster R-CNN detector and should achieve similar accuracy (according to the documentation), it was slower and less accurate on both datasets. This could be due to bad implementation of the YOLOv3 detector. In this case, the Faster R-CNN detector proved to be a better choice for logo detection.	en
dc.description.mark
dc.format	62 s.
dc.format.extent	1 DVD ROM
dc.identifier.signature	V 201900960
dc.identifier.uri	https://dspace.tul.cz/handle/15240/153303
dc.language.iso	cs
dc.relation.isbasedon	beginarab renewcommandlabelenumi[arabicenumi] item Goodfellow, I., Bengio, Y., Courville, A. Deep learning. MIT Press, 2016. ISBN: 978-0262035613 item Bishop, C. Pattern Recognition and Machine Learning. 2006. ISBN 13: 978-038731073 item Karpathy, A., Johnson, J., Li, F. Convolutional neural neworks for visual recognition, dostupné online: https://cs231n.stanford.edu endarab
dc.rights	Vysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26	cs
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26	en
dc.rights.uri	https://knihovna.tul.cz/document/26
dc.rights.uri	https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subject	COCO	cs
dc.subject	Detekce objektů	cs
dc.subject	detekce log	cs
dc.subject	Faster R-CNN	cs
dc.subject	FlickrLogos-32	cs
dc.subject	hluboké učení	cs
dc.subject	konvoluční neuronové sítě	cs
dc.subject	neuronové sítě	cs
dc.subject	openCV	cs
dc.subject	Python	cs
dc.subject	PyTorch	cs
dc.subject	TopLogo-10	cs
dc.subject	Tensorflow	cs
dc.subject	YOLOv3	cs
dc.subject	COCO	en
dc.subject	Object detection	en
dc.subject	logo detection	en
dc.subject	Faster R-CNN	en
dc.subject	FlickrLogos-32	en
dc.subject	deep learning	en
dc.subject	convolutional neural network	en
dc.subject	neural network	en
dc.subject	openCV	en
dc.subject	Python	en
dc.subject	PyTorch	en
dc.subject	TopLogo-10	en
dc.subject	Tensorflow	en
dc.subject	YOLOv3	en
dc.subject.verbis	information technology	en
dc.title	Neuronové sítě pro automatickou detekci log v obraze	cs
dc.title	Neural networks for automatic logo detection	en
dc.type	bakalářská práce	cs
local.degree.abbreviation	Bakalářský
local.degree.discipline	IT
local.degree.programme	Informační technologie
local.degree.programmeabbreviation	B2646
local.department.abbreviation	ITE
local.faculty	Fakulta mechatroniky, informatiky a mezioborových studií	cs
local.faculty.abbreviation	FM
local.identifier.author	M18000105
local.identifier.stag	38741
local.identifier.verbis	kpw06582630
local.note.administrators	automat
local.poradovecislo	960
local.verbis.aktualizace	2019-10-05 07:28:00	cs
local.verbis.studijniprogram	ITE Informační technologie/Informační technologie	cs

Neuronové sítě pro automatickou detekci log v obraze

Files

Original bundle

Collections