Neuronové sítě pro automatickou detekci log v obraze

dc.contributorRott Michal, Ing. : 63020
dc.contributor.advisorPaleček Karel, Ing. Ph.D. : 61120
dc.contributor.authorNovák, Zbyněk
dc.contributor.otherMatějů Lukáš, Ing. Konzultant : 64645
dc.date.accessioned2019-08-23T08:33:42Z
dc.date.available2019-08-23T08:33:42Z
dc.date.committed2019-4-30
dc.date.defense2019-05-29
dc.date.submitted2018-10-18
dc.date.updated2019-5-29
dc.degree.levelBc.
dc.description.abstractTato práce se zabývá problematikou hlubokého učení a neuronových sítí v rámci detekce log v obraze. Cílem je vytvoření rešerše v oblasti aplikace neuronových sítí pro detekci objektů a log v obraze a otestování vybraných modelů pro detekci log v obraze na vybraných testovacích databázích.V rešeršní části je vysvětlen pojem hluboké učení a uvedeny příklady jeho konkrétního využití v praxi v rámci detekce objektů v obraze. Jsou popsány neuronové sítě, architektura dopředné neuronové sítě a typ učení s učitelem, které se využívají pro detekci objektů v obraze. Dále je popsána klasifikace objektů pomocí konvolučních neuronových sítí. Jsou představeny stávající systémy, používané pro detekci log v obraze, a trénovací databáze log.Pro otestování byly vybrány dva modely, a to YOLOv3, implementovaný pomocí frameworku PyTorch, a Faster R-CNN, implementovaný pomocí frameworku Tensorflow. V rešeršní části jsou tyto modely a použité frameworky popsány a navzájem porovnány. Pro testování byly vybrány dva datasety, a to dataset FlickrLogos-32 a dataset TopLogo-10.Detektor YOLOv3 byl testován ve dvou variantách - ve verzi YOLOv3-tiny, která je rychlejší a méně výpočetně náročná, a v plnohodnotné verzi YOLOv3. Tento detektor dosáhl ve verzi YOLOv3 nejvyšší přesnosti 45 % v čase 22 hodin na datasetu FlickrLogos-32 a přesnosti 59 % v čase 11 hodin na datasetu TopLogo-10. Verze YOLOv3-tiny byla čtyřikrát rychlejší, ale oproti plnohodnotné verzi měla na obou datasetech třetinovou přesnost.Detektor Faster R-CNN dosáhl nejvyšší přesnosti 60 % na datasetu FlickrLogos-32 a 67 % na datasetu TopLogo-10. V obou případech trvalo trénování 7 hodin. Z výsledků testování vyplývá, že ačkoli měl být detektor YOLOv3 rychlejší než detektor Faster R-CNN a měl dosahovat obdobné přesnosti, byl pomalejší a dosahoval menších přesností na obou datasetech. To mohlo být způsobeno implementací detektoru YOLOv3, která obsahovala implementační chyby. Detektor Faster R-CNN je tak v tomto případě lepší volbou pro detekci log v obraze.cs
dc.description.abstractThis thesis deals with the topic of deep learning and neural networks. The aim is to do research in the field of application of neural networks for object and logo detection and to test the chosen models for logo detection on chosen databases. In the research part, the concept of deep learning is explained and examples of its practical use in object detection are given. Neural networks are described/explained, as well as Feed-Forward architecture and supervised learning, which are used for object detection. Next, object classification using convolutional neural networks is described. Existing systems, used for logo detection, and logo training databases are presented. Two models were selected for testing , namely YOLOv3, implemented with PyTorch framework, and Faster R-CNN, implemented with Tensorflow framework. In the research part these models and used frameworks are described and compared. Two datasets, the FlickrLogos-32 dataset and the TopLogo-10 dataset, were selected for testing. The YOLOv3 detector was tested in two versions - the YOLOv3-tiny version, which is faster and less computationally demanding, and in the full-featured version of YOLOv3. The YOLOv3 detector achieved the highest accuracy of 45 % at 22 hours on the FlickrLogos-32 dataset and accuracy of 59 % at 11 hours on the TopLogo-10 dataset. The YOLOv3-tiny version was four times faster, but compared to the full-featured version, it had a one-third accuracy on both datasets. The Faster R-CNN detector reached the highest accuracy of 60 % on the FlickrLogos-32 dataset and 67 % on the TopLogo-10. In both cases, model was trained for 7 hours. The test results indicate that although the YOLOv3 detector supposed to be faster than Faster R-CNN detector and should achieve similar accuracy (according to the documentation), it was slower and less accurate on both datasets. This could be due to bad implementation of the YOLOv3 detector. In this case, the Faster R-CNN detector proved to be a better choice for logo detection.en
dc.description.mark
dc.format62 s.
dc.format.extent1 DVD ROM
dc.identifier.signatureV 201900960
dc.identifier.urihttps://dspace.tul.cz/handle/15240/153303
dc.language.isocs
dc.relation.isbasedonbeginarab renewcommandlabelenumi[arabicenumi] item Goodfellow, I., Bengio, Y., Courville, A. Deep learning. MIT Press, 2016. ISBN: 978-0262035613 item Bishop, C. Pattern Recognition and Machine Learning. 2006. ISBN 13: 978-038731073 item Karpathy, A., Johnson, J., Li, F. Convolutional neural neworks for visual recognition, dostupné online: https://cs231n.stanford.edu endarab
dc.rightsVysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26cs
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26en
dc.rights.urihttps://knihovna.tul.cz/document/26
dc.rights.urihttps://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subjectCOCOcs
dc.subjectDetekce objektůcs
dc.subjectdetekce logcs
dc.subjectFaster R-CNNcs
dc.subjectFlickrLogos-32cs
dc.subjecthluboké učenícs
dc.subjectkonvoluční neuronové sítěcs
dc.subjectneuronové sítěcs
dc.subjectopenCVcs
dc.subjectPythoncs
dc.subjectPyTorchcs
dc.subjectTopLogo-10cs
dc.subjectTensorflowcs
dc.subjectYOLOv3cs
dc.subjectCOCOen
dc.subjectObject detectionen
dc.subjectlogo detectionen
dc.subjectFaster R-CNNen
dc.subjectFlickrLogos-32en
dc.subjectdeep learningen
dc.subjectconvolutional neural networken
dc.subjectneural networken
dc.subjectopenCVen
dc.subjectPythonen
dc.subjectPyTorchen
dc.subjectTopLogo-10en
dc.subjectTensorflowen
dc.subjectYOLOv3en
dc.subject.verbisinformation technologyen
dc.titleNeuronové sítě pro automatickou detekci log v obrazecs
dc.titleNeural networks for automatic logo detectionen
dc.typebakalářská prácecs
local.degree.abbreviationBakalářský
local.degree.disciplineIT
local.degree.programmeInformační technologie
local.degree.programmeabbreviationB2646
local.department.abbreviationITE
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.faculty.abbreviationFM
local.identifier.authorM18000105
local.identifier.stag38741
local.identifier.verbiskpw06582630
local.note.administratorsautomat
local.poradovecislo960
local.verbis.aktualizace2019-10-05 07:28:00cs
local.verbis.studijniprogramITE Informační technologie/Informační technologiecs
Files
Original bundle
Now showing 1 - 5 of 5
Loading...
Thumbnail Image
Name:
Priloha_A.zip
Size:
36.34 MB
Format:
Unknown data format
Description:
VSKP
Loading...
Thumbnail Image
Name:
bakalarska_prace_2019_Zbynek_Novak.pdf
Size:
1.53 MB
Format:
Adobe Portable Document Format
Description:
VSKP
Loading...
Thumbnail Image
Name:
BP_Zbynek_Novak_oponent.pdf
Size:
676.16 KB
Format:
Adobe Portable Document Format
Description:
Posudek_oponenta_VSKP
Loading...
Thumbnail Image
Name:
BP_Zbynek_Novak_vedouci.pdf
Size:
717.85 KB
Format:
Adobe Portable Document Format
Description:
Posudek_vedouciho_VSKP
Loading...
Thumbnail Image
Name:
ProtokolSPrubehemObhajobySTAG.pdf
Size:
15.18 KB
Format:
Adobe Portable Document Format
Description:
Prubeh_obhajoby_VSKP