Rozpoznávání emocí v audio nahrávkách s využitím hlubokých neuronových sítí

dc.contributorBoháč Marek, Ing. : 61118
dc.contributor.advisorMatějů Lukáš, Ing. Ph.D. : 64645
dc.contributor.authorPetříček, Tomáš
dc.date.accessioned2021-08-20T07:40:06Z
dc.date.available2021-08-20T07:40:06Z
dc.date.committed2021-5-17
dc.date.defense2021-06-16
dc.date.issued2020-10-19
dc.date.submitted2020-10-19
dc.date.updated2021-6-16
dc.degree.levelBc.
dc.description.abstractBakalářská práce se věnuje rozpoznávání emocí v audio nahrávkách s využitím hlubokých neuronových sítí. V úvodní části je čtenář seznámen s motivací a využitím systému pro rozpoznávání emocí. Na začátku první kapitoly jsou definovány pojmy emoce a rozpoznávání emocí. Navazující podkapitoly jsou zaměřeny na vývoj systému pro rozpoznávání emocí. Další kapitola je věnována seznámení se základy neuronových sítí. Je uveden model používaný v experimentální části práce, vysvětleno trénování a vyhodnocení modelu. V následující části je popsán návrh a práce s balíčkem pro rozpoznávání emocí napsaném v jazyce Python. Poslední kapitola představuje experimenty provedené na datové sadě získané sjednocením datových sad RAVDESS, TESS, SAVEE a EMOVO. Pro klasifikaci byla použita neuronová síť typu MLP. Byla implementována a natrénována pomocí frameworku PyTorch. MFCC příznaky byly zvoleny pro učení modelu. Provedené experimenty byly zdokumentovány a rozebrány. V závěru práce jsou shrnuty výsledky a navrženy metody pro dosažení lepších výsledků. Při klasifikaci sedmi emocí bylo dosaženo přesnosti pro nahrávky 92,3 %.cs
dc.description.abstractBachelor's thesis deals with emotion recognition in audio recordings using deep neural networks. In the introductory part, the reader is familiarised with the motivation and application of speech emotion recognition system. At the beginning of the first chapter, the concepts of emotion and emotion recognition are defined. Subsequent sections are focused on the development of a speech emotion recognition system. Next chapter is devoted to acquaintance with the basics of neural networks. Model used in the experimental part of the work is presented, training and evaluation of the model are explained. The following section describes the design and workflow of emotion recognition package written in Python. The last chapter presents experiments performed on a dataset obtained by unifying the RAVDESS, TESS, SAVEE and EMOVO datasets. An MLP neural network was used for classification. It was implemented and trained using the PyTorch framework. MFCC features were selected for model learning. Performed experiments were documented and analyzed. At the end of the work, the results are summarized and methods for achieving better results are proposed. An accuracy of 92,3 % per recording has been achieved while classifying seven emotions.en
dc.description.mark
dc.format58
dc.format.extentIlustrace, Schémata, Grafy, Tabulky Žádné.
dc.identifier.signatureV 202102950
dc.identifier.urihttps://dspace.tul.cz/handle/15240/160450
dc.language.isocs
dc.relation.isbasedonpar[1] BISHOP, Christopher M. Pattern recognition and machine learning. [New York]: Springer, c2006. Information science and statistics. ISBN 978-0-387-31073-2par par[2] GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep learning. Cambridge, MA: MIT press, [2016]. Adaptive computation and machine learning series. ISBN 978-0-262-03561-3par par[3] KONAR, Amit a Aruna CHAKRABORTY. Emotion recognition: a pattern analysis approach. Hoboken, New Jersey: John Wiley & Sons, [2015]. ISBN 978-1-118-13066-7par par[4] AKÇAY, Mehmet Berkehan a Kaya O&
dc.relation.isbasedonx11e;UZ. Speech emotion recognition: Emotional models, databases, features, preprocessing methods, supporting modalities, and classifiers. Speech Communication. 2020, 116, 56-76par
dc.rightsVysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26cs
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26en
dc.rights.urihttps://knihovna.tul.cz/document/26
dc.rights.urihttps://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subjectrozpoznávání emocí z řečics
dc.subjectstrojové učenícs
dc.subjectneuronové sítěcs
dc.subjectPyTorchcs
dc.subjectMFCCcs
dc.subjectspeech emotion recognitionen
dc.subjectmachine learningen
dc.subjectneural networksen
dc.subjectPyTorchen
dc.subjectMFCCen
dc.titleRozpoznávání emocí v audio nahrávkách s využitím hlubokých neuronových sítícs
dc.titleEmotion Recognition in Audio Recordings Using Deep Neural Networksen
dc.typebakalářská prácecs
local.degree.abbreviationBakalářský
local.degree.disciplineIT
local.degree.programmeInformační technologie
local.degree.programmeabbreviationB2646
local.department.abbreviationITE
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.faculty.abbreviationFM
local.identifier.authorM18000092
local.identifier.stag41347
local.identifier.verbis
local.identifier.verbis706fe23a-d993-4d47-a7e1-9eb1ed974059
local.note.administratorsautomat
local.note.secrecyPovoleno ZverejnitPraci Povoleno ZverejnitPosudky
local.poradovecislo2950
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
tomas_petricekbachelor_thesisfinal.pdf
Size:
4.84 MB
Format:
Adobe Portable Document Format
Description:
VSKP
Loading...
Thumbnail Image
Name:
BP_Tomas_Petricek_oponent.pdf
Size:
319.26 KB
Format:
Adobe Portable Document Format
Description:
Posudek_oponenta_VSKP
Loading...
Thumbnail Image
Name:
BP_Tomas_Petricek_vedouci.pdf
Size:
636.2 KB
Format:
Adobe Portable Document Format
Description:
Posudek_vedouciho_VSKP
Loading...
Thumbnail Image
Name:
ProtokolSPrubehemObhajobySTAG.pdf
Size:
21.44 KB
Format:
Adobe Portable Document Format
Description:
Prubeh_obhajoby_VSKP