Využití neuronových sítí pro automatickou fonetickou transkripci

dc.contributorKolorenč Jan, Ing. Ph.D. : 66659
dc.contributor.advisorČerva Petr, Ing. Ph.D. : 55712
dc.contributor.authorKynych, František
dc.contributor.otherSimová Jozefína, doc. Ing. Ph.D. Skolitel : 55316
dc.contributor.otherMálek Jiří, Ing. Ph.D. Konzultant : 61653
dc.contributor.otherSvrček Ján, Ing. Konzultant2 : 66454
dc.date.accessioned2018-10-15T11:52:25Z
dc.date.available2018-10-15T11:52:25Z
dc.date.committed2018-5-14
dc.date.defense2018-6-13
dc.date.submitted2017-10-19
dc.date.updated2018-10-15
dc.degree.levelBc.
dc.description.abstractTato bakalářská práce je zaměřena na automatickou fonetickou transkripci pomocí neuronových sítí. Hlavním cílem bylo využít neuronové sítě a výsledky porovnat s chybovostí dosud používaného systému Baseline pro automatické generování fonetické transkripce. K řešení je použit Sequence-to-Sequence G2P toolkit, který je vyvíjen skupinou CMU Sphinx přímo pro tuto úlohu a dále byl upraven Neural Machine Translation toolkit, ten původně sloužil pro překlad z jednoho jazyka do jiného, ale poskytoval řadu dalších metod, které bylo možné vyzkoušet. Pomocí těchto toolkitů se postupně hledala architektura rekurentní neuronové sítě s nejmenší chybovostí. Výsledky experimentování byly porovnány na stejné sadě dat se systémem Baseline. Hlavním dosaženým výsledkem je menší chybovost tohoto systému, u češtiny se podařilo relativně snížit chybovost o 41,5 %, u angličtiny o 22 % a u švédštiny o 33,5 %. Pomocí nejlepšího modelu byly hledány chyby v české slovní zásobě, používané na ústavu ITE. Našlo se 10 515 potenciálních chyb, které se musely ručně kontrolovat, zhruba u 10 % z nich se jednalo o chyby skutečné.cs
dc.description.abstractThis bachelor thesis is focused on automatic phonetic transcription using neural networks. The main goal was to use neural networks and compare the results with the error rate of the Baseline system used to automatically generate phonetic transcription. Sequence-to-Sequence G2P toolkit, that was developed by CMU Sphinx group for this task, is used to solve the problem. Additionally, the Neural Machine Translation toolkit, which is used for translation from one language to another, was modified, because it provides a number of other methods that could be tested. Using these tools, the architecture of the recurrent neural network with the lowest error rate was searched. The experimental results were compared on the same set of data with the Baseline system. The main achieved result is the lower error rate of this system, the error in the Czech was relatively reduced by 41.5 %, by 22 % in English and by 33.5 % in Swedish. Using the best model, mistakes were found in the Czech phonetic dictionary used at the ITE department. There were found 10,515 potential mistakes that had to be manually checked, roughly 10 % of them were real mistakes.en
dc.description.mark
dc.format56 s.
dc.format.extentIlustrace, Schémata, Tabulky ROM, Grafy 1 ROM 1
dc.identifier.urihttps://dspace.tul.cz/handle/15240/32198
dc.language.isocs
dc.relation.isbasedonbegin*arab* renewcommand*labelenumi**[arabic*enumi*]* item Nishant Shukla: Machine Learning with TensorFlow, Manning Publications Company, 2017 item Online kurz Natural Language Processing with Deep Learning, dostupný na http://web.stanford.edu/class/cs224n/syllabus.html end*arab*
dc.rightsVysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26cs
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26en
dc.rights.urihttps://knihovna.tul.cz/document/26
dc.rights.urihttps://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subjectautomatická fonetická transkripcecs
dc.subjectrekurentní neuronové sítěcs
dc.subjectSequence-to-Sequence G2P toolkitcs
dc.subjectNeural Machine Translation toolkitcs
dc.subjectautomatic phonetic transcriptionen
dc.subjectrecurrent neural networksen
dc.subjectSequence-to-Sequence G2P toolkiten
dc.subjectNeural Machine Translation toolkiten
dc.titleVyužití neuronových sítí pro automatickou fonetickou transkripcics
dc.titleThe use of neural networks for automatic phonetic transcriptionen
dc.title.alternativecs
dc.typebakalářská prácecs
local.degree.abbreviationBakalářský
local.degree.disciplineIT
local.degree.programmeInformační technologie
local.degree.programmeabbreviationB2646
local.department.abbreviationITE
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.faculty.abbreviationFM
local.identifier.authorM15000036
local.identifier.stag36932
local.note.administratorsautomat
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
bakalarska_prace_2018_Frantisek_Kynych.pdf
Size:
586.68 KB
Format:
Adobe Portable Document Format
Description:
VSKP
Loading...
Thumbnail Image
Name:
BP_Frantisek_Kynych_oponent.pdf
Size:
659.29 KB
Format:
Adobe Portable Document Format
Description:
Posudek_oponenta_VSKP
Loading...
Thumbnail Image
Name:
BP_Frantisek_Kynych_vedouci.pdf
Size:
646.5 KB
Format:
Adobe Portable Document Format
Description:
Posudek_vedouciho_VSKP
Loading...
Thumbnail Image
Name:
kynych.pdf
Size:
249.03 KB
Format:
Adobe Portable Document Format
Description:
Prubeh_obhajoby_VSKP