Využití hlubokých neuronových sítí v systémech rozpoznávání řeči

Title Alternative:Use of deep neural networks in speech recognition systems
dc.contributor.advisorČerva, Petr
dc.contributor.authorParoubek, Martin
dc.date2014
dc.date.accessioned2016-07-26
dc.date.available2016-07-26
dc.date.defense2014-06-18
dc.date.issued2014
dc.degree.levelmgrcs
dc.description54 s., 9 s. příl. :obr., tab., grafy +CD ROMcs
dc.description.abstractPráce se zabývala využitím nového hybridního systému DNN-HMM pro rozpoznávání řeči. V teoretické části byla představena základní problematika rozpoznávání řeči a neuronových sítí. Na základě těchto informací bylo možné představit hluboké
 neuronové sítě a jejich propojení s HMM systémem. Z důvodu velkého množství různých parametrů pro trénování neuronových sítí proběhla rešerše existujících postupů a jejich výsledků, kterými byla inspirována praktická část. Cílem praktické části bylo prozkoumat vliv uspořádání neuronové sítě, vliv
 předtrénování a vliv velikosti trénovacího korpusu na přesnost rozpoznávání. Na základě těchto výsledků byl vytvořen akustický model, který byl porovnán se současným systémem pro rozpoznávání řeči GMM-HMM. Trénování neuronových sítí probíhalo na GPU použitím modifikovaných skriptů knihovny Theano. Následné vyhodnocení bylo provedeno pomocí vlastních skriptů. K dispozici byl trénovací korpus s 56 hodinami polské řeči a vytvořené modely byly odzkoušeny na 3 testovacích sadách obsahujících publicistický a odborný styl. K porovnání výsledků byla použita tzv. accuracy. Celkem bylo takto vytvořeno více než 250 akustických modelů, které se také lišily dobou trénování, neboť kriterium ukončení trénování je stále předmětem zkoumání. Celkem doba k jejich natrénování zabrala více než 62 dní. Bylo zjištěno, že využití neuronových sítí, jakožto akustických modelů, přináší několikaprocentní zlepšení oproti současnému systému a zároveň také že diskriminativní předtrénování nemá žádný vliv na přesnost sítě. Dále byla popsána topologie s nejvyšší přesností a bylo zjištěno, že vliv množství dat v trénovacím korpusu může být závislý na kontextu
 testovací sady.cs
dc.formattext
dc.identifier.signatureV 42/14 M
dc.identifier.urihttps://dspace.tul.cz/handle/15240/16749
dc.language.isocs
dc.publisherTechnická Univerzita v Libercics
dc.relation.isreferencedbyhttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28789&typ=1
dc.relation.isreferencedbyhttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28789&typ=2
dc.relation.isreferencedbyhttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28789&typ=3
dc.source.urihttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28789
dc.subjectspeech recognitionen
dc.subjectneural networksen
dc.subjectrozpoznávání řečics
dc.subjectneuronové sítě (počítačová věda)cs
dc.subject.verbisspeech recognitionen
dc.titleVyužití hlubokých neuronových sítí v systémech rozpoznávání řečics
dc.title.alternativeUse of deep neural networks in speech recognition systemsen
dc.typeThesis
local.departmentITEcs
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.identifier.stag28789
local.identifier.verbis479864
local.note.administratorsoprava_A
local.verbis.aktualizace2019-10-05 06:03:02cs
local.verbis.studijniprogramITE Elektrotechnika a informatika/Informační technikacs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
2014-Paroubek.pdf
Size:
1.85 MB
Format:
Adobe Portable Document Format
Description:
kvalifikační práce
Loading...
Thumbnail Image
Name:
Dipl_28789.pdf
Size:
504.88 KB
Format:
Adobe Portable Document Format
Description:
posudek oponenta
Loading...
Thumbnail Image
Name:
Dipl_28789(1).pdf
Size:
476.23 KB
Format:
Adobe Portable Document Format
Description:
posudek vedoucího
Loading...
Thumbnail Image
Name:
Dipl_28789(2).pdf
Size:
410.32 KB
Format:
Adobe Portable Document Format
Description:
výsledek obhajoby