Využití hlubokých neuronových sítí v systémech rozpoznávání řeči

Title Alternative:Use of deep neural networks in speech recognition systems
Loading...
Thumbnail Image
Date
2014
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Práce se zabývala využitím nového hybridního systému DNN-HMM pro rozpoznávání řeči. V teoretické části byla představena základní problematika rozpoznávání řeči a neuronových sítí. Na základě těchto informací bylo možné představit hluboké
 neuronové sítě a jejich propojení s HMM systémem. Z důvodu velkého množství různých parametrů pro trénování neuronových sítí proběhla rešerše existujících postupů a jejich výsledků, kterými byla inspirována praktická část. Cílem praktické části bylo prozkoumat vliv uspořádání neuronové sítě, vliv
 předtrénování a vliv velikosti trénovacího korpusu na přesnost rozpoznávání. Na základě těchto výsledků byl vytvořen akustický model, který byl porovnán se současným systémem pro rozpoznávání řeči GMM-HMM. Trénování neuronových sítí probíhalo na GPU použitím modifikovaných skriptů knihovny Theano. Následné vyhodnocení bylo provedeno pomocí vlastních skriptů. K dispozici byl trénovací korpus s 56 hodinami polské řeči a vytvořené modely byly odzkoušeny na 3 testovacích sadách obsahujících publicistický a odborný styl. K porovnání výsledků byla použita tzv. accuracy. Celkem bylo takto vytvořeno více než 250 akustických modelů, které se také lišily dobou trénování, neboť kriterium ukončení trénování je stále předmětem zkoumání. Celkem doba k jejich natrénování zabrala více než 62 dní. Bylo zjištěno, že využití neuronových sítí, jakožto akustických modelů, přináší několikaprocentní zlepšení oproti současnému systému a zároveň také že diskriminativní předtrénování nemá žádný vliv na přesnost sítě. Dále byla popsána topologie s nejvyšší přesností a bylo zjištěno, že vliv množství dat v trénovacím korpusu může být závislý na kontextu
 testovací sady.
Description
54 s., 9 s. příl. :obr., tab., grafy +CD ROM
Subject(s)
speech recognition, neural networks, rozpoznávání řeči, neuronové sítě (počítačová věda)
Citation
ISSN
ISBN