Návrh, tvorba a analýza řečového korpusu telefonních nahrávek pro úlohu rozpoznávání řeči a mluvčích

Title Alternative:Suggestion, creation and analysis of speech corpus of telephonic records for speech and speaker recognition task
Loading...
Thumbnail Image
Date
2013-12-20
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Tato práce se zabývá zejména tvorbou a analýzou konkrétního řečového korpusu telefonních nahrávek. V první části se věnuje úvodu do počítačového zpracování řeči, nastiňuje účel tvorby korpusu a cíle práce. Ve druhé části se věnuje především teoretickému popisu tvorby korpusu a některým parametrům používaných při analýze řečového korpusu. Třetí část práce se zabývá popisem tvorby vytvořeného řečového korpusu. Konkrétně pak zejména vlastnímu pořizování a přepisování nahrávek a dále také softwarové podpoře Uvádí také nabyté zkušenosti při vytváření korpusu. Čtvrtá část práce se pak zabývá analýzou vytvořeného korpusu. Ta představuje analýzu signálů a analýzu fonetické bohatosti. Analýza signálů se zaměřuje na koeficient přebuzení, koeficient vybuzení a odhad odstupu signálu od šumu. Právě v souvislosti s odhadem odstupu signálu od šumu se věnuje také vývoji detektoru řečové aktivity. Analýza fonetické bohatosti se zaměřuje na porovnání výskytu fonémů v korpusu a v českém jazyce. V páté části se práce zaměřuje na přínos vytvoření korpusu pro účely Laboratoře počítačového zpracování řeči. V poslední šesté části shrnuje a diskutuje dosažené výsledky.
This work mostly deals with creation and analysis of concrete speech corpus of telephonic records. In the first part attends to introduction to computer speech processing, describes purpose of corpus creation and targets of the work. In the second part mainly attends to theoretic description of corpus creation and to some parameters used in speech corpus analysis. The third part of the work deals with description of speech corpus creation. Concretely to own records gathering and transcribing mostly and further to software support too. It gives experience gained by corpus creation too. The forth part of the work deals with created corpus analysis. It represents signal analysis and analysis of phonetic richness. Signal analysis is focusing on overexcitation coefficient, energization coefficient and signal-to-noise ratio estimation. Rightly in connection with signal-to-noise ratio estimation attends to making of voice activity detector too. Analysis of phonetic richness is focusing on appearance of fonems in corpus comparison and in the Czech language. In the fifth part work attends to contribution of created corpus for purposes of Laboratory of computer speech processing. In the last sixth part summarises and discusses achieved results.
Description
katedra: ITE; rozsah: 47
Subject(s)
řečový korpus, analýza signálů, telefonní nahrávky, detektor, řečové aktivity, speech corpus, signal analysis, telephonic records, voice activity, detector
Citation
ISSN
ISBN