Detekce změny řečníka v telefonních záznamech

Title Alternative:Speaker change detection in phone records
Loading...
Thumbnail Image
Date
2007-01-01
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Diplomová práce se zabývá možností využití metody binárního dělení pro potřeby detekce změny řečníka v telefonních hovorech. V úvodních kapitolách nalezneme dva základní přístupy k parametrizaci akustického signálu. Pomocí diskrétní Fourierovy transformace - tzv. melfrekvenční kepstrální příznaky a pomocí lineární prediktivní analýzy - LPC příznaky. Dále je zde stručně popsán princip převedení problému změny mluvčího na změnu parametrů ve stochastickém procesu a popsány algoritmy trénování, testování a vyhodnocení detektoru změn. Práce popisuje jednotlivé kroky při trénování a testování detekce změn mluvčích a uvádí výsledky vyhodnocení úspěšnosti metody na základě počtu správně nalezených změn. Pro pořízenou databázi telefonních hovorů byla statistickým vyhodnocením stanovena míra úspěšnosti detekce F=72% pro reálné nahrávky, F=96% pro nahrávky uměle vytvořené.
This thesis is interested in utilization of binary segmentation method for detection of speaker change in phone dialogue. In opening chapters two basic accesses to acoustic signal parameterization are described. Using discrete Fourier Transformation - so-called melfrequency kepstral parameters and using linear predictive analyse - LPC parameters. Next, there is described transfer of speaker change problem to parameter´s change in stochastic process and algorithms of training, testing and change detection evaluation are described. Thesis describes single steps in speaker change detection training and testing, and introduces results of method success evaluation based on number of correctly founded changes. For created database of phone dialogues was determined rate of detection success by statistic evaluation F=72% in real records and F=96% in prepared records.
Description
katedra: KES; přílohy: 1 CD; rozsah: 49 s
Subject(s)
detekce změny mluvčího, segmetnace audio záznamu, metoda binárního dělení, mfcc příznaky, lpc příznaky, speaker change detection, segmentation of audio record, binary segmentation technique, mfcc parameters, lpc parameters
Citation
ISSN
ISBN