Detekce změny řečníka v telefonních záznamech

Title Alternative:Speaker change detection in phone records
dc.contributor.advisorŽďánský, Jindřich
dc.contributor.authorZverec, Štefan
dc.date2007
dc.date.accessioned2015-04-13
dc.date.available2015-04-13
dc.date.committed1899-12-30
dc.date.defense2007-06-13
dc.date.issued2007
dc.date.submitted2005-10-27
dc.degree.levelmgrcs
dc.descriptionkatedra: KES; přílohy: 1 CD; rozsah: 49 scs
dc.description.abstractDiplomová práce se zabývá možností využití metody binárního dělení pro potřeby detekce změny řečníka v telefonních hovorech. V úvodních kapitolách nalezneme dva základní přístupy k parametrizaci akustického signálu. Pomocí diskrétní Fourierovy transformace - tzv. melfrekvenční kepstrální příznaky a pomocí lineární prediktivní analýzy - LPC příznaky. Dále je zde stručně popsán princip převedení problému změny mluvčího na změnu parametrů ve stochastickém procesu a popsány algoritmy trénování, testování a vyhodnocení detektoru změn. Práce popisuje jednotlivé kroky při trénování a testování detekce změn mluvčích a uvádí výsledky vyhodnocení úspěšnosti metody na základě počtu správně nalezených změn. Pro pořízenou databázi telefonních hovorů byla statistickým vyhodnocením stanovena míra úspěšnosti detekce F=72% pro reálné nahrávky, F=96% pro nahrávky uměle vytvořené.cs
dc.description.abstractThis thesis is interested in utilization of binary segmentation method for detection of speaker change in phone dialogue. In opening chapters two basic accesses to acoustic signal parameterization are described. Using discrete Fourier Transformation - so-called melfrequency kepstral parameters and using linear predictive analyse - LPC parameters. Next, there is described transfer of speaker change problem to parameter´s change in stochastic process and algorithms of training, testing and change detection evaluation are described. Thesis describes single steps in speaker change detection training and testing, and introduces results of method success evaluation based on number of correctly founded changes. For created database of phone dialogues was determined rate of detection success by statistic evaluation F=72% in real records and F=96% in prepared records.en
dc.formattext
dc.identifier.urihttps://dspace.tul.cz/handle/15240/8279
dc.language.isocs
dc.publisherTechnická Univerzita v Libercics
dc.subjectdetekce změny mluvčíhocs
dc.subjectsegmetnace audio záznamucs
dc.subjectmetoda binárního dělenícs
dc.subjectmfcc příznakycs
dc.subjectlpc příznakycs
dc.subjectspeaker change detectionen
dc.subjectsegmentation of audio recorden
dc.subjectbinary segmentation techniqueen
dc.subjectmfcc parametersen
dc.subjectlpc parametersen
dc.subject.verbiszvukové signálycs
dc.titleDetekce změny řečníka v telefonních záznamechcs
dc.title.alternativeSpeaker change detection in phone recordsen
dc.typeThesis
local.departmentKEScs
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.identifier.stag11792
local.identifier.verbis328759
local.note.administratorsoprava_A
local.verbis.aktualizace2019-10-05 06:04:03cs
local.verbis.studijniprogramKEScs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
mgr_11792.pdf
Size:
668.16 KB
Format:
Adobe Portable Document Format
Description:
kvalifikační práce