Adaptation of speech recognition systems to selected real-world deployment conditions

dc.contributor.authorČerva, Petr
dc.date.accessioned2021-11-26T07:29:44Z
dc.date.available2021-11-26T07:29:44Z
dc.date.issued2021-11-26
dc.description.abstractTato habilitační práce se zabývá problematikou adaptace systémů rozpoznávání řeči na vybrané reálné podmínky nasazení. Je koncipována jako sborník celkem dvanácti článků, které se touto problematikou zabývají. Jde o publikace, jejichž jsem hlavním autorem nebo spoluatorem, a které vznikly v rámci několika navazujících výzkumných projektů. Na řešení těchto projektů jsem se podílel jak v roli člena výzkumného týmu, tak i v roli řešitele nebo spoluřešitele. Publikace zařazené do tohoto sborníku lze rozdělit podle tématu do tří hlavních skupin. Jejich společným jmenovatelem je snaha přizpůsobit daný rozpoznávací systém novým podmínkám či konkrétnímu faktoru, který významným způsobem ovlivňuje jeho funkci či přesnost. První skupina článků se zabývá úlohou neřízené adaptace na mluvčího, kdy systém přizpůsobuje svoje parametry specifickým hlasovým charakteristikám dané mluvící osoby. Druhá část práce se pak věnuje problematice identifikace neřečových událostí na vstupu do systému a související úloze rozpoznávání řeči s hlukem (a zejména hudbou) na pozadí. Konečně třetí část práce se zabývá přístupy, které umožňují přepis audio signálu obsahujícího promluvy ve více než v jednom jazyce. Jde o metody adaptace existujícího rozpoznávacího systému na nový jazyk a metody identifikace jazyka z audio signálu. Obě zmíněné identifikační úlohy jsou přitom vyšetřovány zejména v náročném a méně probádaném režimu zpracování po jednotlivých rámcích vstupního signálu, který je jako jediný vhodný pro on-line nasazení, např. pro streamovaná data.cs
dc.description.abstractThis habilitation thesis deals with adaptation of automatic speech recognition (ASR) systems to selected real-world deployment conditions. It is presented in the form of a collection of twelve articles dealing with this task; I am the main author or a co-author of these articles. They were published during my work on several consecutive research projects. I have participated in the solution of them as a member of the research team as well as the investigator or a co-investigator. These articles can be divided into three main groups according to their topics. They have in common the effort to adapt a particular ASR system to a specific factor or deployment condition that affects its function or accuracy. The first group of articles is focused on an unsupervised speaker adaptation task, where the ASR system adapts its parameters to the specific voice characteristics of one particular speaker. The second part deals with a) methods allowing the system to identify non-speech events on the input, and b) the related task of recognition of speech with non-speech events, particularly music, in the background. Finally, the third part is devoted to the methods that allow the transcription of an audio signal containing multilingual utterances. It includes a) approaches for adapting the existing recognition system to a new language and b) methods for identification of the language from the audio signal. The two mentioned identification tasks are in particular investigated under the demanding and less explored frame-wise scenario, which is the only one suitable for processing of on-line data streams.en
dc.format.extent131 strancs
dc.identifier.urihttps://dspace.tul.cz/handle/15240/161016
dc.language.isocscs
dc.subjectautomatické rozpoznávání řečics
dc.subjecton-line zpracování streamovaných datcs
dc.subjectadaptace na mluvčíhocs
dc.subjectdetekce řeč/neřečcs
dc.subjectrozpoznávání řeči s hudbou na pozadícs
dc.subjectidentifikace jazykacs
dc.subjectautomatic speech recognitionen
dc.subjecton-line processing of streamed dataen
dc.subjectspeaker adaptationen
dc.subjectspeech/non-speech detectionen
dc.subjectlanguage identificationen
dc.titleAdaptation of speech recognition systems to selected real-world deployment conditionsen
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
Habilitace_P.Cerva.pdf
Size:
4.16 MB
Format:
Adobe Portable Document Format
Description:
habilitační práce
Loading...
Thumbnail Image
Name:
posudek_doc_Pollak.pdf
Size:
34.63 KB
Format:
Adobe Portable Document Format
Description:
posudek
Loading...
Thumbnail Image
Name:
posudek_prof_Psutka.pdf
Size:
204.84 KB
Format:
Adobe Portable Document Format
Description:
posudek
Loading...
Thumbnail Image
Name:
Cerva_Report_Svendsen.pdf
Size:
90.03 KB
Format:
Adobe Portable Document Format
Description:
posudek
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections