Browsing by Author "Kuchařová, Michaela"
Now showing 1 - 6 of 6
Results Per Page
Sort Options
- ItemCost-Efficient Development of Acoustic Models for Speech Recognition of Related Languages(Spolecnost Pro Radioelektronicke Inzenyrstvi, 2013-01-01) Nouza, Jan; Červa, Petr; Kuchařová, MichaelaWhen adapting an existing speech recognition system to a new language, major development costs are associated with the creation of an appropriate acoustic model (AM). For its training, a certain amount of recorded and annotated speech is required In this paper, we show that not only the annotation process, but also the process of speech acquisition can be automated to minimize the need of human and expert work. We demonstrate the proposed methodology on Croatian language, for which the target AM has been built via cross-lingual adaptation of a Czech AM in 2 ways: a) using the commercially available GlobalPhone database, and b) by automatic speech data mining from HRT radio archive. The latter approach is cost-free, yet it yields comparable or better results in experiments conducted on 3 Croatian test sets.
- ItemA cross-lingual adaptation approach for rapid development of speech recognizers for learning disabled users(Springer International Publishing Ag, 2014-01-01) Boháč, Marek; Kuchařová, Michaela; Callejas, Zoraida; Nouza, Jan; Červa, PetrBuilding a voice-operated system for learning disabled users is a difficult task that requires a considerable amount of time and effort. Due to the wide spectrum of disabilities and their different related phonopathies, most approaches available are targeted to a specific pathology. This may improve their accuracy for some users, but makes them unsuitable for others. In this paper, we present a cross-lingual approach to adapt a general-purpose modular speech recognizer for learning disabled people. The main advantage of this approach is that it allows rapid and cost-effective development by taking the already built speech recognition engine and its modules, and utilizing existing resources for standard speech in different languages for the recognition of the usersatypical voices. Although the recognizers built with the proposed technique obtain lower accuracy rates than those trained for specific pathologies, they can be used by a wide population and developed more rapidly, which makes it possible to design various types of speech-based applications accessible to learning disabled users.
- ItemIdentifikace pohlaví popř. stáří osob na základě detekovaného obličeje(2009-01-01) Kuchařová, Michaela
- ItemIdentifikace pohlaví popř. stáří osob na základě detekovaného obličeje(Technická Univerzita v Liberci, 2013-12-20) Kuchařová, Michaela; Chaloupka, JosefTato bakalářská práce se zabývá počítačovým rozpoznáváním pohlaví a stáří osob z detekovaného obličeje. V první části obsahuje rešerši, vypovídající o různých metodách používaných ve světě k přípravě fotografií a rozpoznávání pohlaví a stáří osob. Je zde popsáno několik metod pro přípravu fotografií před samotným rozpoznáváním a několik metod samotného rozpoznávání včetně jejich kritérií pro použití (kvalita fotografie, konstantní osvětlení, čelní pohled, citlivost na výrazy obličeje{\dots}) a uvedení dosažených výsledků. Druhá část této práce popisuje přípravu fotografií z předem vytvořené databáze obličejů pro rozpoznávání a úpravu fotografií před samotným programem na rozpoznávání. Třetí, poslední kapitola obsahuje samotné vyzkoušení několika metod (především pro rozpoznávání pohlaví) a následné porovnání dosažených výsledků jednak navzájem mezi odzkoušenými metodami a jednak s původními výsledky.
- ItemVliv řečníka a přenosového kanálu na systém rozpoznávání řeči(2011-01-01) Kuchařová, Michaela
- ItemVliv řečníka a přenosového kanálu na systém rozpoznávání řeči(Technická Univerzita v Liberci, 2011-01-01) Kuchařová, Michaela; Nouza, JanTato diplomová práce se zabývá závislostí úspěšnosti rozpoznávání mluvené řeči na použitém mikrofonu a částečné též na mluvčím. Cílem práce bylo vytvořit databázi, která by obsahovala nahrávky od různých mluvčích a z různých mikrofonů, které by byly vhodné pro objektivní porovnání daných mikrofonů. Po zjištění, že rozpoznávání řeči je poměrně značně závislé na použitém mikrofonu, jsem vytvořila systém pro rozpoznávání řeči v prostředí HTK (The Hidden Markov Model Toolkit) a otestovala jsem základní metody a různé vstupní parametry tohoto systému. Jako první metoda adaptace byla otestována intuitivní metoda, která přidávala k trénovací sadě nahrávek adaptační data s různou vahou. Poté jsem vyzkoušela několik pokročilejších metod adaptace a ověřovala, jak se po jejich aplikaci změní rozdíl úspěšností mezi nahrávkami z různých mikrofonů. Toto testování proběhlo jak na rozpoznávacím systému v prostředí HTK, tak i na profesionálním systému pro rozpoznávání řeči, který se používá v praxi v několika komerčních aplikacích a byl vyvinut Laboratoří počítačového zpracování řeči na Ústavu informačních technologií a elektroniky, FM TUL. Nejlepší testovaná metoda MLLR (Maximum Likelihood Linear Regression) dosáhla s rozpoznávacím systémem poskytnutým Laboratoří počítačového zpracování řeči průměrné zlepšení úspěšnosti rozpoznávání řeči 2 %. Vzhledem k relativně malému objemu adaptačních dat (jednalo se o v průměru 30 vteřin dlouhou nahrávku, která obsahovala foneticky bohaté věty) je uvedené zlepšení znatelné