Browsing by Author "Boháč, Marek"
Now showing 1 - 7 of 7
Results Per Page
Sort Options
- ItemAutomatická strukturalizace počítačem přepsaných mluvených dokumentů z multimediálních archivů(Technická Univerzita v Liberci, 2016-01-01) Boháč, Marek
- ItemAutomatická strukturalizace počítačem přepsaných mluvených dokumentů z multimediálních archivů(Technická Univerzita v Liberci, 2010-7-1) Boháč, Marek; ; Nouza Jan, prof. Ing. CSc. Skolitel : 54737; Rozkovec Jiří, Mgr. Konzultant : 56638; Pifková Monika, Ing. Konzultant2 : 65313Tato práce se zaměřuje na řešení komplexního problému jak strukturalizovat (vhodně rozčlenit, textově i foneticky analyzovat a následně upravit) výstup systému pro automatické rozpoznávání řeči tak, aby byl co nejčitelnější pro člověka a zároveň připravený pro efektivní strojové zpracování a vyhledávání. Motivací pro řešení tohoto problému byl výzkumný projekt podporovaný Ministerstvem kultury ČR, jehož cílem bylo přepsat mluvené dokumenty z archivu Českého a Československého rozhlasu a zpřístupnit je pro vyhledávání. Vzhledem k rozsahu archivu (213.000 dokumentů z období 1923 až 2014) bylo nutné navrhnout a zrealizovat takový postup a technologie, které by byly schopny zvládnout nejen obrovské množství dat, ale také specifické problémy související s různou kvalitou záznamů, s přítomností českého i slovenského jazyka v dokumentech, se střídajícími se mluvčími, s prokládáním řeči znělkami, hudebními předěly a písničkami či s hluky na pozadí řeči.
- ItemAutomatický převod polyfonní melodie do notového zápisu(2010-01-01) Boháč, Marek
- ItemAutomatický převod polyfonní melodie do notového zápisu(Technická Univerzita v Liberci, 2013-12-20) Boháč, Marek; Nouza, JanCílem práce je navrhnout a realizovat program pro převod nahrávky polyfonní hudební melodie do notového zápisu. Poznatky z akustické teorie hudby jsou využity k vytvoření speciálních algoritmů určených k analýze číslicových signálů, které představují zkoumanou nahrávku. Informace z oblasti psychoakustiky byly také využity k definování struktury modelů nástrojů. Program musí nejprve identifikovat časový průběh nahrávky. Je potřeba určit jednotlivé hrané tóny, jejich délku a identifikovat nástroje, kterými jsou tóny interpretovány. Klíčovým problémem této části programu je detekce přítomnosti hrané oktávy. Druhým krokem je převod časového průběhu do notového záznamu, ke kterému jsou zapotřebí informace o taktu a tempu skladby. Algoritmy jsou navrženy se zvláštním zaměřením na analýzu dechových a žesťových nástrojů. Pro tuto skupinu nástrojů je provedeno vyhodnocení úspěšnosti programu. K analýze dalších skupin nástrojů (např. strunných) jsou navrženy dílčí úpravy a rozšíření použitých algoritmů a modelů nástrojů.
- ItemBlock-online multi-channel speech enhancement using deep neural network-supported relative transfer function estimates(Institution of Engineering and Technology, 2020-05-01) Málek, Jiří; Koldovský, Zbyněk; Boháč, MarekThis work addresses the problem of block-online processing for multi-channel speech enhancement. Such processing is vital in scenarios with moving speakers and/or when short utterances are processed, e.g. in voice assistant applications. We consider several variants of a system that performs beamforming supported by deep neural network-based voice activity detection followed by post-filtering. The speaker is targeted through estimating relative transfer functions between microphones. Each block of the input signals is processed independently to make the method applicable in highly dynamic environments. Due to short processed blocks, the statistics required by the beamformer are estimated less precisely. The influence of this inaccuracy is studied and compared to batch processing regime, when recordings are treated as one block. The experimental evaluation is performed on large datasets of CHiME-4 and another dataset featuring moving target speaker. The experiments are evaluated in terms of objective and perceptual criteria. Moreover, word error rate (WER) of a speech recognition system is evaluated, for which the method serves as a front-end. The results indicate that the proposed method is robust for short length of the processed block. Significant improvements in terms of the criteria and WER are observed even for the block length of 250 ms.
- ItemA cross-lingual adaptation approach for rapid development of speech recognizers for learning disabled users(Springer International Publishing Ag, 2014-01-01) Boháč, Marek; Kuchařová, Michaela; Callejas, Zoraida; Nouza, Jan; Červa, PetrBuilding a voice-operated system for learning disabled users is a difficult task that requires a considerable amount of time and effort. Due to the wide spectrum of disabilities and their different related phonopathies, most approaches available are targeted to a specific pathology. This may improve their accuracy for some users, but makes them unsuitable for others. In this paper, we present a cross-lingual approach to adapt a general-purpose modular speech recognizer for learning disabled people. The main advantage of this approach is that it allows rapid and cost-effective development by taking the already built speech recognition engine and its modules, and utilizing existing resources for standard speech in different languages for the recognition of the usersatypical voices. Although the recognizers built with the proposed technique obtain lower accuracy rates than those trained for specific pathologies, they can be used by a wide population and developed more rapidly, which makes it possible to design various types of speech-based applications accessible to learning disabled users.
- ItemVliv nahrávacího řetězce na identifikaci hudební nahrávky(Technická Univerzita v Liberci, 2014-01-01) Václavek, David; Boháč, MarekTato bakalářská práce se zabývá návrhem systému pro rozpoznávání hudebních nahrávek z databáze a vlivem nahrávacího řetězce na úspěšnost takového systému. Databáze hudebních děl je reprezentována skupinou vhodně zvolených příznaků. Těmi jsou tempo nahrávky a dominantní frekvence jednotlivých dob skladby. V úvahu jsou brány reálné nahrávací podmínky, jako akustika místností a přenosové charakteristiky zařízení, používaných pro reprodukci skladby a nahrávání. Úspěšnost systému a vliv nahrávacího řetězce jsou experimentálně vyhodnoceny.