Browsing by Author "Halada, Martin"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
- ItemSystém rozpoznávání řeči typu E2E(2022-10-24) Halada, Martin; Nouza Jan, prof. Ing. CSc. :54737; Boháč Marek, Ing. Ph.D. :68488Diplomová práce se zabývá způsobem rozpoznávání řeči založeném na principu end-to-end. V první kapitole práce představuje problematiku rozpoznávání řeči, srovnává tradiční i aktuální přístupy a zmiňuje základní kategorie systémů typu end-to-end. Druhá kapitola uvádí postup přípravy dat, stažení zvukových záznamů s odpovídajícími přepisy, jejich správné přiřazení a nakonec zvýšení výtěžnosti dat. Třetí kapitola se věnuje vlastnímu návrhu a implementaci systému typu end-to-end. Zmiňuje dostupné frameworky pro trénování i testování. Dále se kapitola zabývá postupem natrénování modelů včetně implementace vrstev neuronové sítě. Jeden model využívá seznam znaků a tři modely seznam slovních podřetězců. Nakonec se kapitola zabývá procesem testování včetně implementace dekódovacích algoritmů Beam a Greedy search. Poslední kapitola popisuje experimenty na nezávislých testovacích datech a dokumentuje výsledky rozpoznávání při různých parametrech. Lepší rozpoznávací skóre poskytuje dekodér Beam search, ale rozdíl není příliš výrazný.
- ItemVektorová reprezentace slov a její aplikace(2020-10-19) Halada, Martin; Nouza Jan, prof. Ing. CSc. : 54737Bakalářská práce se zabývá vektorovou reprezentací slov založenou na metodě Word2Vec. V první kapitole představuje problematiku reprezentace slov pomocí vektorů, zmiňuje různé způsoby a varianty jejího učení a nastiňuje možnosti jejího praktického využití. Druhá kapitola se zabývá vlastní implementací zmíněné metody, uvádí postup přípravy dat, vytvoření pracovního lexikonu a trénování neuronové sítě. Třetí kapitola se věnuje pěti možným aplikacím, jako jsou hledání podobných resp. opačných slov, tvorba slovních analogií, analýza sentimentu a zařazování článků do vybraných kategorií. První tři aplikace pracují přímo s natrénovanými vektory, neboť využívají informace o pozicích slov ve vektorovém prostoru. Další dvě aplikace používají vektory jako vstup do neuronové sítě natrénované jako klasifikátor do vybraných tříd. U všech úloh byl experimentálně vyhodnocován vliv několika základních parametrů (velikost slovníku, dimenze vektorového prostoru a délka kontextového okna) na úspěšnost. Nejdůležitějším parametrem byla velikost pracovního lexikonu, menší roli mělo nastavení počtu slov v kontextovém okně.