Browsing by Author "Poláček, Martin"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
- ItemAutomatické generování interpunkce v systémech rozpoznávání řeči(2023-06-20) Poláček, Martin; Červa Petr, doc. Ing. Ph.D. :55712; Kolorenč Jan, Ing. Ph.D. :66659Tato diplomová práce se zabývá úlohou automatického generování interpunkce (automatic punctuation restoration - APR) v systémech pro automatický přepis řeči, které zpracovávají v reálném čase streamovaná data, například titulkují televizní vysílání. Konkrétně bylo cílem práce navrhnout APR modul, který bude do výstupu rozpoznávacího systému doplňovat tečky, čárky a otazníky. Zároveň bude dostatečně rychlý pro režim online zpracování a bude pracovat s co nejmenším zpožděním a to bez využití prosodických příznaků počítaných z řečového signálu. Výsledný navržený APR modul využívá předtrénovaný jazykový model ELECTRA-Small, který je založený na architektuře typu transformer. Experimentální část práce obsahuje porovnání výsledků dosažených použitím několika dalších architektur a vyšetřuje vliv různých hyperparametrů na proces trénování. V poslední části práce je navržený APR modul porovnán s jiným, již existujícím modulem, který používá kombinaci textových a prosodických příznaků. Z výsledků porovnání vyplývá, že APR modul navržený v této diplomové práci zmíněný modul překonává, splňuje všechny požadavky zadání a dosahuje velmi dobrých výsledků, které jsou plně použitelné v praxi. Novost a vlastní přínos této diplomové práce podtrhuje skutečnost, že navržená metoda a dosažené výsledky byly přijaty k publikaci na prestižní mezinárodní konferenci Interspeech 2023.
- ItemKolorizace černobílých obrázků pomocí neuronové sítě(2021-06-17) Poláček, Martin; Nouza Jan, prof. Ing. CSc. : 54737Tato bakalářská práce se zabývá automatickým kolorováním černobílých obrázků pomocí autoenkodérů založených na neuronových sítích. Nejprve je popsán způsob kódování barevných a černobílých obrázků, dále jsou zmíněny nejčastěji používané barevné modely a formáty pro ukládání obrazové informace. Následně jsou stručně shrnuty metody automatické kolorizace vyvinuté v posledních letech. Čtvrtá a pátá kapitola je věnována neuronovým sítím. Jsou zejména zaměřeny na architektury a frameworky použité v práci, tedy konvoluční sítě a enkodéry. Důležitou součástí práce je vytvoření velmi rozsáhlého datasetu obsahujícího 150 000 obrázků, který je nezbytný pro trénování a testování neuronové sítě. V sedmé kapitole jsou zdokumentovány vlastní implementační a experimentální práce, které vedly k postupnému vývoji vlastního kolorizačního schématu. Praktickým výstupem je demonstrační program umožňující během necelé sekundy obarvit dodaný obrázek o rozměrech 256 x 256 pixelů, přičemž obrázky s jinými velikostmi jsou na tento rozměr automaticky upraveny.