Multiplatformní aplikace pro hlasové ovládání

Abstract
Tato diplomová práce se zaměřuje na vývoj nové generace již existujícího řešení pro ovládání osobního počítače pouze pomocí rozpoznaných hlasových povelů. Diplomová práce provází použitým typem parametrizace, samotným detekováním řečových a neřečových segmentů, rozpoznáním hlasového povelu a následným vykonáním rozpoznaného povelu. Zároveň ukazuje strukturu možných povelů a její rozšiřitelnost.Vypracování probíhalo v několika navazujících krocích. Nejdůležitější částí bylo vytvoření knihovny pro samotnou parametrizaci vstupního audio signálu. Po této fázi následovalo vytvoření dalšího modulu pro detekci řečových úseků a jejich odeslání rozpoznávacímu serveru. Po úspěšně zvládnutém odesílání řečových segmentů následuje konstrukce struktury pro samotné ovládání počítače.Po konečném vytvoření potřebných modulů autor přistoupil k tvorbě samotné multiplatformní aplikace. Vytváření probíhalo pomocí knihovny Electron, která umožňuje tvorbu aplikací s využitím běžně dostupných webových technologií, např. HTML, CSS nebo JavaScript.
The focus of this master thesis is on the development of a new generation based on an existing solution for controlling a personal computer only by using recognized spoken commands. The master thesis describes the type of parameterization used, detection of speech and non-speech segments, recognition of spoken commands and execution of a recognized command. At the same time, the master thesis describes the structure of possible commands and its extensibility. The elaboration has been divided into separate steps. The most important part was the creation of a library for parameterization of an audio signal input. After this step a new module for detection of speech segments and its dispatch to a recognition server was created. After the successful creation of a speech segment sender the construction of a computer controller structure followed. After the successful creation of all necessary modules, the author created the final cross-platform application. The application was created by using an Electron framework, which allows the creation of applications by using common web technologies, for example HTML, CSS or JavaScript.
Description
Subject(s)
Electron, JavaScript, hloubkové neuronové sítě, hlasové ovládání, detektor řečové aktivity, Electron, JavaScript, deep neural networks, voice control, speech activity detector
Citation
ISSN
ISBN