Návrh interaktivního hlasového rozhraní mezi člověkem a počítačem

Title Alternative:Designing an interactive voice interface for human-computer interaction
Loading...
Thumbnail Image
Date
2008
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Abstrakt Tato práce se zabývá problematikou návrhu interaktivního hlasového rozhraní mezi člověkem a počítačem. V rámci této práce byl vytvořen program, který je založen na rozpoznávání izolovaných slov. Aplikace má dvě hlavní fáze. První fází je návrh klientského prostředí. Snahou je vhodná volba parametrů tak, aby prostředí bylo uživatelsky příjemné, přehledné a hlavně přínosné pro uživatele v oblasti hlasového ovládání chodu počítač. Druhá fáze se zabývá možností jednoduchého vytvoření slovníku pomocí pohodlného editoru, který nám umožní, abychom se vyvarovali špatně zadaných informací rozpoznávači, který by s námi poté nekvalitně komunikoval a nerozpoznával naše promluvy. Pro účely kvalitního rozpoznávání řeči byl použit již hotový rozpoznávací systém, který pro aplikaci umožnil využívat Ústav informačních technologií a elektroniky, Technické univerzity v Liberci. V rámci této práce není řešen problém detekce mluvčího, hlas řečníka v různých situacích ani měnící se akustické pozadí. Práce je rozdělena tematicky na 3 části, kdy v první je uveden teoretický přehled problematiky návrhu hlasového dialogového systému. Jsou zde uvedeny možné způsoby přístupu k návrhu hlasového dialogového systému a také způsob, jakým vliv řeči ovlivňuje návrh hlasového dialogového systému. Další část je zaměřena na popis jednotlivých modelů hlasového dialogového systému, které musí být implementovány v softwarové části hlasového systému. Jedná se o metody rozpoznávání řeči, kde je stále velký problém rozpoznat promluvu jakéhokoliv řečníka užívajícího libovolná slova daného jazyka a dialogový přístup. Vhodná kombinace těchto metod nabízí velmi dobrý poměr mezi efektivitou a složitostí, danou náročností implementace. Poslední část je zaměřena na vlastní návrh a realizaci interaktivního hlasového rozhraní mezi člověkem a počítačem. Zde jsou porovnávány parametry návrhu a cílem je posoudit řadu atributů, které určují výslednou efektivitu a uživatelsky příjemnou ovladatelnost aplikace. Těmito parametry jsou např. volba rozpoznávacího systému, výběr vhodného uživatele pro hlasové rozhraní nebo design aplikace.
Abstract This work deals with problematics of designing an interactive voice control interface between human and a computer. Within this work it has been created computer program, which is based on recognition of isolated words of it´s user. Application has two main parts. The first part is design client environment. The goal is suitable choice of parameters. Environment was user niceness, overview representation and mainly boon for users in area voice control computer. The second part is possibility of creating a simple dictionary using a comfortable editor, which guarantees not to provide wrong information to the recognizer, which could lead difficult communicated and poor recognized of our speech. For purposes high-quality speech recognition it was use complete recognition system, which for application enabled use Institute of Information technology and electronics, Technical university of Liberec. In work it doesn{\crq}t deal with a problem of speaker detection, voice of speaker under different conditions or variable acoustic background. The work is thematically divided into three sections, where the first covers theoretical survey of voice dialog system design problematics. It presents possible approaches of voice dialog system design and also the influence speech on voice dialog system design. The second section is focused on description of particular parts of voice dialog system design, which has to be implemented in software part of the recognition system. It´s mainly speech recognition methods, where recognizing any speech of random speaker using arbitrary words of given language, and dialog approach. Suitable combinations of these methods provide very good trade off between effectivity and complexity of implementation. The last section is focused on personal design and realization interactive voice dialog system. The parameters are compared and the goal is to examine several attributes, which determine resulting effectivity and user friendly controllability of the application. These parameters are for example a choice of recognition system, choice of specific user for an interface or application design.
Description
katedra: ITE; přílohy: 1 CD ROM; rozsah: 50 str.
Subject(s)
interaktivní hlasové rozhraní, rozpoznání řeči, distribuovaný rozpoznávací systém, řízení dialogu, dialogový systém s konečným počtem stavů, interactive voice control interface, speech recognition, distributed recognition system, dialog approach, dialog system with final number status
Citation
ISSN
ISBN