Zlepšování řečových nahrávek pořízených v reálném prostředí
Title Alternative:Enhancement of Real-world Speech Recordings
Loading...
Date
2016-01-01
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Tato práce se zabývá problematikou zlepšování řečových nahrávek reálného charakteru odstraněním nežádoucího šumu v logaritmické výkonové spektrální oblasti pomocí hlubokých neuronových sítí. Velká databáze čistých řečových nahrávek je aditivně degradována několika druhy šumu na různých úrovních SNR a slouží jako trénovací sada pro dopřednou hlubokou neuronovou síť. Dvě sítě jsou natrénovány na odlišně sestavených trénovacích sadách tak, aby se naučily vztah mezi zašuměnou a čistou řečí. Jejich schopnosti odstranění šumu z nahrávek jsou otestovány ve známých i neznámých šumových podmínkách a porovnány s některými konvenčními metodami. Sítě jsou otestovány i v neznámých řečových podmínkách pomocí malé testovací databáze české řeči. Výsledky ukazují, že síť natrénovaná na databázi obsahující více druhů šumu je robustnější při zlepšování řeči degradované neznámým druhem šumu. Zároveň je tato síť schopna konkurovat konvenčním metodám při odstraňování šumu stacionárního charakteru a překonat je při odstraňování šumu silně nestacionárního.
Description
47 stran :ilustrace (některé barevné), tabulky, grafy +1 CD-ROM
Subject(s)
signal processing, mobile applications, speech signals, zpracování signálů, mobilní aplikace, řečové signály