Zlepšování řečových nahrávek pořízených v reálném prostředí

Title Alternative:Enhancement of Real-world Speech Recordings
Abstract
Tato práce se zabývá problematikou zlepšování řečových nahrávek reálného charakteru odstraněním nežádoucího šumu v logaritmické výkonové spektrální oblasti pomocí hlubokých neuronových sítí. Velká databáze čistých řečových nahrávek je aditivně degradována několika druhy šumu na různých úrovních SNR a slouží jako trénovací sada pro dopřednou hlubokou neuronovou síť. Dvě sítě jsou natrénovány na odlišně sestavených trénovacích sadách tak, aby se naučily vztah mezi zašuměnou a čistou řečí. Jejich schopnosti odstranění šumu z nahrávek jsou otestovány ve známých i neznámých šumových podmínkách a porovnány s některými konvenčními metodami. Sítě jsou otestovány i v neznámých řečových podmínkách pomocí malé testovací databáze české řeči. Výsledky ukazují, že síť natrénovaná na databázi obsahující více druhů šumu je robustnější při zlepšování řeči degradované neznámým druhem šumu. Zároveň je tato síť schopna konkurovat konvenčním metodám při odstraňování šumu stacionárního charakteru a překonat je při odstraňování šumu silně nestacionárního.
Description
47 stran :ilustrace (některé barevné), tabulky, grafy +1 CD-ROM
Subject(s)
signal processing, mobile applications, speech signals, zpracování signálů, mobilní aplikace, řečové signály
Citation
ISSN
ISBN