Redukce šumu v řeči pomocí pole mikrofonů a neuronových sítí

dc.contributorPollák Petr, doc. Ing. CSc. : 66674
dc.contributor.advisorKoldovský Zbyněk, doc. Ing. Ph.D. : 56862
dc.contributor.authorBartoš, Petr
dc.contributor.otherMishra Rajesh, doc. Ph.D. Skolitel : 60165
dc.contributor.otherMálek Jiří, Ing. Ph.D. Konzultant : 61653
dc.contributor.otherBauer Martin, Ing. Konzultant2 : 60984
dc.date.accessioned2018-10-15T11:51:37Z
dc.date.available2018-10-15T11:51:37Z
dc.date.committed2018-5-14
dc.date.defense2018-6-12
dc.date.submitted2017-10-19
dc.date.updated2018-10-15
dc.degree.levelIng.
dc.description.abstractTato práce se zabývá způsoby redukce šumu pomocí pole mikrofonů v reálném čase. Jsou zde ukázány způsoby zpracování vícekanálových záznamů z evaluační kampaně CHiME-4 a CHiME-5. Seznámíme se s problematikou odhadu šumu pomocí pole mikrofonů. Je zde ukázána důležitost potřeby detektoru aktivity řeči VAD. Pro realizaci redukce šumu v reálném čase jsou zde navrženy dva systémy. Jeden využívá metody beamformingu za pomocí VAD a druhý pracuje na principu slepé separace signálu, přesněji pak extrakci nezávislého vektoru. Oba Systémy jsou realizovány pomocí programovacího jazyka C++ a knihovny PortAudio. První systém se v praxi ověřil jako velmi efektivní, zatím co druhý systém fungoval pouze omezeně. U~obou systémů proběhla optimalizace s důrazem na minimální možnou hodnotu zpoždění a vytížení procesoru.cs
dc.description.abstractThis thesis focuses on noise reduction in real-time using an microphone array. A number of techniques is shown being used in the processing of multichannel recordings from the CHiME-4 and CHiME-5 challenge. The solution to the issue of noise estimation using an microphone array is presented. Also the importance of a good VAD is shown. For the realization of noise reduction in real-time we designed two systems. One is based on beamforming aided by VAD, the other one is based on blind signal separation, more precisely on independent vector extraction. Both systems are implemented using the programming language C++ and PortAudio library. The first system is shown as highly effective, whereas the other one has limited functionality. Both were optimized with the emphasis on minimal latency and processor usage.en
dc.description.mark
dc.format67
dc.format.extentIlustrace, Grafy, Tabulky 0 1
dc.identifier.urihttps://dspace.tul.cz/handle/15240/32192
dc.language.isocs
dc.relation.isbasedonbegin*arab* renewcommand*labelenumi**[arabic*enumi*]* item H. L. Van Trees, Optimum Array Processing: Part IV of Detection, Estimation, and Modulation Theory, John Wiley & Sons, Inc.,2002. item Z. Koldovský, J. Málek, M. Boháč, J. Janský, ?CHiME4: Multichannel Enhancement Using Beamforming Driven by DNN-based Voice Activity Detection,? Proc. of the 4th Intl. Workshop on Speech Processing in Everyday Environments (CHiME 2016), San Francisco, item J. Málek, Z. Koldovský, M. Boháč, ?Block-Online Multichannel Speech Enhancement Using DNN-Based Voice Activity Detection,? submitted, 2017. end*arab*
dc.rightsVysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26cs
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26en
dc.rights.urihttps://knihovna.tul.cz/document/26
dc.rights.urihttps://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subjectRedukce šumucs
dc.subjectCHiME-4cs
dc.subjectVADcs
dc.subjectreal-time aplikacecs
dc.subjectNoise reductionen
dc.subjectCHiME-4en
dc.subjectVADen
dc.subjectreal-time applicationen
dc.titleRedukce šumu v řeči pomocí pole mikrofonů a neuronových sítícs
dc.titleSpeech Enhancement Using Microphone Array and Neural Networksen
dc.title.alternativecs
dc.typediplomová prácecs
local.degree.abbreviationNavazující
local.degree.disciplineIT-N
local.degree.programmeElektrotechnika a informatika
local.degree.programmeabbreviationN2612
local.department.abbreviationITE
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.faculty.abbreviationFM
local.identifier.authorM15000157
local.identifier.stag37023
local.note.administratorsautomat
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
diplomova_prace_2018_Bartos_Petr.pdf
Size:
1.12 MB
Format:
Adobe Portable Document Format
Description:
VSKP
Loading...
Thumbnail Image
Name:
DP_Petr_Bartos_oponent.pdf
Size:
866.45 KB
Format:
Adobe Portable Document Format
Description:
Posudek_oponenta_VSKP
Loading...
Thumbnail Image
Name:
DP_Petr_Bartos_vedouci.pdf
Size:
716.18 KB
Format:
Adobe Portable Document Format
Description:
Posudek_vedouciho_VSKP
Loading...
Thumbnail Image
Name:
1_Bartos.pdf
Size:
270.19 KB
Format:
Adobe Portable Document Format
Description:
Prubeh_obhajoby_VSKP