Redukce šumu v řeči pomocí pole mikrofonů a neuronových sítí
dc.contributor | Pollák Petr, doc. Ing. CSc. : 66674 | |
dc.contributor.advisor | Koldovský Zbyněk, doc. Ing. Ph.D. : 56862 | |
dc.contributor.author | Bartoš, Petr | |
dc.contributor.other | Mishra Rajesh, doc. Ph.D. Skolitel : 60165 | |
dc.contributor.other | Málek Jiří, Ing. Ph.D. Konzultant : 61653 | |
dc.contributor.other | Bauer Martin, Ing. Konzultant2 : 60984 | |
dc.date.accessioned | 2018-10-15T11:51:37Z | |
dc.date.available | 2018-10-15T11:51:37Z | |
dc.date.committed | 2018-5-14 | |
dc.date.defense | 2018-6-12 | |
dc.date.submitted | 2017-10-19 | |
dc.date.updated | 2018-10-15 | |
dc.degree.level | Ing. | |
dc.description.abstract | Tato práce se zabývá způsoby redukce šumu pomocí pole mikrofonů v reálném čase. Jsou zde ukázány způsoby zpracování vícekanálových záznamů z evaluační kampaně CHiME-4 a CHiME-5. Seznámíme se s problematikou odhadu šumu pomocí pole mikrofonů. Je zde ukázána důležitost potřeby detektoru aktivity řeči VAD. Pro realizaci redukce šumu v reálném čase jsou zde navrženy dva systémy. Jeden využívá metody beamformingu za pomocí VAD a druhý pracuje na principu slepé separace signálu, přesněji pak extrakci nezávislého vektoru. Oba Systémy jsou realizovány pomocí programovacího jazyka C++ a knihovny PortAudio. První systém se v praxi ověřil jako velmi efektivní, zatím co druhý systém fungoval pouze omezeně. U~obou systémů proběhla optimalizace s důrazem na minimální možnou hodnotu zpoždění a vytížení procesoru. | cs |
dc.description.abstract | This thesis focuses on noise reduction in real-time using an microphone array. A number of techniques is shown being used in the processing of multichannel recordings from the CHiME-4 and CHiME-5 challenge. The solution to the issue of noise estimation using an microphone array is presented. Also the importance of a good VAD is shown. For the realization of noise reduction in real-time we designed two systems. One is based on beamforming aided by VAD, the other one is based on blind signal separation, more precisely on independent vector extraction. Both systems are implemented using the programming language C++ and PortAudio library. The first system is shown as highly effective, whereas the other one has limited functionality. Both were optimized with the emphasis on minimal latency and processor usage. | en |
dc.description.mark | ||
dc.format | 67 | |
dc.format.extent | Ilustrace, Grafy, Tabulky 0 1 | |
dc.identifier.uri | https://dspace.tul.cz/handle/15240/32192 | |
dc.language.iso | cs | |
dc.relation.isbasedon | begin*arab* renewcommand*labelenumi**[arabic*enumi*]* item H. L. Van Trees, Optimum Array Processing: Part IV of Detection, Estimation, and Modulation Theory, John Wiley & Sons, Inc.,2002. item Z. Koldovský, J. Málek, M. Boháč, J. Janský, ?CHiME4: Multichannel Enhancement Using Beamforming Driven by DNN-based Voice Activity Detection,? Proc. of the 4th Intl. Workshop on Speech Processing in Everyday Environments (CHiME 2016), San Francisco, item J. Málek, Z. Koldovský, M. Boháč, ?Block-Online Multichannel Speech Enhancement Using DNN-Based Voice Activity Detection,? submitted, 2017. end*arab* | |
dc.rights | Vysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26 | cs |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26 | en |
dc.rights.uri | https://knihovna.tul.cz/document/26 | |
dc.rights.uri | https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf | |
dc.subject | Redukce šumu | cs |
dc.subject | CHiME-4 | cs |
dc.subject | VAD | cs |
dc.subject | real-time aplikace | cs |
dc.subject | Noise reduction | en |
dc.subject | CHiME-4 | en |
dc.subject | VAD | en |
dc.subject | real-time application | en |
dc.title | Redukce šumu v řeči pomocí pole mikrofonů a neuronových sítí | cs |
dc.title | Speech Enhancement Using Microphone Array and Neural Networks | en |
dc.title.alternative | cs | |
dc.type | diplomová práce | cs |
local.degree.abbreviation | Navazující | |
local.degree.discipline | IT-N | |
local.degree.programme | Elektrotechnika a informatika | |
local.degree.programmeabbreviation | N2612 | |
local.department.abbreviation | ITE | |
local.faculty | Fakulta mechatroniky, informatiky a mezioborových studií | cs |
local.faculty.abbreviation | FM | |
local.identifier.author | M15000157 | |
local.identifier.stag | 37023 | |
local.note.administrators | automat |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- diplomova_prace_2018_Bartos_Petr.pdf
- Size:
- 1.12 MB
- Format:
- Adobe Portable Document Format
- Description:
- VSKP
Loading...
- Name:
- DP_Petr_Bartos_oponent.pdf
- Size:
- 866.45 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_oponenta_VSKP
Loading...
- Name:
- DP_Petr_Bartos_vedouci.pdf
- Size:
- 716.18 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_vedouciho_VSKP
Loading...
- Name:
- 1_Bartos.pdf
- Size:
- 270.19 KB
- Format:
- Adobe Portable Document Format
- Description:
- Prubeh_obhajoby_VSKP