Detekce zvukových událostí
Loading...
Date
2025-06-11
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Tato práce se týká Detekce zvukových událostí (SED). Na základě
rešerše současného stavu vědění (SOTA), jsou zvoleni dva zástup-
ci moderních detekčních algoritmů, kteří jsou natrénování pomocí
několika variant trénovacího datasetu obsahujícího data různé kva-
lity pro zjištění vlivu jednotlivých částí datasetu na trénink sítě.
Důležitou součástí práce je také sestavení vlastního, ručně dělané-
ho datasetu a testování natrénovaných modelů na tomto datasetu.
Metody jsou porovnávány podle přesnosti určení typu zvuku a jeho
časového výskytu. Na závěr probíhá diskuze výsledků a možných
poznatků.
This thesis focuses on Sound Event Detection (SED). Based on a re- view of the current state of the art (SOTA), two representatives of modern detection algorithms are selected. These algorithms are trained using several variants of a training dataset containing data of varying quality in order to assess the impact of individual parts of the dataset on network training. An important part of the work is also the creation of a custom, manually curated dataset and the testing of the trained models on this dataset. The methods are com- pared in terms of their accuracy in identifying the type of sound and its temporal occurrence. Finally, the results and possible insi- ghts are discussed.
This thesis focuses on Sound Event Detection (SED). Based on a re- view of the current state of the art (SOTA), two representatives of modern detection algorithms are selected. These algorithms are trained using several variants of a training dataset containing data of varying quality in order to assess the impact of individual parts of the dataset on network training. An important part of the work is also the creation of a custom, manually curated dataset and the testing of the trained models on this dataset. The methods are com- pared in terms of their accuracy in identifying the type of sound and its temporal occurrence. Finally, the results and possible insi- ghts are discussed.
Description
Subject(s)
Strojové učení, detekce zvuků, dataset, analýza, model, srovnání