Non-intrusive speech quality assessment

Abstract
Tato bakalářská práce se zabývá odhadem metrik pro kvalitu řečového signálu bez reference. Odhad je založen na realných datech a je postaven na vytvoření neuronové sítě. Konkrétně odhadujeme odstup signálu od šumu, čas dozvuku T60 a srozumitelnost řeči metrikou STOI (Short-Time Objective Intelligibility). Práce porovnává odhad těchto metrik s a bez reference. Model je testován na různých datových sadách a je diskutována přesnost odhadu. Odhad kvality řečového signálu bez reference umožňuje přenést měření kvality řečového signálu do praktických situací mimo umělé laboratorní podmínky.
This bachelor thesis deals with the estimation of metrics for speech signal quality without reference. Estimation is based on real data and implemented through a neural network. Specifically, we estimate signal-to-noise ratio, T60 reverberation time, and speech intelligibility using the STOI (Short-Time Objective Intelligibility) metric. The work compares estimation of the metrics with and without reference. The model is tested on different datasets, and the estimation accuracy is discussed. The estimation of speech signal quality without reference enables to transfer the measurement of speech signal quality to practical situations outside artificial laboratory conditions.
Description
Subject(s)
odhad metrik bez reference, kvalita řeči, neuronové sítě, zpracování signálu, metriky kvality
Citation
ISSN
ISBN