Automatická strukturalizace počítačem přepsaných mluvených dokumentů z multimediálních archivů

dc.contributor
dc.contributor.advisor
dc.contributor.authorBoháč, Marek
dc.contributor.otherNouza Jan, prof. Ing. CSc. Skolitel : 54737
dc.contributor.otherRozkovec Jiří, Mgr. Konzultant : 56638
dc.contributor.otherPifková Monika, Ing. Konzultant2 : 65313
dc.date2016
dc.date.accessioned2019-02-03T07:20:58Z
dc.date.available2019-02-03T07:20:58Z
dc.date.committed2014-6-30
dc.date.defense2016-6-30
dc.date.submitted2010-7-1
dc.date.updated2018-12-10
dc.degree.levelPh.D.
dc.description.abstractTato práce se zaměřuje na řešení komplexního problému jak strukturalizovat (vhodně rozčlenit, textově i foneticky analyzovat a následně upravit) výstup systému pro automatické rozpoznávání řeči tak, aby byl co nejčitelnější pro člověka a zároveň připravený pro efektivní strojové zpracování a vyhledávání. Motivací pro řešení tohoto problému byl výzkumný projekt podporovaný Ministerstvem kultury ČR, jehož cílem bylo přepsat mluvené dokumenty z archivu Českého a Československého rozhlasu a zpřístupnit je pro vyhledávání. Vzhledem k rozsahu archivu (213.000 dokumentů z období 1923 až 2014) bylo nutné navrhnout a zrealizovat takový postup a technologie, které by byly schopny zvládnout nejen obrovské množství dat, ale také specifické problémy související s různou kvalitou záznamů, s přítomností českého i slovenského jazyka v dokumentech, se střídajícími se mluvčími, s prokládáním řeči znělkami, hudebními předěly a písničkami či s hluky na pozadí řeči.cs
dc.description.abstractThis thesis focuses on solving a complex task how to structure (i.e. appropriately divide, textually and phonetically analyze and subsequently modify) the output of the speech recognition system so it is most readable for human and also prepared for effective machine processing and search. Motivation to solve this task was the research project supported by the Czech Ministry of culture, aimed at transcription of spoken documents contained in the Czech and Czechoslovak radio and to make them available for search. Taking into account the archive size (213,000 documents form the years 1923-2014) it was essential to propose and implement such technologies, that were able to handle not only the waste amount of the data but also some specific issues associated with different acoustic quality of the documents, speaker changes, presence of jingles, music divides and song between the speech segments or with background noise.en
dc.formattext
dc.format.extentIlustrace, Schémata, Grafy, Tabulky 1 ROM
dc.identifier.signatureU 904 M
dc.identifier.urihttps://dspace.tul.cz/handle/15240/150819
dc.language.isocs
dc.publisherTechnická Univerzita v Libercics
dc.rightsVysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/118cs
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/118en
dc.rights.urihttps://knihovna.tul.cz/document/26
dc.rights.urihttps://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subjectautomatická strukturalizace nahrávkycs
dc.subjectzpřístupnění archivu mluveného slovacs
dc.subjectrozpoznání řečics
dc.subjectautomatic structuralization of recordingen
dc.subjectmaking spoken word archive accessibleen
dc.subjectspeech recognitionen
dc.titleAutomatická strukturalizace počítačem přepsaných mluvených dokumentů z multimediálních archivůcs
dc.titleAutomatic processing of computer-transcribed spoken documents from multimedia archivesen
dc.typeThesis
dc.typedisertační prácecs
local.degree.disciplineTK4
local.degree.programmeElektrotechnika a informatika
local.degree.programmeabbreviationP2612
local.department.abbreviationITE
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.faculty.abbreviationFM
local.identifier.authorM10000001
local.identifier.stag34705
local.note.administratorsTrykarovaA
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
disertacni_prace_Bohac_2016.pdf
Size:
2.47 MB
Format:
Adobe Portable Document Format
Description:
VSKP
Loading...
Thumbnail Image
Name:
hodnoceni_skolitele_Nouza_Bohac.pdf
Size:
321.44 KB
Format:
Adobe Portable Document Format
Description:
Posudek_vedouciho_VSKP
Loading...
Thumbnail Image
Name:
oponentni_posudky_Ing.Bohace.pdf
Size:
2.27 MB
Format:
Adobe Portable Document Format
Description:
Posudek_oponenta_VSKP
Loading...
Thumbnail Image
Name:
Zapis_obhajoby_DisP_Ing.Bohac.pdf
Size:
767.25 KB
Format:
Adobe Portable Document Format
Description:
Prubeh_obhajoby_VSKP
Collections