Automatická strukturalizace počítačem přepsaných mluvených dokumentů z multimediálních archivů
dc.contributor | ||
dc.contributor.advisor | ||
dc.contributor.author | Boháč, Marek | |
dc.contributor.other | Nouza Jan, prof. Ing. CSc. Skolitel : 54737 | |
dc.contributor.other | Rozkovec Jiří, Mgr. Konzultant : 56638 | |
dc.contributor.other | Pifková Monika, Ing. Konzultant2 : 65313 | |
dc.date | 2016 | |
dc.date.accessioned | 2019-02-03T07:20:58Z | |
dc.date.available | 2019-02-03T07:20:58Z | |
dc.date.committed | 2014-6-30 | |
dc.date.defense | 2016-6-30 | |
dc.date.submitted | 2010-7-1 | |
dc.date.updated | 2018-12-10 | |
dc.degree.level | Ph.D. | |
dc.description.abstract | Tato práce se zaměřuje na řešení komplexního problému jak strukturalizovat (vhodně rozčlenit, textově i foneticky analyzovat a následně upravit) výstup systému pro automatické rozpoznávání řeči tak, aby byl co nejčitelnější pro člověka a zároveň připravený pro efektivní strojové zpracování a vyhledávání. Motivací pro řešení tohoto problému byl výzkumný projekt podporovaný Ministerstvem kultury ČR, jehož cílem bylo přepsat mluvené dokumenty z archivu Českého a Československého rozhlasu a zpřístupnit je pro vyhledávání. Vzhledem k rozsahu archivu (213.000 dokumentů z období 1923 až 2014) bylo nutné navrhnout a zrealizovat takový postup a technologie, které by byly schopny zvládnout nejen obrovské množství dat, ale také specifické problémy související s různou kvalitou záznamů, s přítomností českého i slovenského jazyka v dokumentech, se střídajícími se mluvčími, s prokládáním řeči znělkami, hudebními předěly a písničkami či s hluky na pozadí řeči. | cs |
dc.description.abstract | This thesis focuses on solving a complex task how to structure (i.e. appropriately divide, textually and phonetically analyze and subsequently modify) the output of the speech recognition system so it is most readable for human and also prepared for effective machine processing and search. Motivation to solve this task was the research project supported by the Czech Ministry of culture, aimed at transcription of spoken documents contained in the Czech and Czechoslovak radio and to make them available for search. Taking into account the archive size (213,000 documents form the years 1923-2014) it was essential to propose and implement such technologies, that were able to handle not only the waste amount of the data but also some specific issues associated with different acoustic quality of the documents, speaker changes, presence of jingles, music divides and song between the speech segments or with background noise. | en |
dc.format | text | |
dc.format.extent | Ilustrace, Schémata, Grafy, Tabulky 1 ROM | |
dc.identifier.signature | U 904 M | |
dc.identifier.uri | https://dspace.tul.cz/handle/15240/150819 | |
dc.language.iso | cs | |
dc.publisher | Technická Univerzita v Liberci | cs |
dc.rights | Vysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/118 | cs |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/118 | en |
dc.rights.uri | https://knihovna.tul.cz/document/26 | |
dc.rights.uri | https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf | |
dc.subject | automatická strukturalizace nahrávky | cs |
dc.subject | zpřístupnění archivu mluveného slova | cs |
dc.subject | rozpoznání řeči | cs |
dc.subject | automatic structuralization of recording | en |
dc.subject | making spoken word archive accessible | en |
dc.subject | speech recognition | en |
dc.title | Automatická strukturalizace počítačem přepsaných mluvených dokumentů z multimediálních archivů | cs |
dc.title | Automatic processing of computer-transcribed spoken documents from multimedia archives | en |
dc.type | Thesis | |
dc.type | disertační práce | cs |
local.degree.discipline | TK4 | |
local.degree.programme | Elektrotechnika a informatika | |
local.degree.programmeabbreviation | P2612 | |
local.department.abbreviation | ITE | |
local.faculty | Fakulta mechatroniky, informatiky a mezioborových studií | cs |
local.faculty.abbreviation | FM | |
local.identifier.author | M10000001 | |
local.identifier.stag | 34705 | |
local.note.administrators | TrykarovaA |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- disertacni_prace_Bohac_2016.pdf
- Size:
- 2.47 MB
- Format:
- Adobe Portable Document Format
- Description:
- VSKP
Loading...
- Name:
- hodnoceni_skolitele_Nouza_Bohac.pdf
- Size:
- 321.44 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_vedouciho_VSKP
Loading...
- Name:
- oponentni_posudky_Ing.Bohace.pdf
- Size:
- 2.27 MB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_oponenta_VSKP
Loading...
- Name:
- Zapis_obhajoby_DisP_Ing.Bohac.pdf
- Size:
- 767.25 KB
- Format:
- Adobe Portable Document Format
- Description:
- Prubeh_obhajoby_VSKP