Automatické opravy skenovaných historických textů s využitím pravděpodobnostních modelů

Title Alternative:Automatic editing of scanned historical texts based on probabilistic models
dc.contributor.advisorNouza, Jan
dc.contributor.authorKounovský, Tomáš
dc.date2014
dc.date.accessioned2016-07-26
dc.date.available2016-07-26
dc.date.defense2014-06-17
dc.date.issued2014
dc.degree.levelbccs
dc.description41 s., 2 s. příl. :obr., tab. +CD ROMcs
dc.description.abstractTato práce se zabývá problematikou využití OCR pro digitalizaci historických textů, konkrétně plně automatickými post-OCR opravami chyb. Práce se zaměřuje hlavně na využití pravděpodobnostních metod, jako jsou statistiky znakových záměn a pravděpodobnostní jazykové modely. Cílem této práce je vytvoření a zhodnocení postupů a nástrojů, jenž umožní co nejspolehlivěji snížit procento neslovných chyb způsobených digitalizací ročníků 1945 až 1983 deníku Rudé Právo. Výsledkem práce jsou dva systémy, pomocí nichž byly provedeny automatické opravy na výše zmíněných textových dokumentech. První z nich, založen na výpočtu pravděpodobnosti, zvládá opravit až 6,97 % vstupních chyb při spolehlivosti oprav až 83 %. Druhý systém, využívající algoritmus založený na vlastní skórovací metodě, zvládá opravit až 5,7 % vstupních chyb při spolehlivosti oprav až 92 %.cs
dc.formattext
dc.identifier.signatureV 13/14 Mb
dc.identifier.urihttps://dspace.tul.cz/handle/15240/16743
dc.language.isocs
dc.publisherTechnická Univerzita v Libercics
dc.relation.isreferencedbyhttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28776&typ=1
dc.relation.isreferencedbyhttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28776&typ=2
dc.relation.isreferencedbyhttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28776&typ=3
dc.source.urihttp://knihovna-opac.tul.cz/diplomovaPrace.php?id_dipl=28776
dc.subjectOCR technologyen
dc.subjecttechnologie OCRcs
dc.subject.verbisOCR technologyen
dc.titleAutomatické opravy skenovaných historických textů s využitím pravděpodobnostních modelůcs
dc.title.alternativeAutomatic editing of scanned historical texts based on probabilistic modelsen
dc.typeThesis
local.departmentITEcs
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.identifier.stag28776
local.identifier.verbis479858
local.note.administratorsoprava_A
local.verbis.aktualizace2019-10-05 05:52:58cs
local.verbis.studijniprogramITE Informační technologie/Informační technologiecs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
dokumentace_BP_tomas_kounovsky.pdf
Size:
4.18 MB
Format:
Adobe Portable Document Format
Description:
kvalifikační práce
Loading...
Thumbnail Image
Name:
Dipl_28776.pdf
Size:
471.83 KB
Format:
Adobe Portable Document Format
Description:
posudek oponenta
Loading...
Thumbnail Image
Name:
Dipl_28776.pdf
Size:
632.31 KB
Format:
Adobe Portable Document Format
Description:
posudek vedoucího
Loading...
Thumbnail Image
Name:
Dipl_28776.pdf
Size:
445.97 KB
Format:
Adobe Portable Document Format
Description:
výsledek obhajoby