Grafické rozhraní pro OCR Tesseract
Title Alternative:Graphical user interface for OCR Tesseract
Loading...
Date
2013-01-01
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Tato práce je zaměřena na tvorbu aplikace, která poslouží jako grafické rozhraní pro konzolovou aplikaci Tesseract OCR. Vytvořené prostředí uživateli usnadní rozpoznávání textu v obrazových datech a též vytváření nových dat, sloužících k rozpoznávání. V dnešní době je problematika OCR softwarů velmi aktuální a to už ať z pohledu vytváření knih pro, dnes velmi populární, elektronické čtečky knih nebo z pohledu využívání elektroniky v knihovnách popřípadě archivace. Tesseract OCR, vyvíjený firmou Google má velmi dobré výsledky, ovšem jeho ovládání pomocí příkazové řádky není vždy úplně snadné a následná úprava dat je často dosti zdlouhavá. Aplikace je rozdělena do tří částí, z nichž každá využívá řadu modulů projektu Tesseract OCR k vytváření tréninkových dat nebo k rozpoznávání textu. Dovoluje též editaci vytvořených dat. V rámci této práce byla testována funkčnost aplikace na vzorku obrazových dat a následně došlo k vyhodnocení. Pro této účel byla vytvořena aplikace pro hromadnou a automatickou úpravu výstupních dat tréninkové části aplikace.?Práce má pět části, z nichž první se zabývá projektem Tesseract OCR. Druhá, třetí a čtvrtá, vytvořeným prostředím a poslední potom testováním aplikace, kde je též řešena problematika kvality a rozměrů zdrojových dat.
Description
38 s., 3 s. příl. :il. +CD ROM
Subject(s)
graphical user interfaces, grafická uživatelská rozhraní