Aplikace pro správu PDF dokumentů s využitím OCR technologie
Loading...
Date
2025-06-10
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Tato bakalářská práce se zabývá návrhem a implementací desktopové aplikace určené pro správu PDF dokumentů s využitím technologie optického rozpoznávání znaků (OCR). V rámci práce byly analyzovány dostupné OCR knihovny a cloudové služby s cílem nalézt nejvhodnější řešení pro rozpoznávání českého textu v tištěné i ručně psané podobě. Na základě provedených testů byla nakonec vybrána služba Azure Document Intelligence, která nabízí nejvýhodnější kombinaci přesnosti, rychlosti zpracování a dostupnosti pro účely vyvíjené aplikace.
Výsledná aplikace umožňuje uživatelům organizovat, prohledávat a exportovat obsah PDF dokumentů. Podporuje fulltextové vyhledávání jak v jednotlivých dokumentech, tak napříč celým souborovým systémem, přičemž nalezené fráze jsou interaktivně zvýrazněny přímo v dokumentu. Součástí práce je také implementace REST API, které zajišťuje komunikaci s OCR službou a podporuje veškerou správu dokumentů. V závěru jsou uvedeny možnosti dalšího rozvoje aplikace, zahrnující automatizaci zpracování, klasifikaci dokumentů či rozšíření metadat.
This bachelor's thesis focuses on the design and implementation of a desktop application intended for managing PDF documents using optical character recognition (OCR) technology. As part of the thesis, available OCR libraries and cloud services were analyzed to identify the most suitable solution for recognizing Czech text in both printed and handwritten form. Based on the conducted tests, Azure Document Intelligence was ultimately chosen, offering the most advantageous combination of accuracy, processing speed, and availability for the needs of the developed application. The resulting application enables users to organize, search, and export the content of PDF documents. It supports full-text search within individual documents as well as across the entire storage, with the found phrases interactively highlighted directly in the document. The thesis also includes the implementation of a REST API that facilitates communication with the OCR service and supports comprehensive document management. The conclusion outlines potential future enhancements of the application, including processing automation, document classification, and custom metadata.
This bachelor's thesis focuses on the design and implementation of a desktop application intended for managing PDF documents using optical character recognition (OCR) technology. As part of the thesis, available OCR libraries and cloud services were analyzed to identify the most suitable solution for recognizing Czech text in both printed and handwritten form. Based on the conducted tests, Azure Document Intelligence was ultimately chosen, offering the most advantageous combination of accuracy, processing speed, and availability for the needs of the developed application. The resulting application enables users to organize, search, and export the content of PDF documents. It supports full-text search within individual documents as well as across the entire storage, with the found phrases interactively highlighted directly in the document. The thesis also includes the implementation of a REST API that facilitates communication with the OCR service and supports comprehensive document management. The conclusion outlines potential future enhancements of the application, including processing automation, document classification, and custom metadata.
Description
Subject(s)
OCR, PDF, správa dokumentů, fulltextové vyhledávání, Azure Document Intelligence, desktopová aplikace, REST API, optické rozpoznávání znaků, zpracování dokumentů