Systém pro vizuální protěžbu videonahrávek televizních pořadů

dc.contributor.advisorChaloupka Josef, doc. Ing. Ph.D. :54794cs
dc.contributor.authorJanovec, Tomášcs
dc.contributor.refereeMrázek Petr, Ing. Ph.D. :54956cs
dc.date.accessioned2025-07-14T12:42:20Z
dc.date.available2025-07-14T12:42:20Z
dc.date.committed9.5.2025cs
dc.date.defense10.6.2025cs
dc.date.issued2025-06-10cs
dc.date.submitted14.10.2024cs
dc.description.abstractTato bakalářská práce se zabývá návrhem a implementací systému pro automatické protěžování informací z televizních videonahrávek. Systém se zaměřuje na tři hlavní oblasti počítačového vidění: detek- ci střihů pro segmentaci videa, optické rozpoznávání textu (OCR) a detekci a identifikaci osob pomocí obličejů. Pro segmentaci byly porovnány čtyři metody, přičemž nejlepší vý- sledky na vlastním datasetu dosáhl model TransNet V2. V oblasti OCR byly testovány nástroje Tesseract, PaddleOCR a EasyOCR, přičemž nejvyšší přesnosti dosáhl EasyOCR. PaddleOCR byl vy- hodnocen jako méně vhodný zejména kvůli slabé podpoře českého jazyka. Identifikace osob byla realizována pomocí knihovny InsightFace na základě porovnávání detekovaných obličejů s předdefinovanou da- tabází známých osob. Součástí práce byl také fine-tuning modelu YOLO pro účely de- tekce televizních log. Významným výstupem je rovněž sada GUI aplikací pro anotaci dat a testování, jakož i dockerizace celého sys- tému. Webové rozhraní umožňuje nahrání videí, konfiguraci infe- rencí a prohlížení výstupů ve formátu JSON. Výsledný systém integruje více nástrojů a přístupů do ucelené pi- peline pro analýzu televizního obsahu a je připraven pro další roz- šiřování a nasazení.cs
dc.description.abstractThis bachelor thesis focuses on the design and implementation of a system for automatic extraction of information from television video recordings. The system targets three main areas of compu- ter vision: shot boundary detection for video segmentation, optical character recognition (OCR), and face-based detection and identi- fication of people. Four methods were compared for segmentation, with the best re- sults on a custom dataset achieved by the TransNet V2 model. In the OCR area, Tesseract, PaddleOCR, and EasyOCR tools were tested, with EasyOCR achieving the highest accuracy. PaddleOCR was evaluated as less suitable mainly due to weak support for the Czech language. Person identification was carried out by using the InsightFace library and comparing detected faces with a predefined database of known individuals. The work also included fine-tuning a YOLO model for the purpose of detecting television channel logos. An important outcome of the project is also a set of GUI applications for data annotation and testing, as well as full containerization of the system. A web inter- face allows users to upload videos, configure inference parameters, and view outputs in JSON format. The resulting system integrates multiple tools and approaches into a unified pipeline for the analysis of television content and is ready for further development and deployment.en
dc.format59 s.cs
dc.identifier.urihttps://dspace.tul.cz/handle/15240/177305
dc.language.isoCScs
dc.subjectdataminingcs
dc.subjectsegmentace videacs
dc.subjectOCRcs
dc.subjectdetekce obličejecs
dc.subjectPythoncs
dc.titleSystém pro vizuální protěžbu videonahrávek televizních pořadůcs
dc.titleSystem for Visual Processing of Video Recordings of Television Programmesen
dc.typediplomová prácecs
local.degree.abbreviationBakalářskýcs
local.identifier.authorM22000154cs
local.identifier.stag47838cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
BP-Stag.pdf
Size:
8.64 MB
Format:
Adobe Portable Document Format
Description:
VŠKP ( 7.5.2025 11:38 )
Loading...
Thumbnail Image
Name:
BP_Tomáš Janovec _vedoucí.pdf
Size:
460 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP ( 27.5.2025 13:44 )
Loading...
Thumbnail Image
Name:
BP_Tomáš Janovec _oponent.pdf
Size:
602.27 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP ( 27.5.2025 13:44 )
Loading...
Thumbnail Image
Name:
ProtokolSPrubehemObhajobySTAG.pdf
Size:
39.19 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP ( 13.6.2025 9:09 )