Selektivní získávání informací s využitím LLM

dc.contributor.advisorVraný Jiří, Mgr. Ph.D. :54918cs
dc.contributor.authorDoanová, Helenacs
dc.contributor.refereeUrsíny Michal, Mgr. :69410cs
dc.date.accessioned2025-02-19T10:07:28Z
dc.date.available2025-02-19T10:07:28Z
dc.date.committed9.5.2025cs
dc.date.defense28.1.2025cs
dc.date.issued2025-01-28
dc.date.submitted12.10.2023cs
dc.description.abstractTato diplomová práce se zaměřuje na vývoj aplikace pro automatizovaný sběr dokumentů z internetového prostředí na základě uživatelského dotazu. Klasifikace dokumentů ve vztahu k uživatelskému dotazu je realizována sémantickou analýzou za využití velkých jazykových modelů. Teoretická část práce představuje velké jazykové modely a jejich význam při klasifikaci textu. Pro usnadnění a zefektivnění tohoto procesu byla navržena aplikace s modulární architekturou, skládající se z pěti na sebe navazujících modulů: modul pro optimalizaci uživatelského dotazu, modul pro vyhledávání na internetu, modul pro extrakci textu, modul pro klasifikaci dokumentů a modul pro správu databáze. Jednotlivé moduly jsou v práci podrobně popsány, včetně jejich vzájemného propojení a možnosti jejich výměny za nové moduly, což přispívá k flexibilitě navrženého systému. Funkčnost aplikace byla ověřena simulací reálného používání, která testovala správnou komunikaci mezi jednotlivými moduly a jejich integraci do systému. Během testování bylo získáno a klasifikováno více než 10 tisíc dokumentů, a to bez výskytu závažných problémů, čímž byla potvrzena funkčnost navržené aplikace.cs
dc.description.abstractThis master thesis focuses on the development of an application for the automated collection of documents from the Internet environment based on a user query. The classification of documents in relation to the user query is performed by semantic analysis using large language models. The theoretical part of the thesis presents large language models and their importance in text classification. In order to simplify and improve the efficiency of this process, an application with a modular architecture was designed. Aplication is composed of five interrelated modules: a module for optimizing the user query, a module for web search, a module for text extraction, a module for document classification and a module for database management. The individual modules are described in detail, including their interconnection and the possibility of replacing them with new modules, which contributes to the flexibility of the proposed system. The functionality of the application was verified by a real-use simulation, which tests the correct communication between the modules and their integration into the system. During the testing, more than 10 thousand documents were retrieved and classified without any major problems, which confirmed the functionality of the proposed application.en
dc.format68 s. (107 551)cs
dc.identifier.urihttps://dspace.tul.cz/handle/15240/176632
dc.language.isoCScs
dc.subjectvelké jazykové modelycs
dc.subjectzpracování přirozeného jazykacs
dc.subjectsémantická analýza textucs
dc.subjectextrakce textucs
dc.subjectklasifikace textucs
dc.titleSelektivní získávání informací s využitím LLMcs
dc.titleSelective information retrieval using LLMen
dc.typediplomová prácecs
local.degree.abbreviationNavazujícícs
local.identifier.authorM22000019cs
local.identifier.stag46361cs
Files
Original bundle
Now showing 1 - 5 of 5
Loading...
Thumbnail Image
Name:
DP_Doanova.pdf
Size:
712.84 KB
Format:
Adobe Portable Document Format
Description:
VŠKP ( 6.1.2025 20:23 )
Loading...
Thumbnail Image
Name:
Přílohy_DP_Doanova.zip
Size:
211.01 KB
Format:
Unknown data format
Description:
VŠKP - příloha ( 6.1.2025 20:23 )
Loading...
Thumbnail Image
Name:
Doanová - posudek vedoucího.pdf
Size:
578.14 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP ( 20.1.2025 13:50 )
Loading...
Thumbnail Image
Name:
Doanová - posudek oponenta.pdf
Size:
130.86 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP ( 20.1.2025 13:50 )
Loading...
Thumbnail Image
Name:
ProtokolSPrubehemObhajobySTAG.pdf
Size:
39.36 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP ( 28.1.2025 14:08 )