Selektivní získávání informací s využitím LLM
| dc.contributor.advisor | Vraný Jiří, Mgr. Ph.D. :54918 | cs |
| dc.contributor.author | Doanová, Helena | cs |
| dc.contributor.referee | Ursíny Michal, Mgr. :69410 | cs |
| dc.date.accessioned | 2025-02-19T10:07:28Z | |
| dc.date.available | 2025-02-19T10:07:28Z | |
| dc.date.committed | 9.5.2025 | cs |
| dc.date.defense | 28.1.2025 | cs |
| dc.date.issued | 2025-01-28 | |
| dc.date.submitted | 12.10.2023 | cs |
| dc.description.abstract | Tato diplomová práce se zaměřuje na vývoj aplikace pro automatizovaný sběr dokumentů z internetového prostředí na základě uživatelského dotazu. Klasifikace dokumentů ve vztahu k uživatelskému dotazu je realizována sémantickou analýzou za využití velkých jazykových modelů. Teoretická část práce představuje velké jazykové modely a jejich význam při klasifikaci textu. Pro usnadnění a zefektivnění tohoto procesu byla navržena aplikace s modulární architekturou, skládající se z pěti na sebe navazujících modulů: modul pro optimalizaci uživatelského dotazu, modul pro vyhledávání na internetu, modul pro extrakci textu, modul pro klasifikaci dokumentů a modul pro správu databáze. Jednotlivé moduly jsou v práci podrobně popsány, včetně jejich vzájemného propojení a možnosti jejich výměny za nové moduly, což přispívá k flexibilitě navrženého systému. Funkčnost aplikace byla ověřena simulací reálného používání, která testovala správnou komunikaci mezi jednotlivými moduly a jejich integraci do systému. Během testování bylo získáno a klasifikováno více než 10 tisíc dokumentů, a to bez výskytu závažných problémů, čímž byla potvrzena funkčnost navržené aplikace. | cs |
| dc.description.abstract | This master thesis focuses on the development of an application for the automated collection of documents from the Internet environment based on a user query. The classification of documents in relation to the user query is performed by semantic analysis using large language models. The theoretical part of the thesis presents large language models and their importance in text classification. In order to simplify and improve the efficiency of this process, an application with a modular architecture was designed. Aplication is composed of five interrelated modules: a module for optimizing the user query, a module for web search, a module for text extraction, a module for document classification and a module for database management. The individual modules are described in detail, including their interconnection and the possibility of replacing them with new modules, which contributes to the flexibility of the proposed system. The functionality of the application was verified by a real-use simulation, which tests the correct communication between the modules and their integration into the system. During the testing, more than 10 thousand documents were retrieved and classified without any major problems, which confirmed the functionality of the proposed application. | en |
| dc.format | 68 s. (107 551) | cs |
| dc.identifier.uri | https://dspace.tul.cz/handle/15240/176632 | |
| dc.language.iso | CS | cs |
| dc.subject | velké jazykové modely | cs |
| dc.subject | zpracování přirozeného jazyka | cs |
| dc.subject | sémantická analýza textu | cs |
| dc.subject | extrakce textu | cs |
| dc.subject | klasifikace textu | cs |
| dc.title | Selektivní získávání informací s využitím LLM | cs |
| dc.title | Selective information retrieval using LLM | en |
| dc.type | diplomová práce | cs |
| local.degree.abbreviation | Navazující | cs |
| local.identifier.author | M22000019 | cs |
| local.identifier.stag | 46361 | cs |
Files
Original bundle
1 - 5 of 5
Loading...
- Name:
- DP_Doanova.pdf
- Size:
- 712.84 KB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP ( 6.1.2025 20:23 )
Loading...
- Name:
- Přílohy_DP_Doanova.zip
- Size:
- 211.01 KB
- Format:
- Unknown data format
- Description:
- VŠKP - příloha ( 6.1.2025 20:23 )
Loading...
- Name:
- Doanová - posudek vedoucího.pdf
- Size:
- 578.14 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP ( 20.1.2025 13:50 )
Loading...
- Name:
- Doanová - posudek oponenta.pdf
- Size:
- 130.86 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP ( 20.1.2025 13:50 )
Loading...
- Name:
- ProtokolSPrubehemObhajobySTAG.pdf
- Size:
- 39.36 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby VŠKP ( 28.1.2025 14:08 )