Doučování velkých jazykových modelů za účelem sémantického vyhledávání v produktové dokumentaci

dc.contributor.advisorHenyš Petr, doc. Ing. Ph.D. :62628cs
dc.contributor.authorŠíma, Petrcs
dc.contributor.otherKovalenko Iaroslav, Ing. Ph.D. :63985cs
dc.contributor.refereeHefka Lukáš, Ing. :69592cs
dc.date.accessioned2025-07-14T17:20:27Z
dc.date.available2025-07-14T17:20:27Z
dc.date.committed9.5.2025cs
dc.date.defense10.6.2025cs
dc.date.issued2025-06-10cs
dc.date.submitted25.10.2024cs
dc.description.abstractTato práce je zaměřena na návrh a ověření funkcionalit dílčích částí systému sémantického vyhledávače s využitím velkého jazykového modelu. Teoretická část se zpočátku zaměřuje na princip sémantického vyhledávání a využití modelu v kontextu firemních aplikací. Dále se zde nachází popis funkce modelů, jejich architektury a implementaci v systému vyhledávání. Pozornost je věnována možnostem doučení modelů, obzvláště metodice parametricky efektivního doučení (Parameter Efficient Fine-Tuning). Tato metoda je klíčová pro přizpůsobení modelu specifickým potřebám, ale také vzhledem k omezeným zdrojům. Praktická část práce zahrnuje přípravu specifických dat, implementaci procesu sémantického vyhledávání a popis postupu doučení modelu. Cílem bylo zlepšit schopnost modelu porozumět technické dokumentaci a jejím specifickým nuancím. Důraz byl kladen na zpracování firemních dat v on-premise prostředí a možnost nasazení doučeného modelu na privátních zařízeních. Závěr práce shrnuje dosažené výsledky, porovnává výkon různých variant modelů a poskytuje doporučení pro jejich praktické nasazení v systémech sémantického vyhledávání.cs
dc.description.abstractThis thesis focuses on the design and validation of the functionalities of individual components within a semantic search system utilizing a large language model. The theoretical part initially explores the principles of semantic search and the application of language models in corporate environments. It also describes the architecture and functioning of these models, along with their integration into search systems. Particular attention is given to fine-tuning techniques, especially Parameter-Efficient Fine-Tuning (PEFT), which is essential for adapting models to domain-specific requirements under resource constraints. The practical part includes the preparation of custom datasets, the implementation of the semantic search process, and explanation of the fine-tuning workflow. The goal was to improve the model's ability to comprehend technical documentation and its specific nuances. Emphasis was placed on handling corporate data in an on-premise environment and enabling deployment of the fine-tuned model on private infrastructure. The thesis concludes by summarizing achieved results, comparing the performance of different model variants, and providing recommendations for their practical use in semantic search systems.en
dc.format47 s. (64400 znaků)cs
dc.identifier.urihttps://dspace.tul.cz/handle/15240/177342
dc.language.isoCScs
dc.subjectsémantické vyhledávánícs
dc.subjectvelké jazykové modelycs
dc.subjectdoučovánícs
dc.subjecton-premise řešenícs
dc.titleDoučování velkých jazykových modelů za účelem sémantického vyhledávání v produktové dokumentacics
dc.titleTutoring large language models for semantic search in product documentationen
dc.typediplomová prácecs
local.degree.abbreviationNavazujícícs
local.identifier.authorM23000158cs
local.identifier.stag47951cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
Diplomova_prace_Sima.pdf
Size:
1.88 MB
Format:
Adobe Portable Document Format
Description:
VŠKP ( 9.5.2025 16:11 )
Loading...
Thumbnail Image
Name:
Šíma_posudek vedoucího.pdf
Size:
186.61 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP ( 3.6.2025 9:31 )
Loading...
Thumbnail Image
Name:
Šíma_posudek oponenta.pdf
Size:
98.77 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP ( 3.6.2025 9:55 )
Loading...
Thumbnail Image
Name:
ProtokolSPrubehemObhajobySTAG.pdf
Size:
45.27 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP ( 11.6.2025 8:27 )