Identifikace autorství textu pomocí jazykových modelů

dc.contributor.advisorKynych František, Ing. :67735cs
dc.contributor.authorHák, Robertcs
dc.contributor.refereeVosecký Lukáš, Ing. :68815cs
dc.date.accessioned2024-12-16T04:31:56Z
dc.date.available2024-12-16T04:31:56Z
dc.date.committed14.5.2024cs
dc.date.defense11.6.2024cs
dc.date.issued2024-06-11
dc.date.submitted20.10.2023cs
dc.description.abstractTato bakalářská práce se zaměřuje na identifikaci a ověření autorství textu s využitím jazykových modelů. Cílem práce je prozkoumat schopnosti různých jazykových modelů, jako jsou GPT, BERT, distilBERT a roBERTa, nejen v přisuzování autorství, ale také v ověřování pravosti autora textů. Práce představuje teoretické základy jazykových modelů a metod identifikace a ověření autorství. Dále je zkoumána a porovnána jejich efektivita a přesnost na základě imdb62 datasetu textů od různých autorů. V praktické části jsou implementovány vybrané jazykové modely a jejich schopnosti jsou ověřeny na testovacích datech. Výsledky práce ukazují potenciál i omezení jazykových modelů v kontextu identifikace a ověření autorství a nastiňují možnosti dalšího výzkumu v této oblasti.cs
dc.description.abstractThis bachelor's thesis focuses on authorship identification and verification using language models. The objective is to explore the capabilities of various language models, such as GPT and BERT, distilBERT and roBERTa, not only in attributing authorship but also in verifying the authenticity of authors. The thesis introduces the theoretical foundations of language models and methods for authorship identification and verification. It then examines and compares their effectiveness and accuracy using the imdb62 dataset of texts from various authors. In the practical section, a selected language models are implemented, and their abilities are tested on sample data. The findings demonstrate the potential and limitations of language models in the context of authorship identification and verification, outlining possibilities for further research in this field. These revisions better reflect the dual focus on identification and verification, giving a comprehensive overview of the thesis's scope.en
dc.format47cs
dc.identifier.urihttps://dspace.tul.cz/handle/15240/175791
dc.language.isoCScs
dc.subjectAnalýza textucs
dc.subjectBERTcs
dc.subjectGPTcs
dc.subjectIdentifikace autor- stvícs
dc.subjectJazykové modelycs
dc.subjectOvěření autorstvícs
dc.subjectStrojové učenícs
dc.subjectUmělá inteligencecs
dc.subjectZpracování přirozeného jazykacs
dc.titleIdentifikace autorství textu pomocí jazykových modelůcs
dc.titleIdentifying text authorship using language modelsen
dc.typediplomová prácecs
local.degree.abbreviationBakalářskýcs
local.identifier.authorM21000107cs
local.identifier.stag46545cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
BP_hak.pdf
Size:
768.72 KB
Format:
Adobe Portable Document Format
Description:
VŠKP ( 15.5.2024 10:36 )
Loading...
Thumbnail Image
Name:
BP_Robert Hák_oponent.pdf
Size:
770.18 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP ( 28.5.2024 10:28 )
Loading...
Thumbnail Image
Name:
BP_Robert Hák_vedoucí.pdf
Size:
862.93 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP ( 28.5.2024 10:31 )
Loading...
Thumbnail Image
Name:
ProtokolSPrubehemObhajobySTAG.pdf
Size:
39.1 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP ( 11.6.2024 13:08 )