Využití algoritmů dataminingu pro rozpoznávání pojmenovaných entit

dc.contributorŘimnáč Martin, Ing. Ph.D.
dc.contributor.advisorTyl Pavel, Ing.
dc.contributor.authorHoužvička, Vojtěch
dc.contributor.otherSkolitel : 54889 Fárek Jiří, prof. Ing. CSc.
dc.contributor.otherKonzultant : 61573 Balvín Aleš, Ing.
dc.contributor.otherKonzultant2 : 57953 Králová Radka, Ing.
dc.date2015
dc.date.accessioned2018-05-03
dc.date.available2018-05-03
dc.date.committed2015-05-15
dc.date.defense2015-06-16
dc.date.issued2015-06-16
dc.date.submitted2014-10-10
dc.date.updated24.6.2016 17:13
dc.degree.levelIng.
dc.description.abstractTato práce se zabývá vyhledáváním pojmenovaných entit v textu pomocí dataminingových algoritmů a jejím cílem je navrhnout nástroj, který by tento problém řešil. Součástí práce je rešerše existujících nástrojů a algoritmů, které se danou problematikou zabývají.Dále byl navržen a implementován nástroj, který využívá několik dataminingových algoritmů zároveň a kombinuje tak jejich výhody. Konkrétní algoritmy jsou realizovány pomocí externích knihoven a výsledky vyhledávání jednotlivých algoritmů jsou sloučeny pomocí vlastní navržené metody. Tato metoda bere v potaz předchozí úspěšnost nástrojů a vybírá ze všech výsledků ten nejvíce pravděpodobný. Práce také popisuje vytvoření datového modelu pro naučení nástroje. Pomocí vlastního modelu lze nástroj použít nad libovolnou doménou dat. Celý nástroj je uzpůsobený na vyhledávání entit v českém jazyce. V závěru práce je nástroj na vytvořeném datovém modelu otestován pomocí přesnosti a úplnosti.cs
dc.description.abstractThis thesis concerns itself with named entity recognition and use of data mining algorithms for this purpose. Its main objective is to design and implement a tool, that solves the problem of named entity recognition. This thesis contains research of existing tools for named entity recognition and research of data mining algorithms.A new tool for named entity recognition was designed and implemented. This tool combines several data mining algorithms and dictionary method and takes advantage of their strong points by merging their results using own designed method. Each algorithm is implemented by external tool. The method for results merging uses previous precision of included tools to determine most probable results. The thesis also covers the topic of creating own training data set. The tool was trained and tested using data set created within the diploma thesis.en
dc.description.mark
dc.format48 s. (60 000 znaků)
dc.format.extentIlustrace, Schémata -ROM 1 ROM
dc.identifier.urihttps://dspace.tul.cz/handle/15240/24523
dc.language.isocs
dc.relation.isbasedonbegin*arab* renewcommand*labelenumi**[arabic*enumi*]* item ŠEŠERA, L. - MIČOVSKÝ, A. - ČERVEŇ, J.: Datové modelování v příkladech. Grada Publishing, Praha, 2001. ISBN 80-247-0049-2. item KNUTH, Donald Ervin: Umění programovat. Computer Press, Praha, 2008. ISBN 80-251-2025-2. item PARR-RUD, Olivia: Datamining. Computer Press, Praha, 2001. ISBN 80-722-6577-6. item Message Understanding Conference (MUC) Proceedings. Online: http://www-nlpir.nist.gov/related_projects/muc. end*arab*
dc.rightsVysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26cs
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26en
dc.rights.urihttps://knihovna.tul.cz/document/26
dc.rights.urihttps://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf
dc.subjectVyhledávání pojmenovaných entitcs
dc.subjectdataminingcs
dc.subjectdolování datcs
dc.subjectstrojové učenícs
dc.subjectextrakce informacecs
dc.subjectalgoritmy dataminingucs
dc.subjectmorfologická analýzacs
dc.subjectpojmenovaná entitacs
dc.subjectNamed entity recognitionen
dc.subjectdata miningen
dc.subjectmachine learningen
dc.subjectinformation extractionen
dc.subjectdata mining algorithmsen
dc.subjectmorphological analysisen
dc.subjectnamed entityen
dc.subject.verbisalgoritmy (programování)cs
dc.subject.verbisDATAMIN (software)en
dc.subject.verbisDATAMIN (software)cs
dc.subject.verbiscomputer algorithmsen
dc.titleVyužití algoritmů dataminingu pro rozpoznávání pojmenovaných entitcs
dc.titleDatamining algorithms for named entity recognitionen
dc.title.alternativecs
dc.typediplomová prácecs
local.degree.disciplineIT-N
local.degree.programmeElektrotechnika a informatika
local.degree.programmeabbreviationN2612
local.department.abbreviationMTI
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.faculty.abbreviationFM
local.identifier.stag31365
local.identifier.verbis485638
local.note.administratorsautomat
local.verbis.aktualizace2019-26-05 05:26:28cs
local.verbis.studijniprogramMTI Elektrotechnika a informatika/Informační technologiecs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
DP_Houzvicka_Vojtech.pdf
Size:
5.15 MB
Format:
Adobe Portable Document Format
Description:
VSKP
Loading...
Thumbnail Image
Name:
Houzvicka_VP.pdf
Size:
541.19 KB
Format:
Adobe Portable Document Format
Description:
Posudek_vedouciho_VSKP
Loading...
Thumbnail Image
Name:
Houzvicka_OP.pdf
Size:
492.24 KB
Format:
Adobe Portable Document Format
Description:
Posudek_oponenta_VSKP
Loading...
Thumbnail Image
Name:
Houzvicka.pdf
Size:
14.28 MB
Format:
Adobe Portable Document Format
Description:
Prubeh_obhajoby_VSKP