Využití algoritmů dataminingu pro rozpoznávání pojmenovaných entit
| dc.contributor | Řimnáč Martin, Ing. Ph.D. | |
| dc.contributor.advisor | Tyl Pavel, Ing. | |
| dc.contributor.author | Houžvička, Vojtěch | |
| dc.contributor.other | Skolitel : 54889 Fárek Jiří, prof. Ing. CSc. | |
| dc.contributor.other | Konzultant : 61573 Balvín Aleš, Ing. | |
| dc.contributor.other | Konzultant2 : 57953 Králová Radka, Ing. | |
| dc.date | 2015 | |
| dc.date.accessioned | 2018-05-03 | |
| dc.date.available | 2018-05-03 | |
| dc.date.committed | 2015-05-15 | |
| dc.date.defense | 2015-06-16 | |
| dc.date.issued | 2015-06-16 | |
| dc.date.submitted | 2014-10-10 | |
| dc.date.updated | 24.6.2016 17:13 | |
| dc.degree.level | Ing. | |
| dc.description.abstract | Tato práce se zabývá vyhledáváním pojmenovaných entit v textu pomocí dataminingových algoritmů a jejím cílem je navrhnout nástroj, který by tento problém řešil. Součástí práce je rešerše existujících nástrojů a algoritmů, které se danou problematikou zabývají.Dále byl navržen a implementován nástroj, který využívá několik dataminingových algoritmů zároveň a kombinuje tak jejich výhody. Konkrétní algoritmy jsou realizovány pomocí externích knihoven a výsledky vyhledávání jednotlivých algoritmů jsou sloučeny pomocí vlastní navržené metody. Tato metoda bere v potaz předchozí úspěšnost nástrojů a vybírá ze všech výsledků ten nejvíce pravděpodobný. Práce také popisuje vytvoření datového modelu pro naučení nástroje. Pomocí vlastního modelu lze nástroj použít nad libovolnou doménou dat. Celý nástroj je uzpůsobený na vyhledávání entit v českém jazyce. V závěru práce je nástroj na vytvořeném datovém modelu otestován pomocí přesnosti a úplnosti. | cs |
| dc.description.abstract | This thesis concerns itself with named entity recognition and use of data mining algorithms for this purpose. Its main objective is to design and implement a tool, that solves the problem of named entity recognition. This thesis contains research of existing tools for named entity recognition and research of data mining algorithms.A new tool for named entity recognition was designed and implemented. This tool combines several data mining algorithms and dictionary method and takes advantage of their strong points by merging their results using own designed method. Each algorithm is implemented by external tool. The method for results merging uses previous precision of included tools to determine most probable results. The thesis also covers the topic of creating own training data set. The tool was trained and tested using data set created within the diploma thesis. | en |
| dc.description.mark | ||
| dc.format | 48 s. (60 000 znaků) | |
| dc.format.extent | Ilustrace, Schémata -ROM 1 ROM | |
| dc.identifier.uri | https://dspace.tul.cz/handle/15240/24523 | |
| dc.language.iso | cs | |
| dc.relation.isbasedon | begin*arab* renewcommand*labelenumi**[arabic*enumi*]* item ŠEŠERA, L. - MIČOVSKÝ, A. - ČERVEŇ, J.: Datové modelování v příkladech. Grada Publishing, Praha, 2001. ISBN 80-247-0049-2. item KNUTH, Donald Ervin: Umění programovat. Computer Press, Praha, 2008. ISBN 80-251-2025-2. item PARR-RUD, Olivia: Datamining. Computer Press, Praha, 2001. ISBN 80-722-6577-6. item Message Understanding Conference (MUC) Proceedings. Online: http://www-nlpir.nist.gov/related_projects/muc. end*arab* | |
| dc.rights | Vysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26 | cs |
| dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26 | en |
| dc.rights.uri | https://knihovna.tul.cz/document/26 | |
| dc.rights.uri | https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf | |
| dc.subject | Vyhledávání pojmenovaných entit | cs |
| dc.subject | datamining | cs |
| dc.subject | dolování dat | cs |
| dc.subject | strojové učení | cs |
| dc.subject | extrakce informace | cs |
| dc.subject | algoritmy dataminingu | cs |
| dc.subject | morfologická analýza | cs |
| dc.subject | pojmenovaná entita | cs |
| dc.subject | Named entity recognition | en |
| dc.subject | data mining | en |
| dc.subject | machine learning | en |
| dc.subject | information extraction | en |
| dc.subject | data mining algorithms | en |
| dc.subject | morphological analysis | en |
| dc.subject | named entity | en |
| dc.subject.verbis | algoritmy (programování) | cs |
| dc.subject.verbis | DATAMIN (software) | en |
| dc.subject.verbis | DATAMIN (software) | cs |
| dc.subject.verbis | computer algorithms | en |
| dc.title | Využití algoritmů dataminingu pro rozpoznávání pojmenovaných entit | cs |
| dc.title | Datamining algorithms for named entity recognition | en |
| dc.title.alternative | cs | |
| dc.type | diplomová práce | cs |
| local.degree.discipline | IT-N | |
| local.degree.programme | Elektrotechnika a informatika | |
| local.degree.programmeabbreviation | N2612 | |
| local.department.abbreviation | MTI | |
| local.faculty | Fakulta mechatroniky, informatiky a mezioborových studií | cs |
| local.faculty.abbreviation | FM | |
| local.identifier.stag | 31365 | |
| local.identifier.verbis | 485638 | |
| local.note.administrators | automat | |
| local.verbis.aktualizace | 2019-26-05 05:26:28 | cs |
| local.verbis.studijniprogram | MTI Elektrotechnika a informatika/Informační technologie | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- DP_Houzvicka_Vojtech.pdf
- Size:
- 5.15 MB
- Format:
- Adobe Portable Document Format
- Description:
- VSKP
Loading...
- Name:
- Houzvicka_VP.pdf
- Size:
- 541.19 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_vedouciho_VSKP
Loading...
- Name:
- Houzvicka_OP.pdf
- Size:
- 492.24 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_oponenta_VSKP
Loading...
- Name:
- Houzvicka.pdf
- Size:
- 14.28 MB
- Format:
- Adobe Portable Document Format
- Description:
- Prubeh_obhajoby_VSKP