Shlukování výsledků vyhledávání

Title Alternative:Clustering of search results
Loading...
Thumbnail Image
Date
2013-12-20
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Automatická klasifikace dat bez znalosti vnitřní struktury, především pak dat textových, prochází neustálým vývojem, jelikož se stále objevují nové a nové výzvy, se kterým je potřeba se vypořádat. Tato práce se snaží snaží zmapovat problematiku vyhledávání informací a vybrat vhodné algoritmy pro shlukování výsledků vyhledávání. Shlukování nikdy nestojí v dokumentografických systémech samostatně, vždy je velmi těsně napojeno na ostatní procesy systému. Proto se práce snaží odkrýt pozadí takových procesů a jejich vzájemné vztahy. Začíná problematikou vyhledávání, mapuje datové struktury a informuje o výzvách na poli vyhledávacích strojů. Další kapitola rozebírá shlukování obecně, představuje základní algoritmy rozdělené do kategorií od tradičních po nově vzniklé a speciální význam klade právě tématu shlukování výsledků vyhledávání. Ve druhé části práce informuje o implementaci vybraných shlukovacích algoritmů a výsledcích jejich testování. Popisuje hlavní metody vytvořených aplikací. Pokračuje způsobem provádění testů a vizualizací výstupů z programů. Vyhodnocení experimentů se shlukovacími algoritmy nabízí relativně překvapivé výsledky.
Automatic classification of data, especially textual data, without knowing its inner structure evolves continually because there are new and new challenges appearing that are necessary to deal with. This work tries to map information retrieval problems and to choose suitable algorithms for clustering of search results. Clustering never stands separately in documentographic systems as it is always in a tight cooperation with other processes in the system. That is why this work tries to disclose the background of those processes and their relationships. It starts with data retrieval problems, maps data structures and informs about challenges related to search engines. Next chapter analyze clustering in general, it presents basic algorithms divided into categories, it goes from traditional to recently developed and it puts the special accent on the clustering of search results topic. The second part of the work informs about an implementation of selected clustering algorithms and about its testing results. It describes main methods of the developed applications. Then it explains the way of testing and visualisation output of the programs. Evaluation of experiments with clustering algorithms shows relatively surprising results.
Description
katedra: NTI; přílohy: 1 CD-ROM; rozsah: 46
Subject(s)
Citation
ISSN
ISBN