Systém pro vyhledávání konferenčních publikací

Abstract
Tato bakalářská práce se zabývá extrakcí dat z konferenčních publikací od roku 1997 po rok 2015 a následně v těchto získaných datech i vyhledávat pomocí fulltextových operátorů. V rámci toho byl vytvořen program, který dokáže vytvořit XML šablony z PDF a HTML souborů a podle kritérií v nich vyhledávat. Práce je rozdělena na dvě důležité části.První část práce se zabývá teoretickým vymezením pojmů, které úzce souvisí s danou problematikou. Jsou definovány pojmy jako konference, WPF technologie, indexování. Zabývá se také tříděním získaných dat z mezinárodních konferencí podle daných kritérií či full-textového vyhledávání v publikacích.Druhá část je tvořena samotnou realizací. První fáze této části spočívala v přečtení převážně PDF souborů a u některých starších publikací HTML souborů. Proto byly hledány knihovny, které by s tímto formátem uměly jednoduše pracovat a byly implementovány v jazyku C# nebo alespoň na něj měly port. V druhé fázi bylo potřeba nalézt řešení pro full-textové vyhledávání, které by bylo rychlé a spolehlivé, popřípadě umožňovalo i další rozšíření do budoucna.
This bachelor thesis deals with extracted data from publication of conference from year 1997 to year 2015 and also in these obtained data searches for usage of fulltext operators. For this purpose was created an application, which is able to make XML template from PDF and HTML files and then search through according to criteria in them. The work is divided into two main parts.First part of this thesis contains definition terms, which are closely related to this problem. There are defined terms as conference, WPF technology and indexing. It also engages in sort of gain data from international conferences according to criteria or fulltext searching.Second essential part is the creation of application itself. First phase is based mostly on reading PDF files and HTML files in some cases. That's the reason, why was necessary looked for some libraries, which can simply work with this format and also were implemented in C# language or at least have port on it. In second stage was needed to find solution for fulltext searching, which would be fast and reliable, alternatively enables other extension in future.
Description
Subject(s)
C#, databázový program, full-textové vyhledávání, PDF, WPF technologie, C#, database program, full-text searching, PDF, WPF technologie
Citation
ISSN
ISBN