Automatická sumarizace textových dokumentů

DSpace Repository

Show simple item record

dc.contributor.advisor Červa, Petr
dc.contributor.author Rott, Michal
dc.date 2012
dc.date.accessioned 2015-07-07
dc.date.available 2015-07-07
dc.date.issued 2012
dc.date.submitted 2011-10-01
dc.identifier.uri https://dspace.tul.cz/handle/15240/12037
dc.description katedra: ITE; přílohy: 1 DVD; rozsah: 52 cs
dc.description.abstract Dnešní svět je přehlcen informacemi a právě tato práce se snaží lidem usnadnit práci s informacemi vytvářením souhrnů těchto informací. V rámci výzkumu byly převážně z anglické literatury nastudovány metody vytvářející z rozsáhlých článků extrakty. Byly nastudovány sumarizační metody heuristické a statistické využívané v počátcích digitalizace textů, ale i moderní metody analyzující texty hlouběji. Hlavní pozornost byla věnována Luhnovu sumarizátoru a latentní sémantické analýze. Tyto metody byly také implementovány v jazyku C# na platformě Mono. Druhá část diplomové práce řeší problematiku evaluace implementovaných sumarizačních metod. Z literatury a vědeckých článků byly nastudovány techniky používané pro měření a hodnocení automaticky generovaných souhrnů. Pro vlastní provedení evaluace byl využit program ROUGE, využívaný pro tento účel i na konferencích Text Analysis Conference. V rámci evaluace bylo provedeno několik experimentů s různými nastaveními sumarizace a byly vyhodnoceny i volně dostupné sumarizátory. cs
dc.description.abstract Today's world is overloaded with information and this work is trying to help people work with information by creating summaries of this information. During the research has been staging method of producing extracts from large articles. Staging were summarization mehods heuristic and statistical used in the early days of text digitization and modern methods analyzing texts more deeply. The main attention was paid to Luhn summarizer and to method using latent semantic analysis. These methods were also implemented in C# on the Mono platform. The second part of the thesis deals with the issue summarizing the evaluation of implemented methods. From literature and scientific articles have been staging techniques used for measurement and evaluation of automatically generated summaries. For the actual performance evaluation program was used ROUGE, used for that purpose at conferences and Text Analysis Conference. The evaluation was carried out several experiments with different settings and summaries have been evaluated and freely available sumarizátory. en
dc.format text
dc.language.iso cs
dc.publisher Technická Univerzita v Liberci cs
dc.subject sumarizace cs
dc.subject souhrn cs
dc.subject luhnův sumarizátor cs
dc.subject latentní sémantická analýza cs
dc.subject evaluace cs
dc.subject rouge cs
dc.subject summarization en
dc.subject summary en
dc.subject luhn summarizer en
dc.subject latent semantic analysis en
dc.subject evaluation en
dc.subject rouge en
dc.title Automatická sumarizace textových dokumentů cs
dc.title.alternative Automatic summarization of text documents en
dc.type Thesis
dc.degree.level mgr cs
dc.date.defense 2012-06-20
dc.date.committed 2012-05-18
local.faculty Fakulta mechatroniky, informatiky a mezioborových studií cs
local.department ITE cs
local.identifier.stag 23169
local.note.administrators oprava_A
local.identifier.verbis kpw06463501
dc.subject.verbis počítačové systémy cs
dc.subject.verbis computer systems en
dc.subject.verbis text documents en
dc.subject.verbis textové dokumenty cs
local.verbis.aktualizace 2019-10-05 07:28:47 cs
local.verbis.studijniprogram ITE Elektrotechnika a informatika/Informační technologie cs


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace

Advanced Search

Browse

My Account