Automatická sumarizace textových dokumentů

Title Alternative:Automatic summarization of text documents
dc.contributor.advisorČerva, Petr
dc.contributor.authorRott, Michal
dc.date2012
dc.date.accessioned2015-07-07
dc.date.available2015-07-07
dc.date.committed2012-05-18
dc.date.defense2012-06-20
dc.date.issued2012
dc.date.submitted2011-10-01
dc.degree.levelmgrcs
dc.descriptionkatedra: ITE; přílohy: 1 DVD; rozsah: 52cs
dc.description.abstractDnešní svět je přehlcen informacemi a právě tato práce se snaží lidem usnadnit práci s informacemi vytvářením souhrnů těchto informací. V rámci výzkumu byly převážně z anglické literatury nastudovány metody vytvářející z rozsáhlých článků extrakty. Byly nastudovány sumarizační metody heuristické a statistické využívané v počátcích digitalizace textů, ale i moderní metody analyzující texty hlouběji. Hlavní pozornost byla věnována Luhnovu sumarizátoru a latentní sémantické analýze. Tyto metody byly také implementovány v jazyku C# na platformě Mono. Druhá část diplomové práce řeší problematiku evaluace implementovaných sumarizačních metod. Z literatury a vědeckých článků byly nastudovány techniky používané pro měření a hodnocení automaticky generovaných souhrnů. Pro vlastní provedení evaluace byl využit program ROUGE, využívaný pro tento účel i na konferencích Text Analysis Conference. V rámci evaluace bylo provedeno několik experimentů s různými nastaveními sumarizace a byly vyhodnoceny i volně dostupné sumarizátory.cs
dc.description.abstractToday's world is overloaded with information and this work is trying to help people work with information by creating summaries of this information. During the research has been staging method of producing extracts from large articles. Staging were summarization mehods heuristic and statistical used in the early days of text digitization and modern methods analyzing texts more deeply. The main attention was paid to Luhn summarizer and to method using latent semantic analysis. These methods were also implemented in C# on the Mono platform. The second part of the thesis deals with the issue summarizing the evaluation of implemented methods. From literature and scientific articles have been staging techniques used for measurement and evaluation of automatically generated summaries. For the actual performance evaluation program was used ROUGE, used for that purpose at conferences and Text Analysis Conference. The evaluation was carried out several experiments with different settings and summaries have been evaluated and freely available sumarizátory.en
dc.formattext
dc.identifier.urihttps://dspace.tul.cz/handle/15240/12037
dc.language.isocs
dc.publisherTechnická Univerzita v Libercics
dc.subjectsumarizacecs
dc.subjectsouhrncs
dc.subjectluhnův sumarizátorcs
dc.subjectlatentní sémantická analýzacs
dc.subjectevaluacecs
dc.subjectrougecs
dc.subjectsummarizationen
dc.subjectsummaryen
dc.subjectluhn summarizeren
dc.subjectlatent semantic analysisen
dc.subjectevaluationen
dc.subjectrougeen
dc.subject.verbistextové dokumentycs
dc.titleAutomatická sumarizace textových dokumentůcs
dc.title.alternativeAutomatic summarization of text documentsen
dc.typeThesis
local.departmentITEcs
local.facultyFakulta mechatroniky, informatiky a mezioborových studiícs
local.identifier.stag23169
local.identifier.verbiskpw06463501
local.note.administratorsoprava_A
local.verbis.aktualizace2019-10-05 07:28:47cs
local.verbis.studijniprogramITE Elektrotechnika a informatika/Informační technologiecs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
mgr_23169.pdf
Size:
774.43 KB
Format:
Adobe Portable Document Format
Description:
kvalifikační práce
Loading...
Thumbnail Image
Name:
opo_23169.pdf
Size:
27.31 KB
Format:
Adobe Portable Document Format
Description:
posudek oponenta
Loading...
Thumbnail Image
Name:
ved_23169.pdf
Size:
27.31 KB
Format:
Adobe Portable Document Format
Description:
posudek vedoucího
Loading...
Thumbnail Image
Name:
obh_23169.pdf
Size:
27.31 KB
Format:
Adobe Portable Document Format
Description:
výsledek obhajoby