Automatický generátor textu

Title Alternative:Automatic text generator
Loading...
Thumbnail Image
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
The goal of this thesis was to create a web application, that should be able to publish automatically generated random articles. The application looks like a webblog written by a human writer. To achieve this goal, it was necessary to use linguistic analysis methods and also a processing from the information technologies field. The main part of this thesis is parsing articles about the "Generative art". A context-free grammar is generated from these text data and from gathered informations. This grammar is used for automatic generation of random articles. Grammar should be updated countinously, therefore a semi-automatic text crawler is also part of this job. Python programming language and the NLTK library (Natural language Toolkit) were used to create the application. All the parts of this program were integrated into a web application using the Django framework.
Cílem této diplomové práce bylo vytvořit webovou aplikaci, která bude automaticky publikovat texty v anglickém jazyce, skládající se z náhodně generovaných vět. Aplikace se měla tvářit jako webový blog, na kterém nebude na první pohled patrné, že je generován automaticky, bez zásahu člověka. K dosažení cíle bylo nutné využít především metod lingvistické analýzy, ale i dalších prostředků z oblasti informatiky. Hlavní částí této práce je analýza textů na téma Generativní umění. Z těchto textů a informací získaných z jejich jazykového rozboru je následně sestavována gramatika, jenž slouží pro automatické generování náhodně sestavených vět. Tato gramatika se musí neustále vyvíjet, proto webová aplikace obsahuje také poloautomatický kolektor dat, který prochází internet, sbírá texty a po kontrole je analyzuje, archivuje a zařazuje do gramatiky. Po technické stránce bylo pro tuto aplikaci využito programovacího jazyka Python a knihovny NLTK (Natural Language Tool Kit), která slouží právě k operacím s lidským jazykem ? klasifikaci, rozbor a sémantickou analýzu. Ke sloučení všech částí práce do webového rozhraní bylo využito frameworku Django.
Description
katedra: NTI; přílohy: 1 CD ROM; rozsah: 66 s.
Subject(s)
automatic text generator, python, django framework, linguistic analysis, context-free grammar, automatický generátor textu, python, django framework, lingvistická analýza, bezkontextová gramatika
Citation
ISSN
ISBN