Distribuovaný web crawler

DSpace Repository

Show simple item record

dc.contributor.advisor Vraný, Jiří
dc.contributor.author Novák, Ondřej
dc.date 2011
dc.date.accessioned 2015-06-30
dc.date.available 2015-06-30
dc.date.issued 2011
dc.date.submitted 2010-10-15
dc.identifier.uri https://dspace.tul.cz/handle/15240/10416
dc.description katedra: NTI; přílohy: CD ROM; rozsah: 67 s. cs
dc.description.abstract Broad web search engines as well as other specialized tools used for data retrieval from the WWW use web crawlers to create large collections of web pages. This thesis deals with the creation of distributed web crawler. In the first part of the thesis the architecture of distributed Web crawler is created. Emphasis is placed on the issue of creating distributed applications and their management. The second part describes the developed distributed Web crawler and applied technologies. The basis of the application is multithreaded URL server that manages distributed web crawlers to client computers. Client / server communication is based on SOAP and file transfers provides an FTP server. Finally the possibilities of developed distributed web crawler are be presented in a few tests and the user manual is included. en
dc.description.abstract Webové prohlížeče, stejně jako další specializované nástroje pro získávání dat z WWW, používají web crawlery k vytváření rozsáhlých kolekcí webových stránek. Diplomová práce se zabývá vytvořením distribuovaného web crawleru. První částí práce je návrh architektury distribuovaného web crawleru. Důraz je kladen na problematiku tvorby distribuovaných aplikací a jejich řízení. Ve druhé části práce je popsán vytvořený distribuovaný web crawler a použité technologie. Základem aplikace je vícevláknový URL server řídící web crawlery distribuované na klientských počítačích. Klient / server komunikace je řešena pomocí SOAP protokolu a o přenos souborů se stará FTP server. V závěru práce jsou provedeny testy demonstrující schopnosti distribuovaného web crawleru a je vytvořen obslužný manuál. cs
dc.format text
dc.language.iso cs
dc.publisher Technická Univerzita v Liberci cs
dc.subject distributed computing en
dc.subject python en
dc.subject soap en
dc.subject multithreading en
dc.subject web crawler en
dc.subject web services en
dc.subject world wide web en
dc.subject distribuované programování cs
dc.subject python cs
dc.subject soap cs
dc.subject více-vláknové programování cs
dc.subject web crawler cs
dc.subject webové služby cs
dc.subject world wide web cs
dc.title Distribuovaný web crawler cs
dc.title.alternative Distributed webcrawler en
dc.type Thesis
dc.degree.level mgr cs
dc.date.defense 2011-06-20
dc.date.committed 2011-05-20
local.faculty Fakulta mechatroniky, informatiky a mezioborových studií cs
local.department NTI cs
local.identifier.stag 18227
local.note.administrators oprava_A
local.identifier.verbis 451372
dc.subject.verbis programming en
dc.subject.verbis web services en
dc.subject.verbis World Wide Web en
dc.subject.verbis WWW služby cs
dc.subject.verbis informační technologie cs
dc.subject.verbis programování cs
dc.subject.verbis World Wide Web cs
dc.subject.verbis information technology en
local.verbis.aktualizace 2019-10-05 06:11:58 cs
local.verbis.studijniprogram NTI Elektrotechnika a informatika/Informační technologie cs


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace

Advanced Search

Browse

My Account