Efektivní hashování spamů

Title Alternative:Efective spam hashing
Loading...
Thumbnail Image
Date
2013-12-27
Journal Title
Journal ISSN
Volume Title
Publisher
Technická Univerzita v Liberci
Abstract
Hlavní náplní práce je analýza spamu a návrh a implementace aplikace v jazyce C, která bude detekovat spam za pomoci hashovacích funkcí. Na základě provedené analýzy je navržena normalizace emailových zpráv, tak aby spamy se stejným informačním sdělením měly po zhasování stejný otisk. Normalizace je provedena vynecháním a náhradou některých znaků z emailu. Z takto normalizovaného emailu se pomocí hashovací funkce vypočítá jeho otisk. Tento otisk se poté porovná s databází otisků známých spamů a zjistí se na kolik procent je tento email spam. Výsledná aplikace byla testována na zkušebním vzorku spamu. Podle výsledků odhalila o padesát dva procent více duplicit než aplikace, která vynechávala pouze hlavičky.
The main subject matter of this thesis is a spam analysis and proposal and implementation of application in language C, which will detect spam with the help of hash function. Standardization of email messages is designed on the basis of analysis made in order that spams with the same information notification have the same hash after hashing. The standardization is made by leaving out and replacing some of email signs. The hash is counted with the aid of hashing function from the standardized email. This hash is compared with hash database of well-known spam and it is determined with what probability in percentage is this email spam. The application was tested on a test sample of spam. According to the results revealed the fifty-two percent more duplication than the applications, which only skiped headers.
Description
katedra: NTI; přílohy: 1x CD ROM text - zdrojové kódy; rozsah: 50 s
Subject(s)
spam, hash, detektor, spam, hash, detector
Citation
ISSN
ISBN