Browsing by Author "Kozdeba, Václav"
Now showing 1 - 3 of 3
Results Per Page
Sort Options
- ItemPříspěvek data miningových metod k eliminaci podvodného jednání klientů bank(Technická Univerzita v Liberci, 2014) Kozdeba, Václav; Císařová, KláraPředmětem bakalářské práce je seznámení se s oborem data mining, metodologiemi data miningu, porovnáním data miningu se statistikou a s programem IBM SPSS Modelerem. Dále je práce věnována vývoji programu, který pomáhá porozumět hierarchickému shlukování centroidní metodou. Program bude sloužit jako podpora pro výuku data miningových algoritmů. Nakonec je vytvořena případová studie, která na praktické úloze ukazuje použití data miningových postupů při odhalování podvodného jednání klientů bank a studie je upravena pro nový e-learningový předmět Data mining. V teoretické části práce je popsáno, co znamená samotný pojem data mining a jaká je historie vzniku daného oboru. Dále je popsáno porovnání mezi data miningem a statistikou z pohledu používaných dat a jejich rozdělení. Posledním bodem v teoretické části jsou metodologie data miningu, jedná se o metodologie 5A, SEMMA a CRISP-DM. Metodologie CRISP-DM je popsána více, protože je využívána v programu IBM SPSS Modeler. V praktické části práce jsou detailněji popsané dva konkrétní modelovací uzly (K-Means a TwoStep) IBM SPSS Modeleru k e-podpoře nového předmětu Data mining. Pro tyto dva konkrétní modelovací uzly je také vytvořena případová studie, která bude sloužit jako názorná pomůcka při výuce, obsahující vzorový příklad možného odhalení podvodného jednání a postup při jeho řešení. V další části práce je popsáno hierarchické shlukování centroidní metodou a tato metoda je vizualizována výukovým programem, který bude studentům sloužit k jednoduchému experimentu ve 2D pro lepší pochopení vybraného způsobu shlukování.
- ItemShluková analýza v data miningových úloháchKozdeba, VáclavPráce je příspěvkem ke kolekci vzdělávacích e-learningových materiálů pro předměty, které se věnují data miningovým postupům. Teoretická část shrnuje vybrané problémy shlukové analýzy, která je zásadní pro část data miningových úloh. V práci jsou shrnuté problémy spojené s předzpracováním vstupních kvalitativních i kvantitativních dat pro shlukové algoritmy. Dále jsou analyzované vybrané postupy shlukování a posouzení kvality shlukovacího procesu.Výsledkem práce je výukový program MyCluster pro popsané algoritmy, který studentům umožňuje experimentovat s daty, které si sami interaktivně vytvoří. Použít lze i datové množiny dříve vytvořené. K dispozici jsou metody nejbližšího souseda, nejvzdálenějšího souseda, centroidní metoda a metoda K-means a několik volitelných metrik. Student může sledovat důsledky volby jednotlivých parametrů a lépe pochopit principy sledováním animace shlukovacího procesu. Kvalitu shlukovacího procesu pak ilustruje funkcionál kvality, který lze sledovat v souvislostech několika pokusů v historii pokusů. Aplikace byla v průběhu vývoje testována studenty Technické univerzity v Liberci a na základě jejich doporučení byla upravena do finální podoby. Aplikace MyCluster byla naprogramována pomocí programovacího jazyka C# a je k dispozici účastníkům kurzu Datamining a kurzu Programovací techniky a data mining na e learningovém portálu ALS na TUL.