Využití strojového učení pro odhad křivek přežití
dc.contributor | Vydra Jan, MUDr. : 67686 | |
dc.contributor.advisor | Paleček Karel, Ing. Ph.D. : 61120 | |
dc.contributor.author | Trdla, Tomáš | |
dc.date.accessioned | 2020-09-22T18:35:01Z | |
dc.date.available | 2020-09-22T18:35:01Z | |
dc.date.committed | 2020-5-18 | |
dc.date.defense | 2020-06-30 | |
dc.date.issued | 2019-10-9 | |
dc.date.submitted | 2019-10-9 | |
dc.date.updated | 2020-6-30 | |
dc.degree.level | Ing. | |
dc.description.abstract | Tato práce se zabývá implementací a porovnáním vybraných algoritmů umělé inteligence na odhad křivek přežití. Výchozím modelem je nejpoužívanější Coxův model proporcionálních rizik, jehož nedostatek v podobě lineárních vztahů mezi kovariáty je základem úvah pro průzkum schopností a kvality nelineárních modelů z AI oblasti. Jako hodnotící kritéria jsou použity různé metody a přístupy, které dohromady dávají ucelenou představu o kvalitě modelu. Pro každý model je implementována metoda na popis vlivu vstupních proměnných na výsledné riziko selhání, aby byla zachována možnost zjištění tohoto vlivu, jako tomu je u Coxova modelu proporcionálních rizik. Veškeré testy jsou prováděny na reálných anonymizovaných datech z oddělení transplantací na Ústavu krevní hematologie a transfuze v Praze, kromě porovnání vlivu velikosti učícího datasetu, pro který bylo využito většího objemu dat. Kvůli povaze dat je k práci přistupováno i ze zdravotnického hlediska. Vzhledem k realistickému přístupu byl vytvořen vlastní preprocessor, který zohledňuje a řeší, že v reálných datech téměř vždy chybí některé údaje. Modely jsou otestovány na několika specifických cílech, které mohou být podstatné pro vývoj průběhu léčby. Výsledky prokazují rozdílnou kvalitu modelů na zkoumaných časech přežití a ovlivnění dané kvality velikostí učícího datasetu. Zároveň dokazují, že modely AI jsou schopny dosáhnout přesnějších výsledků než CoxPH model, avšak liší se při rozdílných cílech a datasetech, proto položily základ myšlence ensemble modelu, která je v této práci teoreticky popsána jako další možné řešení a výzkum. | cs |
dc.description.abstract | This work deals with the implementation and comparison of selected artificial intelligence algorithms for an estimation of survival curves. The default model is the most widely used Cox propotional hazard model, whose drawback of linear relationships between its covariates is the reasoning basis for exploring the capabilities and quality of nonlinear models from artificial intelligence domain. Various methods and approaches are used as evaluation criteria, which combination gives a comprehensive idea of quality of the model. For each model the method to describe the influence of input variables on resulting risk of failure is implemented in order to preserve the possibility of detecting this effect, as is the case with the Cox propotional hazard model. All tests are performed on real anonymized data from transplant department at the Institute of Blood Hematology and Transfusion in Prague, except the case of comparison of the effect of the size of the training dataset, for which a larger volume of data was used. Due to the nature of the data, the work is also approached from a medical point of view. In respect to the realistic approach a custom preprocessor has been created, which takes into account and solves, that some records are almost always missing in real data. Models are tested on several specific targets that may be essential for the development of the treatment. The results demonstrate different quality of models at the investigated survival times and detects influence on quality by given dataset size. At the same time the results prove that AI models are able to achieve more accurate results than CoxPH model, but differ in different goals and datasets, which laid the foundation for the ensemle model, which is theoretically described in this work as another possible solution and research. | en |
dc.description.mark | ||
dc.format | 76 s. | |
dc.format.extent | 1 | |
dc.identifier.signature | V 202002104 | |
dc.identifier.uri | https://dspace.tul.cz/handle/15240/157744 | |
dc.language.iso | cs | |
dc.relation.isbasedon | beginarab renewcommandlabelenumi[arabicenumi] item parSAINANI, Kristin, Joshua WALLACH a Michael MCAULIFFE. Statistics in Medicine. Stanford Online [online]. [cit. 2019-10-09]. Dostupné z: https://lagunita.stanford.edu/courses/Medicine/MedStats./Summer2015/aboutpar item parBishop, C. Pattern Recognition and Machine Learning. 2006. ISBN 13: 978-038731073par item parGoodfellow, Ian, Yoshua Bengio a Aaron Courville. Deep learning. The MIT Press 2016. ISBN 0262035618par endarab | |
dc.rights | Vysokoškolská závěrečná práce je autorské dílo chráněné dle zákona č. 121/2000 Sb., autorský zákon, ve znění pozdějších předpisů. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou https://knihovna.tul.cz/document/26 | cs |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act. https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics https://knihovna.tul.cz/document/26 | en |
dc.rights.uri | https://knihovna.tul.cz/document/26 | |
dc.rights.uri | https://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf | |
dc.subject | Křivky přežití | cs |
dc.subject | umělá inteligence | cs |
dc.subject | statistické testy | cs |
dc.subject | coxův model proporcionálních rizik | cs |
dc.subject | neuronová síť | cs |
dc.subject | rozhodovací stromové struktury | cs |
dc.subject | strojové učení | cs |
dc.subject | Survival curves | en |
dc.subject | artificial intelligence | en |
dc.subject | statictical testing | en |
dc.subject | cox proportional hazard model | en |
dc.subject | neural network | en |
dc.subject | decision trees | en |
dc.subject | machine learning | en |
dc.title | Využití strojového učení pro odhad křivek přežití | cs |
dc.title | Using machine learning for survival analysis | en |
dc.type | diplomová práce | cs |
local.degree.abbreviation | Navazující | |
local.degree.discipline | AR-N | |
local.degree.programme | Elektrotechnika a informatika | |
local.degree.programmeabbreviation | N2612 | |
local.department.abbreviation | ITE | |
local.faculty | Fakulta mechatroniky, informatiky a mezioborových studií | cs |
local.faculty.abbreviation | FM | |
local.identifier.author | M17000144 | |
local.identifier.stag | 40008 | |
local.identifier.verbis | ||
local.identifier.verbis | kpw06667663 | |
local.note.administrators | automat | |
local.note.secrecy | Povoleno ZverejnitPraci Povoleno ZverejnitPosudky | |
local.poradovecislo | 2104 |
Files
Original bundle
1 - 5 of 5
Loading...
- Name:
- DP_Trdla.pdf
- Size:
- 3.21 MB
- Format:
- Adobe Portable Document Format
- Description:
- VSKP
Loading...
- Name:
- ProtokolSPrubehemObhajobySTAG.pdf
- Size:
- 15.85 KB
- Format:
- Adobe Portable Document Format
- Description:
- Prubeh_obhajoby_VSKP
Loading...
- Name:
- DP_Tomas_Trdla_vedouci.pdf
- Size:
- 877.08 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_vedouciho_VSKP
Loading...
- Name:
- DP_Tomas_Trdla_oponent.pdf
- Size:
- 631.38 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek_oponenta_VSKP