Metodika využití nástrojů strojového učení pro odhad spotřeby času ve výrobě malých a středních podniků
Loading...
Date
2024-11-25
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Tato disertační práce navrhuje metodiku využití nástrojů strojového učení pro odhad spotřeby času ve výrobě malých a středních podniků.
Za účelem navržení metodiky dochází ke kategorizaci existujících metod odhadu spotřeby času. Kategorizace se provádí na základě analýzy použitých dat a metod generování odhadů. Dále jsou tyto metody popsány a jejich aplikace v praxi je podložena výsledky rešerše.
Jádrem práce je integrace metod dolování dat a strojového učení v malých a středních podnicích pro odhad spotřeby času zakázek s omezeným rozsahem dat. Při tvorbě metodiky jsou zohled-něny specifické potřeby a omezení těchto podniků. Důraz je kladen na integraci současných sys-témů a nástrojů, které firmy již používají, s cílem minimalizovat náklady a čas implementace. Tyto systémy jsou kombinovány s volně dostupnými nástroji pro dolování dat a strojové učení.
Použité techniky a algoritmy dolování dat jsou vysvětleny a prezentovány tak, aby byly snadno pochopitelné a interpretovatelné.
Navrhovaná metodika je založena na:
- Definici kroků praktické realizace dolování dat,
- Návrhu heuristiky pro identifikaci kritéria podobnosti zakázek v rámci přípravy dat,
- Systému kategorizace dat podle četnosti dat učení, za účelem navýšení dat učení při tvorbě modelu,
- Evaluaci odhadu v závislosti od spolehlivosti navržených modelů a dat učení.
Prezentovaná metodika je aplikována na data středně velkého podniku pro odhad různých druhů časů. Pro jednotlivé odhady jsou vytvořeny průtokové diagramy modelování, které přispívají k srozumitelnosti užití metodiky. Pro jednotlivé modely odhadů bylo dosáhnuto různých spolehli-vostí, co potvrzuje silnou závislost spolehlivosti modelů od kvality dat.
This dissertation proposes a methodology for utilizing machine learning tools to estimate time consumption in small and medium-sized enterprises. To design this methodology, existing methods for estimating time consumption are categorized. This categorization is based on analyzing the data used and the methods for generating estimates. Furthermore, these methods are described, and research results support their practical applica-tions. The core of the work is the integration of data mining and machine learning methods in small and medium-sized enterprises to estimate job time consumption with limited data scope. When de-veloping the methodology, these enterprises' specific needs and constraints are considered. Em-phasis is placed on integrating the current systems and tools that companies already use, aiming to minimize implementation costs and time. These systems are combined with freely available data mining and machine learning tools. The data mining techniques and algorithms used are explained and presented in a way that is easy to understand and interpret. The proposed methodology is based on: - Defining practical steps for data mining implementation, - Designing a heuristic to identify similarity criteria of jobs during data preparation, - A system for categorizing data according to the frequency of learning data, aiming to in-crease the learning data when creating the model, - Evaluating estimates based on the reliability of the proposed models and learning data. The presented methodology is applied to the data of a medium-sized enterprise to estimate vari-ous types of times. For individual estimates, contributing to the clarity of methodology usage, flowcharts of modeling are created. Different models achieved varying reliabilities, which con-firms a strong dependence of model reliability on data quality.
This dissertation proposes a methodology for utilizing machine learning tools to estimate time consumption in small and medium-sized enterprises. To design this methodology, existing methods for estimating time consumption are categorized. This categorization is based on analyzing the data used and the methods for generating estimates. Furthermore, these methods are described, and research results support their practical applica-tions. The core of the work is the integration of data mining and machine learning methods in small and medium-sized enterprises to estimate job time consumption with limited data scope. When de-veloping the methodology, these enterprises' specific needs and constraints are considered. Em-phasis is placed on integrating the current systems and tools that companies already use, aiming to minimize implementation costs and time. These systems are combined with freely available data mining and machine learning tools. The data mining techniques and algorithms used are explained and presented in a way that is easy to understand and interpret. The proposed methodology is based on: - Defining practical steps for data mining implementation, - Designing a heuristic to identify similarity criteria of jobs during data preparation, - A system for categorizing data according to the frequency of learning data, aiming to in-crease the learning data when creating the model, - Evaluating estimates based on the reliability of the proposed models and learning data. The presented methodology is applied to the data of a medium-sized enterprise to estimate vari-ous types of times. For individual estimates, contributing to the clarity of methodology usage, flowcharts of modeling are created. Different models achieved varying reliabilities, which con-firms a strong dependence of model reliability on data quality.
Description
Subject(s)
dolování dat, strojové učení, metody odhadu spotřeby času, prediktivní analytiky, malé a střední podniky, evaluace modelování