| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 2.12 MB | Adobe PDF |
Authors
Abstract(s)
This thesis addresses the detection of non-conformities in an injection moulding process
using unsupervised and semi-supervised learning techniques, with the dual objective of
identifying faulty production time zones that prompt the creation of non-conforming parts
and enhancing process explainability for machine operators. The early detection of machine
parameter deviations, such as abnormal temperature, pressure, torque, and cycle time
variations, is essential to minimize economic losses, material waste, and sub-optimal product
quality, while maintaining the machine in an optimal production state for longer periods.
A diverse array of methods, including Local Outlier Factor (LOF), Isolation Forest
(IF), One-Class Support Vector Machine (One-Class SVM), OPTICS, Mean Shift, and
Long Short-Term Memory (LSTM) networks, were experimented with to achieve this
goal. Extensive feature engineering and selection were performed to balance dimensionality
reduction with domain-relevant interpretability, enabling actionable feedback for process
optimization.
The model pipeline was developed using Python, PyTorch, and Scikit-learn, containerized
with Docker and accelerated using CUDA. Real-world sensor data spanning six months of
continuous 24/7 operation were used for training and evaluation. The proposed LSTM-based
approach, designed for time series modeling, achieved a weighted average F1-score of 0.94 on
test data in predicting faulty production time zones of approximately seven-minute intervals.
Evaluation metrics included accuracy, precision, and recall, with particular emphasis on
the F1-score due to the imbalanced nature of the dataset and the critical need to minimize
both false positives and false negatives.
A key aspect of this work lies in its commitment to data-driven development, grounded
in the use of real, unfiltered sensor data from live industrial production. While raw data
introduces noise and operational variability, it also provides a more faithful representation of
the production environment, revealing edge cases and failure modes often absent in curated
datasets. Addressing these challenges required robust preprocessing, careful validation, and
a strong understanding of the process domain, ultimately enabling the development of a
model better suited for real-world deployment and generalization.
The results demonstrate that this methodology provides a robust baseline for anomaly
detection and process monitoring in injection moulding. Contributions include a reproducible
framework for explainable unsupervised anomaly detection, validation of LSTM’s
effectiveness over static models, and novel feature reduction strategies, such as applying
PCA to sensor groups while preserving domain interpretability. This work serves both as
a practical tool for deployment and as a methodological reference and compendium of
techniques for future research in data-driven industrial process optimization.
Esta tese aborda a deteção de não-conformidades num processo de injeção plástica recorrendo a técnicas de aprendizagem não supervisionada e semissupervisionadas, com o duplo objetivo de identificar intervalos temporais de produção propícios a defeitos que conduzem à geração de peças não conformes e de reforçar a explicabilidade do processo para os operadores de máquina. A deteção precoce de desvios nos parâmetros da máquina, tais como variações anómalas de temperatura, pressão, binário e tempo de ciclo, é essencial para minimizar perdas económicas, desperdício de material e degradação da qualidade do produto, mantendo simultaneamente a máquina num estado ideal de produção durante períodos mais prolongados. Um conjunto diversificado de métodos, incluindo Local Outlier Factor (LOF), Isolation Forest (IF), One-Class Support Vector Machine (One-Class SVM), OPTICS, MeanShift e redes Long Short-Term Memory (LSTM), foram explorados com este propósito. Foi realizada engenharia e seleção de features de forma extensiva, procurando equilibrar a redução de dimensionalidade com a interpretabilidade relevante para o domínio, permitindo fornecer informação acionável para a otimização do processo. O pipeline do modelo foi desenvolvido em Python, PyTorch e Scikit-learn, num container de Docker e acelerado com CUDA. Dados reais de sensores, cobrindo seis meses de operação contínua 24/7, foram utilizados para treino e avaliação dos modelos. A abordagem de LSTM proposta, concebida para modelação de séries temporais, alcançou um F1-Score médio ponderada de 0,94 em dados de teste na previsão de intervalos de produção defeituosos de aproximadamente sete minutos. As métricas de avaliação incluíram accuracy, precision e recall, com particular ênfase no F1-Score derivado do caráter não balanceado do dataset e à necessidade crítica de minimizar tanto falsos positivos como falsos negativos. Um aspeto central deste trabalho reside no seu compromisso com um desenvolvimento data-driven, sustentado pela utilização de dados reais e não filtrados provenientes de produção industrial em operação. Embora dados brutos introduzam ruído e variabilidade operacional, oferecem também uma representação mais fiel do ambiente produtivo, revelando casos limite e modos de falha frequentemente ausentes em datasets refinados. A abordagem a estes desafios exigiu pré-processamento robusto, validação cuidadosa e um conhecimento sólido do domínio do processo, permitindo, em última análise, o desenvolvimento de um modelo mais adequado à implementação no mundo real e à sua generalização. Os resultados demonstram que esta metodologia fornece uma base robusta para a deteção de anomalias e monitorização do processo de injeção. As contribuições incluem um framework reprodutível para deteção de anomalias não supervisionada preservando explicabilidade de features, a validação da eficácia das LSTM face a modelos estáticos e estratégias inovadoras de redução de features, como a aplicação de PCA a grupos de sensores mantendo a interpretabilidade do domínio. Este trabalho serve simultaneamente como ferramenta prática para implementação e como referência metodológica e compêndio de técnicas para investigação futura na otimização de processos industriais orientados por dados.
Esta tese aborda a deteção de não-conformidades num processo de injeção plástica recorrendo a técnicas de aprendizagem não supervisionada e semissupervisionadas, com o duplo objetivo de identificar intervalos temporais de produção propícios a defeitos que conduzem à geração de peças não conformes e de reforçar a explicabilidade do processo para os operadores de máquina. A deteção precoce de desvios nos parâmetros da máquina, tais como variações anómalas de temperatura, pressão, binário e tempo de ciclo, é essencial para minimizar perdas económicas, desperdício de material e degradação da qualidade do produto, mantendo simultaneamente a máquina num estado ideal de produção durante períodos mais prolongados. Um conjunto diversificado de métodos, incluindo Local Outlier Factor (LOF), Isolation Forest (IF), One-Class Support Vector Machine (One-Class SVM), OPTICS, MeanShift e redes Long Short-Term Memory (LSTM), foram explorados com este propósito. Foi realizada engenharia e seleção de features de forma extensiva, procurando equilibrar a redução de dimensionalidade com a interpretabilidade relevante para o domínio, permitindo fornecer informação acionável para a otimização do processo. O pipeline do modelo foi desenvolvido em Python, PyTorch e Scikit-learn, num container de Docker e acelerado com CUDA. Dados reais de sensores, cobrindo seis meses de operação contínua 24/7, foram utilizados para treino e avaliação dos modelos. A abordagem de LSTM proposta, concebida para modelação de séries temporais, alcançou um F1-Score médio ponderada de 0,94 em dados de teste na previsão de intervalos de produção defeituosos de aproximadamente sete minutos. As métricas de avaliação incluíram accuracy, precision e recall, com particular ênfase no F1-Score derivado do caráter não balanceado do dataset e à necessidade crítica de minimizar tanto falsos positivos como falsos negativos. Um aspeto central deste trabalho reside no seu compromisso com um desenvolvimento data-driven, sustentado pela utilização de dados reais e não filtrados provenientes de produção industrial em operação. Embora dados brutos introduzam ruído e variabilidade operacional, oferecem também uma representação mais fiel do ambiente produtivo, revelando casos limite e modos de falha frequentemente ausentes em datasets refinados. A abordagem a estes desafios exigiu pré-processamento robusto, validação cuidadosa e um conhecimento sólido do domínio do processo, permitindo, em última análise, o desenvolvimento de um modelo mais adequado à implementação no mundo real e à sua generalização. Os resultados demonstram que esta metodologia fornece uma base robusta para a deteção de anomalias e monitorização do processo de injeção. As contribuições incluem um framework reprodutível para deteção de anomalias não supervisionada preservando explicabilidade de features, a validação da eficácia das LSTM face a modelos estáticos e estratégias inovadoras de redução de features, como a aplicação de PCA a grupos de sensores mantendo a interpretabilidade do domínio. Este trabalho serve simultaneamente como ferramenta prática para implementação e como referência metodológica e compêndio de técnicas para investigação futura na otimização de processos industriais orientados por dados.
Description
Keywords
Injecção plástica Previsão de defeitos Solução data-driven Dados de sensores industriais
