Aplicação de técnicas de aprendizado de máquina para a identificação de mães com risco de parto prematuro na cidade de São Paulo

Carregando...
Imagem de Miniatura

Data

2023-11-09

Orientador

Marins, Fernando Augusto Silva

Coorientador

Nascimento, Luiz Fernando Costa
da Silva, Aneirson Francisco

Pós-graduação

Engenharia - FEG 33004080027P6

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

O parto prematuro ocorre antes da 37a semana de gestação, apresentando um risco elevado de complicações físicas e neuropsicomotoras nos recém-nascidos, sendo considerado a principal causa de mortalidade neonatal. Em consonância com um dos Objetivos de Desenvolvimento Sustentável (ODS) voltados à Saúde e Bem-Estar, que visa reduzir a mortalidade neonatal até 2030, a aplicação de ferramentas tecnológicas, como o Aprendizado de Máquina, pode oferecer suporte na assistência médica e na tomada de decisões. Dessa forma, esta pesquisa tem como objetivo aplicar técnicas de aprendizado de máquina para identificar mães com risco de parto prematuro, utilizando dados do município de São Paulo no período de 2015 a 2019. Este trabalho pode ser classificado como uma pesquisa aplicada com objetivos empírico-normativos, sua abordagem é quantitativa, utilizando o método de pesquisa de modelagem e simulação. Foram utilizados dados do Departamento de Informática do Sistema Único de Saúde – DATASUS, especificamente registros da declaração de nascidos vivos. A análise baseou-se na abordagem de regressão para estimar a duração da gestação (idade gestacional), considerando informações maternas e da gestação atual ou anterior e utilizando métodos como Regressão Linear, Árvore de Decisão, Floresta Aleatória, Gradient Bossting, e Extreme Gradient Boosting. Os modelos foram validados internamente com validação cruzada de 10-Fold e foi utilizada técnica Random Search para encontrar a melhor combinação de hiperparâmetros. Como resultado, o modelo de Gradient Boosting destacou-se como o melhor, apresentando bons resultados nas diferentes métricas de desempenho, com valores de EMA = 1,186, EQM = 2,833, REQM = 1,683, e EPAM = 3,182. Concluindo, o modelo de regressão demonstrou bom desempenho, evidenciando que as técnicas de aprendizado de máquina são ferramentas eficazes na área da saúde. Elas permitem que os especialistas tomem decisões oportunas em relação à identificação de nascimentos prematuros, contribuindo para a implementação de medidas de controle e, consequentemente, para a redução das taxas de mortalidade neonatal, em conformidade com os ODS.

Resumo (inglês)

The premature birth occurs before the 37th week of gestation, presenting a high risk of physical and neuropsychomotor complications in newborns, being considered the main cause of neonatal mortality. In line with one of the Sustainable Development Goals (SDGs) related to Health and Well-being, aiming to reduce neonatal mortality by 2030, the application of technological tools, such as Machine Learning, can provide support in medical care and decision-making. Thus, this research aims to apply machine learning techniques to identify mothers at risk of premature birth, using data from the municipality of São Paulo from 2015 to 2019. This work can be classified as applied research with empirical-normative objectives, its approach is quantitative, using the research method of modeling and simulation. Data from the Department of Informatics of the Unified Health System - DATASUS were used, specifically records of live births. The analysis was based on the regression approach to estimate the duration of gestation (gestational age), considering maternal information and current or previous pregnancy and using methods such as Linear Regression, Decision Tree, Random Forest, Gradient Boosting, and Extreme Gradient Boosting. The models were internally validated with 10-Fold cross-validation, and the Random Search technique was used to find the best combination of hyperparameters. As a result, the Gradient Boosting model stood out as the best, showing good results in different performance metrics, with values of MAE = 1.186, MSE = 2.833, RMSE = 1.683, and MAPE = 3.182. In conclusion, the regression model demonstrated good performance, highlighting that machine learning techniques are effective tools in the field of health. They allow specialists to make timely decisions regarding the identification of premature births, contributing to the implementation of control measures and, consequently, the reduction of neonatal mortality rates, in accordance with the SDGs.

Descrição

Idioma

Português

Como citar

AGUIRRE RODRÍGUEZ, Elias Carlos. Aplicação de técnicas de aprendizado de máquina para a identificação de mães com risco de parto prematuro na cidade de São Paulo. Orientador: Orientador: Fernando Augusto Silva Marins;. 2023. Dissertação (Mestrado em Engenharia) – Faculdade de Engenharia e Ciências de Guaratinguetá, Universidade Estadual Paulista, Guaratinguetá, 2023.

Itens relacionados