Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC
Carregando...
Data
Autores
Orientador
Casaca, Wallace Correa de Oliveira 

Coorientador
Pós-graduação
Curso de graduação
São José do Rio Preto - IBILCE - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
O diabetes mellitus é uma condição crônica de alta prevalência e impacto significativo na saúde pública, associada a complicações graves que afetam a qualidade de vida de milhões de pessoas no mundo. Este trabalho tem como objetivo comparar diferentes modelos de Inteligência Artificial, baseados em Aprendizado de Máquina, para a classificação de indivíduos em diabéticos, pré-diabéticos ou saudáveis, utilizando uma base de dados do Centro de Controle de Doenças (CDC), com mais de 200.000 registros. Por meio da Análise Exploratória de Dados e da comparação de algoritmos como Random Forest, K-Nearest Neighbors, XGBoost, Regressão Logística e Redes Neurais, avaliam-se as capacidades de cada abordagem em identificar padrões relevantes para apoio a identificação da doença. Os resultados evidenciam qual modelo apresenta o melhor desempenho em termos de acurácia balanceada e identificação de verdadeiros positivos, reforçando o potencial das soluções data-driven na melhoria de decisões clínicas.
Resumo (inglês)
Diabetes mellitus is a chronic condition of high prevalence and significant impact on public health, associated with severe complications that affect the quality of life for millions of people worldwide. This study aims to compare different Artificial Intelligence models, based on Machine Learning, for the classification of individuals as diabetic, pre-diabetic, or healthy, using a dataset from the Centers for Disease Control and Prevention (CDC) with over 200,000 records. Through Exploratory Data Analysis and the comparison of algorithms such as Random Forest, K-Nearest Neighbors, XGBoost, Logistic Regression, and Neural Networks, the capabilities of each approach in identifying relevant patterns to support disease identification are evaluated. The results highlight which model shows the best performance in terms of balanced accuracy and true positive identification, reinforcing the potential of data-driven solutions in improving clinical decisions.
Descrição
Palavras-chave
Inteligência artificial, Aprendizado de máquina, Classificação de diabetes, Ciência de dados
Idioma
Português
Citação
CONSTANTINO, Igor Ricci. Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista, São José do Rio Preto, 2025.

