Atenção!


O atendimento às questões referentes ao Repositório Institucional será interrompido entre os dias 20 de dezembro de 2025 a 4 de janeiro de 2026.

Pedimos a sua compreensão e aproveitamos para desejar boas festas!

Logo do repositório

Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC

Carregando...
Imagem de Miniatura

Orientador

Casaca, Wallace Correa de Oliveira

Coorientador

Pós-graduação

Curso de graduação

São José do Rio Preto - IBILCE - Ciência da Computação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

O diabetes mellitus é uma condição crônica de alta prevalência e impacto significativo na saúde pública, associada a complicações graves que afetam a qualidade de vida de milhões de pessoas no mundo. Este trabalho tem como objetivo comparar diferentes modelos de Inteligência Artificial, baseados em Aprendizado de Máquina, para a classificação de indivíduos em diabéticos, pré-diabéticos ou saudáveis, utilizando uma base de dados do Centro de Controle de Doenças (CDC), com mais de 200.000 registros. Por meio da Análise Exploratória de Dados e da comparação de algoritmos como Random Forest, K-Nearest Neighbors, XGBoost, Regressão Logística e Redes Neurais, avaliam-se as capacidades de cada abordagem em identificar padrões relevantes para apoio a identificação da doença. Os resultados evidenciam qual modelo apresenta o melhor desempenho em termos de acurácia balanceada e identificação de verdadeiros positivos, reforçando o potencial das soluções data-driven na melhoria de decisões clínicas.

Resumo (inglês)

Diabetes mellitus is a chronic condition of high prevalence and significant impact on public health, associated with severe complications that affect the quality of life for millions of people worldwide. This study aims to compare different Artificial Intelligence models, based on Machine Learning, for the classification of individuals as diabetic, pre-diabetic, or healthy, using a dataset from the Centers for Disease Control and Prevention (CDC) with over 200,000 records. Through Exploratory Data Analysis and the comparison of algorithms such as Random Forest, K-Nearest Neighbors, XGBoost, Logistic Regression, and Neural Networks, the capabilities of each approach in identifying relevant patterns to support disease identification are evaluated. The results highlight which model shows the best performance in terms of balanced accuracy and true positive identification, reinforcing the potential of data-driven solutions in improving clinical decisions.

Descrição

Palavras-chave

Inteligência artificial, Aprendizado de máquina, Classificação de diabetes, Ciência de dados

Idioma

Português

Citação

CONSTANTINO, Igor Ricci. Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista, São José do Rio Preto, 2025.

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação