Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC
| dc.contributor.advisor | Casaca, Wallace Correa de Oliveira [UNESP] | |
| dc.contributor.author | Constantino, Igor Ricci [UNESP] | |
| dc.contributor.committeeMember | Guido, Rodrigo Capobianco [UNESP] | |
| dc.contributor.committeeMember | Bruno, Diego Renan [UNESP] | |
| dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
| dc.date.accessioned | 2025-12-05T14:41:21Z | |
| dc.date.issued | 2025-11-25 | |
| dc.description.abstract | O diabetes mellitus é uma condição crônica de alta prevalência e impacto significativo na saúde pública, associada a complicações graves que afetam a qualidade de vida de milhões de pessoas no mundo. Este trabalho tem como objetivo comparar diferentes modelos de Inteligência Artificial, baseados em Aprendizado de Máquina, para a classificação de indivíduos em diabéticos, pré-diabéticos ou saudáveis, utilizando uma base de dados do Centro de Controle de Doenças (CDC), com mais de 200.000 registros. Por meio da Análise Exploratória de Dados e da comparação de algoritmos como Random Forest, K-Nearest Neighbors, XGBoost, Regressão Logística e Redes Neurais, avaliam-se as capacidades de cada abordagem em identificar padrões relevantes para apoio a identificação da doença. Os resultados evidenciam qual modelo apresenta o melhor desempenho em termos de acurácia balanceada e identificação de verdadeiros positivos, reforçando o potencial das soluções data-driven na melhoria de decisões clínicas. | pt |
| dc.description.abstract | Diabetes mellitus is a chronic condition of high prevalence and significant impact on public health, associated with severe complications that affect the quality of life for millions of people worldwide. This study aims to compare different Artificial Intelligence models, based on Machine Learning, for the classification of individuals as diabetic, pre-diabetic, or healthy, using a dataset from the Centers for Disease Control and Prevention (CDC) with over 200,000 records. Through Exploratory Data Analysis and the comparison of algorithms such as Random Forest, K-Nearest Neighbors, XGBoost, Logistic Regression, and Neural Networks, the capabilities of each approach in identifying relevant patterns to support disease identification are evaluated. The results highlight which model shows the best performance in terms of balanced accuracy and true positive identification, reinforcing the potential of data-driven solutions in improving clinical decisions. | en |
| dc.description.sponsorshipId | Não recebi financiamento | |
| dc.identifier.citation | CONSTANTINO, Igor Ricci. Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista, São José do Rio Preto, 2025. | |
| dc.identifier.uri | https://hdl.handle.net/11449/316272 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Estadual Paulista (Unesp) | |
| dc.rights.accessRights | Acesso aberto | pt |
| dc.subject | Inteligência artificial | pt |
| dc.subject | Aprendizado de máquina | pt |
| dc.subject | Classificação de diabetes | pt |
| dc.subject | Ciência de dados | pt |
| dc.title | Aplicação de modelos de aprendizado de máquina para a classificação de diabetes: um estudo comparativo utilizando dados do CDC | pt |
| dc.title.alternative | Application of machine learning models for diabetes classification: a comparative study using CDC data | en |
| dc.type | Trabalho de conclusão de curso | pt |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | d19d419c-8d22-47d8-82b8-33b59875ad78 | |
| relation.isAuthorOfPublication.latestForDiscovery | d19d419c-8d22-47d8-82b8-33b59875ad78 | |
| unesp.campus | Universidade Estadual Paulista (UNESP), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto | pt |
| unesp.examinationboard.type | Banca pública | pt |
| unesp.undergraduate | São José do Rio Preto - IBILCE - Ciência da Computação | pt |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- constantino_ir_tcc_sjrp.pdf
- Tamanho:
- 914.71 KB
- Formato:
- Adobe Portable Document Format
Licença do pacote
1 - 2 de 2
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
Carregando...
- Nome:
- Constantino_ir_autorização_sjrp.pdf
- Tamanho:
- 182.29 KB
- Formato:
- Adobe Portable Document Format
- Descrição:

