Modelos de aprendizado de máquina baseados em kernel para análise de sobrevivência
Carregando...
Data
Orientador
Papa, João Paulo 

Coorientador
Jodas, Danilo Samuel 

Pós-graduação
Curso de graduação
Bauru - FC - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
A análise de sobrevivência é um ramo da estatística essencial para a análise de dados de tempo até o evento, porém, métodos tradicionais têm dificuldade com dados complexos e não-lineares. Nesse paradigma, os modelos de aprendizado de máquina surgiram como soluções consolidadas para melhorar a análise de sobrevivência. No entanto, tais métodos exigem cuidadosa otimização de hiperparâmetros, um processo computacionalmente intensivo que dificulta implementações práticas. Esse trabalho enfrenta essas limitações ao propor três novos estimadores baseados em kernels desenvolvidos a partir da integração do estimador de Beran com dois algoritmos nãoparamétricos do aprendizado de máquina: uma variação não paramétrica do algoritmo de 𝑘 vizinhos mais próximos (𝑘NN) e o 𝑘NN-supervised Optimum-Path Forest (OPF- 𝑘NN). Ambos os métodos aprendem automaticamente o número ótimo de vizinhos ao longo de suas execuções, no caso do OPF-𝑘NN, até um número máximo definido manualmente, evitando a maior parte do ajuste paramétrico. Através de uma avaliação abrangente em três conjuntos de amostras, um de Downhole Safety Valves empregadas em poços de petróleo, outro de pacientes sendo tratados para insuficiência cardíaca e, o terceiro, de pacientes passando por tratamento para câncer de próstata, foi constatado que os modelos desenvolvidos se aproximam ou superam a capacidade preditiva de modelos tradicionais dependentes de hiperparâmetros, caracterizando ferramentas robustas para análise de sobrevivência que lidam efetivamente com distribuições complexas e não lineares sem requerer calibração específica para cada conjunto de dados.
Resumo (inglês)
Survival analysis is a branch of statistics essetial to time-to-event analysis, but traditional methods struggle with complex, non-linear data. In this environment, machine learning models emerged as consolidated solutions to improve survival analysis. However, these methods demand careful hyperparameter tuning, a computationally intensive process that serve as an obstacle to practical implementations. This work addresses these limitations by proposing three new kernel-based estimators developed through the integration of the Beran estimator with two parameterless machine learning algorithms: a parameterless 𝑘-Nearest Neighbors (𝑘NN) variation and 𝑘NN-supervised Optimum-Path Forest (OPF-𝑘NN). Both of these methods automatically learn the optimal number of neighbors, up to a manually defined maximum amount, in OPF-𝑘NN’s case, avoiding most manual hyperparameter tuning. Through comprehensive evaluation of samples from three datasets, one of Downhole Safety Valves employed in oil wells, another of patients being treated for heart disease and a third of patients being treated for prostate cancer, it was asserted that our parameter-less approach maintains or surpasses the predictive capability of survival functions over traditional hyperparameter-dependent methods, providing a robust and adaptable tool for survival analysis that effectively handles complex, nonlinear data distributions without requiring dataset-specific calibration.
Descrição
Palavras-chave
Estimador de Beran, Análise de sobrevivência, Análise de confiabilidade, Confiabilidade para engenharia, Hiperparâmetros, Aprendizado de máquina, Beran estimator, Survival analysis, Reliabilty analysis
Idioma
Português
Citação
BARRY, Christian Laurence Almeida. Modelos de aprendizado de máquina baseados em Kernel para análise de sobrevivência. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2025.


