Comparação de modelos de aprendizado de máquina para a predição de churn
dc.contributor.advisor | Garde, Ivan Aritz Aldaya [UNESP] | |
dc.contributor.author | Miamoto, Eduardo Yukio [UNESP] | |
dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
dc.date.accessioned | 2024-12-16T16:26:22Z | |
dc.date.available | 2024-12-16T16:26:22Z | |
dc.date.issued | 2024-12-03 | |
dc.description.abstract | Este trabalho analisa e compara três algoritmos de aprendizado de máquina — árvore de decisão, floresta aleatória e LightGBM — com o objetivo de prever o churn de vendedores em um marketplace de e-commerce. O estudo utilizou um conjunto de dados real de transações para avaliar a capacidade preditiva dos modelos, considerando o desafio do desbalanceamento das classes. Para garantir a robustez dos resultados, a métrica AUC (Área Sob a Curva) foi adotada, evitando distorções comuns em dados desbalanceados. A pesquisa explorou a influência de diferentes volumes de dados na performance dos algoritmos, com testes realizados tanto na base de dados inicialmente analisada quanto em uma base expandida. Os melhores modelos foram selecionados com base em suas configurações de hiperparâmetros e avaliados em três amostras: treino, teste e fora do tempo (out of time OOT). O estudo conclui que a base expandida melhora o desempenho do LightGBM, enquanto o aumento de dados não altera significativamente os resultados dos outros modelos. Este trabalho fornece insights relevantes para estratégias de retenção em plataformas de e-commerce. | pt |
dc.description.abstract | This study analyzes and compares three machine learning algorithms—decision tree, random forest, and LightGBM—with the objective of predicting vendor churn in an e-commerce marketplace. The research utilized real transaction data to evaluate the predictive capabilities of these models, considering the challenges posed by class imbalance. To ensure robust results, the AUC (Area Under the Curve) metric was adopted, avoiding common distortions in imbalanced data. The study explored the influence of different data volumes on algorithm performance, with tests conducted on both the initially analyzed and an expanded dataset. The top-performing models were selected based on their hyperparameter configurations and evaluated across three samples: training, testing, and out-of-time (OOT). The study concludes that the expanded dataset significantly enhances the LightGBM’s performance, while data increase does not substantially alter the results of the other models. This research offers valuable insights for retention strategies in e-commerce platforms. | en |
dc.identifier.citation | MIAMOTO, E. Y. Comparação de modelos de aprendizado de máquina para a predição de churn. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Eletrônica e de Telecomunicações) — Faculdade de Engenharia, Universidade Estadual Paulista "Júlio de Mesquita Filho", São João da Boa Vista, 2024. | |
dc.identifier.uri | https://hdl.handle.net/11449/259107 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso aberto | pt |
dc.subject | Inteligência artificial | pt |
dc.subject | Aprendizado do computador | pt |
dc.subject | Árvores de decisão | pt |
dc.subject | Comércio eletrônico | pt |
dc.title | Comparação de modelos de aprendizado de máquina para a predição de churn | pt |
dc.title.alternative | Comparison of machine learning models for churn prediction | en |
dc.type | Trabalho de conclusão de curso | pt |
unesp.campus | Universidade Estadual Paulista (Unesp), Faculdade de Engenharia, São João da Boa Vista | pt |
unesp.examinationboard.type | Banca pública | pt |
unesp.undergraduate | São João da Boa Vista - FESJBV - Engenharia Eletrônica e de Telecomunicações | pt |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- miamoto_ey_tcc_sjbv.pdf
- Tamanho:
- 1.96 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 2 de 2
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
Nenhuma Miniatura disponível
- Nome:
- miamoto_ey_autorizacao_sjbv.pdf
- Tamanho:
- 154.06 KB
- Formato:
- Adobe Portable Document Format
- Descrição: