Análise preditiva de churn com regressão logística em serviços de planejamento financeiro
Carregando...
Data
Autores
Orientador
Schlunzen Junior, Klaus 

Coorientador
Pós-graduação
Curso de graduação
Presidente Prudente - FCT - Estatística
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Este trabalho teve como objetivo a construção de um modelo preditivo para a previsão de churn em clientes de um serviço de mentoria, utilizando técnicas de engenharia de dados, análise de agrupamento (K-means) e regressão logística. Inicialmente, foi realizada uma análise exploratória dos dados originais, esta análise sugeriu um baixo poder discriminativo das variáveis entre clientes ativos e churn. A partir disso, foi realizada a engenharia de dados, criando novas variáveis mais informativas, como tempo de permanência na mentoria, frequência de participação nas reuniões, e percentual de pagamento da mentoria.
Com a base de dados ajustada, a análise de agrupamento foi realizada utilizando o K-means, segmentando os clientes em três clusters, com o objetivo de identificar padrões comportamentais distintos entre eles. O modelo de regressão logística foi ajustado com as variáveis principais e interações entre elas, obtendo resultados significativos, incluindo um AUC de 0.9522 e uma acurácia de 81,82%. A análise de variáveis indicou que o tempo de permanência na mentoria e o nível de engajamento nas reuniões foram os fatores mais relevantes para prever o churn dos clientes.
As implicações práticas deste estudo são significativas, fornecendo à empresa insights valiosos para otimizar suas estratégias de retenção de clientes. Além disso, as contribuições científicas deste trabalho incluem a aplicação de técnicas de engenharia de dados e análise de agrupamento para a análise de churn, uma aplicação pouco documentada na literatura para serviços de mentoria.
Resumo (inglês)
This study built a predictive model for churn prediction in clients of a mentorship service, using data engineering, clustering analysis (K-means), and logistic regression techniques. Initially, an exploratory data analysis was conducted on the raw data, revealing that the available variables did not provide sufficient discriminative power between active clients and churned ones. Subsequently, data engineering was applied to create more informative variables such as tenure in mentorship, meeting participation frequency, and fraction of mentorship paid.
With the adjusted dataset, clustering analysis was performed using K-means, segmenting clients into three clusters to identify distinct behavioral patterns. The logistic regression model was fitted with the main variables and their interactions, achieving significant results, including an AUC of 0.9522 and accuracy of 81.82%. The variable analysis indicated that tenure in mentorship and engagement in meetings were the most important factors in predicting churn.
The practical implications of this study are significant, providing the company with valuable insights to optimize its customer retention strategies. Furthermore, the scientific contributions of this work include the application of data engineering and clustering analysis for churn prediction, a method still underexplored in mentorship services.
Descrição
Palavras-chave
Estatística, Análise de regressão, Serviço ao cliente, Statistic, Regression analysis, Customer relations
Idioma
Português
Citação
LUKENCHUKII, Victor. Análise preditiva de churn com regressão logística em serviços de planejamento financeiro. Orientador: Klaus Schlunzen Junior. 2025. 76 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Faculdade de Ciências e Tecnologia, Universidade Estadual Paulista, Presidente Prudente, 2025.


