O uso de modelagem estatística para análise preditiva: uma aplicação no setor de serviços bancários na área Jurídica
Carregando...
Data
Autores
Orientador
Batistela, Gislaine Cristina 

Coorientador
Franco, Bruno Chaves
Pós-graduação
Engenharia de Produção - FEG
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Dissertação de mestrado
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Nesta pesquisa o objetivo é comparar, por meio de indicadores de desempenho, a precisão de dois modelos na previsão dos resultados (ganho ou perda das causas) das ações trabalhistas abertas contra instituições financeiras brasileiras. Para o estudo foram consumidos dados reais das sentenças, disponíveis nos Tribunais de Justiça e Tribunais Regionais Federais, e processados, seguindo o procedimento de Knowledge Discovery in Databases (KDD). Para possibilitar a aplicação dos modelos e aumentar a confiabilidade dos resultados, foi feito o préprocessamento dos dados, realizando cinco tarefas: tratamento dos dados (agrupamentos e eliminação de variáveis); imputação de dados faltantes; normalização (para as variáveis numéricas); transformação de variáveis qualitativas em variáveis dicotômicas dummies (aplicada às variáveis categóricas); e redução de dimensionalidade e multicolinearidade. Para a construção do modelo preditivo foram aplicadas duas metodologias para fins de comparação: Regressão Logística (RL) e o Light Boosting Gradient Model (LGBM). Quanto à conclusão, foram obtidos resultados expressivos quando comparados com os mesmos tipos de estudo encontrados na literatura, evidenciando que os modelos de RL e LGBM com machine learning podem ser altamente eficientes na predição dos resultados aplicados no contexto de Direito, sendo uma ferramenta importante na estratégia de defesa de ações trabalhistas para empresas deste seguimento, principalmente quanto à tomada de decisão de entrar em um acordo ou investir na defesa.
Resumo (inglês)
This research aims to compare, through performance indicators, the accuracy of two models
in predicting the outcomes (win or loss) of labor lawsuits filed against Brazilian financial
institutions. The study was conducted using real sentencing data available from the Courts of
Justice and Regional Federal Courts, processed following the Knowledge Discovery in
Databases (KDD) procedure. To enable the application of the models and enhance the
reliability of the results, data preprocessing was performed, comprising five tasks: data
treatment (grouping and variable elimination); imputation of missing data; normalization (for
numerical variables); transformation of qualitative variables into dummy dichotomous
variables (applied to categorical variables); and dimensionality and multicollinearity
reduction. For the development of the predictive model, two methodologies were applied for
comparison: Logistic Regression (LR) and the Light Gradient Boosting Model (LGBM). The
findings revealed significant results compared to similar studies in the literature,
demonstrating that LR and LGBM models with machine learning can be highly effective in
predicting case outcomes within the legal context. This makes them a valuable tool in the
strategic defense of labor lawsuits for companies in this sector, particularly in the decisionmaking process regarding settlement agreements or investing in defense
Descrição
Palavras-chave
Jurimetria, Direito do trabalho, Modelagem estatística, Regressão Logística, Mineração de dados, Desempenho - medição, Processo decisório
Idioma
Português
Citação
SILVA NETO, Osiris de Souza. O uso de modelagem estatística para análise preditiva: uma aplicação no setor de serviços bancários na área jurídica. Orientador: Gislaine Cristina Batistela. 2022. 50 f. Dissertação (Mestrado em Engenharia) - Faculdade de Engenharia e Ciências, Universidade Estadual Paulista, Guaratinguetá, 2025.


