Aplicação de modelos de regressão logística para os dados públicos da empresa Olist
Carregando...
Arquivos
Data
2023-01-27
Autores
Orientador
Tarumoto, Mário Hissamitsu
Coorientador
Pós-graduação
Curso de graduação
Estatística - FCT
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto
Resumo
Resumo (português)
Com o crescimento acelerado das empresas de varejo por conta do mercado virtual, empresas como a Olist que focam em aproximar pequenos vendedores dos consumidores finais, a cada dia mais vêm ganhando espaço no mercado. Para a Olist, que tem parte do seu faturamento baseado na quantidade de vendas dos vendedores, é interessante saber quais vendedores não estão vendendo. Portanto o objetivo deste trabalho é identificar as características dos vendedores que não efetuarão venda. Na estatística vemos muitas técnicas aprofundadas e de difícil compreensão para pessoas que não são dessa área, portanto um objetivo secundário deste trabalho é ser o mais claro e simples, para que seja de fácil entendimento até para uma pessoa que não seja da área. Ao desenvolver o trabalho aprenderemos sobre o modelo de Regressão Logística, como interpretá-lo, para que serve um modelo, métricas que avaliam sua qualidade, etc. Este trabalho é um trabalho de ciência de dados, ou seja, não contempla apenas os conteúdos aprendidos na faculdade de estatística, mas sim as técnicas e estratégias aprendidas no mercado de trabalho que potencializam a estatística para resolução de problemas de forma criativa. Como resultado da análise, observou-se que o modelo de regressão logística teve um ótimo desempenho no quesito previsão e poderia ser usado para a empresa.
Resumo (inglês)
With the accelerated growth of the retail companies because of the virtual market, companies like Olist that are focused on approximate small businesses and the final consumers, are getting more space in the market every day. To the Olist, that has part of its income based on the quantity of the seller’s sales, it is interesting to know which sellers are not selling. Therefore the goal of this work is to identify the characteristics of the sellers that will sell. In the statistics we see a lot of techniques that are hard to comprehend for people that are not form this area, thus a second goal of this work is to be the most clear and simple that it possibly can, so it will be easily understood even by a person that is not from the area. Throughout the development of the work we learned about the model of Logistic Regression, how to interpret it, for what the model works, metrics that evaluate its quality, etcetera. This work is a data science work, which means that it doesn’t behold only the contents learned in college, but the techniques and strategies learned in the workspace that maximize the statistics to solve problems in a creative way. As a result of the analysis, it was observed that the logistic regression model performed well in terms of forecasting and could be used for the company.
Descrição
Idioma
Português