Previsão de preços imobiliários com machine learning
Carregando...
Data
Orientador
Guido, Rodrigo Capobianco 

Coorientador
Pós-graduação
Curso de graduação
São José do Rio Preto - IBILCE - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
O início do século XXI foi um período marcado na história por grandes feitos na ciência, protagonizados por avanços significativos no campo da computação, com a evolução em diversos segmentos: processadores, GPUs, armazenamento, dados, entre outros. Esta evolução permitiu que alguns entraves no final do século passado fossem resolvidos, abrindo espaço para um novo cenário: os dados que antes eram escassos, se tornaram abundantes na era pós Big Data. Os dados em alta disponibilidade, somados com o conhecimento de negócio, provenientes da inteligência natural humana e o uso de inteligência artificial, gera predições de maior qualidade, reforçando a afirmação clássica na área de ciência de dados: “Dados de qualidade geram predições de qualidade”. Este trabalho traz a síntese dessa afirmação como propósito, utilizando técnicas de regressão para previsão de preços de imóveis na cidade de São José do Rio Preto usando atributos modernos como distância a pontos de interesse, uma abordagem que utiliza técnicas espaciais como modelagem de dados e a comparação de diferentes estratégias de remoção de outliers por clusters. Foi concluído que a melhor estratégia de remoção de outliers é a segmentação por latitude-longitude com 3 clusters e que modelos baseados em árvores (Random Forest e XGBoost) tiveram melhores performances frente a regressão linear, devido a natureza não linear presente na correlação do preço com as principais variáveis preditoras. Também foi analisada a importância dos atributos nos 3 melhores resultados, apesar da dominância das características estruturais na estimativa dos preços, como número de suítes, banheiros e área útil, há também uma leve influência da distância a pontos de interesses nesse cálculo, especialmente de Shoppings, Hospitais, Farmácias, Faculdades e Escolas
Particulares ou Públicas
Resumo (inglês)
The beginning of the 21st century was a period marked in history by great achievements in science, led by significant advances in the field of computing, with evolution in several segments: processors, GPUs, storage, data, among others. This evolution allowed some obstacles from the end of the last century to be solved, paving the way for a new scenario: data that was once scarce became abundant in the post-Big Data era. Readily available data, combined with business knowledge from natural human intelligence and the use of artificial intelligence, generates higher quality predictions, reinforcing the classic statement in the field of data science: "Quality data generates quality predictions". This work synthesizes this statement as
its purpose, using regression techniques to predict real estate prices in the city of São José do Rio Preto using distance to points of interest, an approach that uses spatial techniques such as data modeling and the comparison of different outlier removal strategies by clusters. It was concluded that the best strategy for outlier removal is segmentation by latitude-longitude with 3 clusters and that tree-based models (Random Forest and XGBoost) had better performance compared to linear regression, due to the non-linear nature present in the correlation of price with the main predictor variables. The importance of attributes in the top 3 results was also analyzed; despite the dominance of structural characteristics in price estimation, such as the number of suites, bathrooms, and usable area, there is also a slight influence of the distance to points of interest in this calculation, especially to Shopping Malls, Hospitals, Pharmacies, Colleges, and Private or Public Schools.
Descrição
Palavras-chave
Inteligência artificial, Ciência de dados, Previsão de preços, Aprendizado de máquina, Clusterização, Mercado imobiliário, Econometria espacial, Artificial intelligence, Data science, Price prediction, Machine learning, Clustering, Real estate market, Spatial econometrics
Idioma
Português
Citação
FARIA, Guilherme Lourenção Brandt de. Previsão de preços imobiliários com Machine Learning. 2025. 61 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista “Júlio de Mesquita Filho”, São José do Rio Preto, 2025.


