Logo do repositório

Previsão de preços imobiliários com machine learning

Carregando...
Imagem de Miniatura

Orientador

Guido, Rodrigo Capobianco

Coorientador

Pós-graduação

Curso de graduação

São José do Rio Preto - IBILCE - Ciência da Computação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

O início do século XXI foi um período marcado na história por grandes feitos na ciência, protagonizados por avanços significativos no campo da computação, com a evolução em diversos segmentos: processadores, GPUs, armazenamento, dados, entre outros. Esta evolução permitiu que alguns entraves no final do século passado fossem resolvidos, abrindo espaço para um novo cenário: os dados que antes eram escassos, se tornaram abundantes na era pós Big Data. Os dados em alta disponibilidade, somados com o conhecimento de negócio, provenientes da inteligência natural humana e o uso de inteligência artificial, gera predições de maior qualidade, reforçando a afirmação clássica na área de ciência de dados: “Dados de qualidade geram predições de qualidade”. Este trabalho traz a síntese dessa afirmação como propósito, utilizando técnicas de regressão para previsão de preços de imóveis na cidade de São José do Rio Preto usando atributos modernos como distância a pontos de interesse, uma abordagem que utiliza técnicas espaciais como modelagem de dados e a comparação de diferentes estratégias de remoção de outliers por clusters. Foi concluído que a melhor estratégia de remoção de outliers é a segmentação por latitude-longitude com 3 clusters e que modelos baseados em árvores (Random Forest e XGBoost) tiveram melhores performances frente a regressão linear, devido a natureza não linear presente na correlação do preço com as principais variáveis preditoras. Também foi analisada a importância dos atributos nos 3 melhores resultados, apesar da dominância das características estruturais na estimativa dos preços, como número de suítes, banheiros e área útil, há também uma leve influência da distância a pontos de interesses nesse cálculo, especialmente de Shoppings, Hospitais, Farmácias, Faculdades e Escolas Particulares ou Públicas

Resumo (inglês)

The beginning of the 21st century was a period marked in history by great achievements in science, led by significant advances in the field of computing, with evolution in several segments: processors, GPUs, storage, data, among others. This evolution allowed some obstacles from the end of the last century to be solved, paving the way for a new scenario: data that was once scarce became abundant in the post-Big Data era. Readily available data, combined with business knowledge from natural human intelligence and the use of artificial intelligence, generates higher quality predictions, reinforcing the classic statement in the field of data science: "Quality data generates quality predictions". This work synthesizes this statement as its purpose, using regression techniques to predict real estate prices in the city of São José do Rio Preto using distance to points of interest, an approach that uses spatial techniques such as data modeling and the comparison of different outlier removal strategies by clusters. It was concluded that the best strategy for outlier removal is segmentation by latitude-longitude with 3 clusters and that tree-based models (Random Forest and XGBoost) had better performance compared to linear regression, due to the non-linear nature present in the correlation of price with the main predictor variables. The importance of attributes in the top 3 results was also analyzed; despite the dominance of structural characteristics in price estimation, such as the number of suites, bathrooms, and usable area, there is also a slight influence of the distance to points of interest in this calculation, especially to Shopping Malls, Hospitals, Pharmacies, Colleges, and Private or Public Schools.

Descrição

Palavras-chave

Inteligência artificial, Ciência de dados, Previsão de preços, Aprendizado de máquina, Clusterização, Mercado imobiliário, Econometria espacial, Artificial intelligence, Data science, Price prediction, Machine learning, Clustering, Real estate market, Spatial econometrics

Idioma

Português

Citação

FARIA, Guilherme Lourenção Brandt de. Previsão de preços imobiliários com Machine Learning. 2025. 61 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista “Júlio de Mesquita Filho”, São José do Rio Preto, 2025.

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação