Estudo e comparação de novas arquiteturas de aprendizado profundo para classificação de incêndios florestais em múltiplos domínios
Carregando...
Data
Autores
Orientador
Lucas Correia Ribas 

Coorientador
Pós-graduação
Curso de graduação
São José do Rio Preto - IBILCE - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Métodos modernos de visão computacional e redes de aprendizado profundo têm sido amplamente aplicados para automatizar a classificação de imagens de incêndios florestais, contribuindo para um monitoramento mais eficiente desses eventos. Considerando a diversidade de abordagens, este estudo investiga e compara o desempenho de modelos baseados em Convolutional Neural Networks (CNNs) e Vision Transformers (ViTs) em cenários de incêndios com distintas características visuais. A metodologia envolveu a seleção de três bases de dados rotuladas, a definição de um pipeline de comparação, o treinamento e a validação dos modelos, seguidos de uma avaliação multidomínio. Os resultados, aferidos por métricas de classificação, indicam que as CNNs capturam detalhes locais com maior eficácia, enquanto os ViTs demonstram limitações, possivelmente devido ao volume reduzido de imagens de treino. Além disso, constatou-se que a complexidade do modelo não determina sua eficiência, mas deve ser considerada quando há restrições computacionais. Adicionalmente, as características intrínsecas das bases de dados influenciam diretamente no desempenho, sendo um fator crucial na escolha e treinamento das arquiteturas. Assim, esta monografia contribui para orientar a seleção de arquiteturas de aprendizado profundo em tarefas de classificação de incêndios florestais, considerando tanto a eficácia quanto a eficiência computacional.
Resumo (inglês)
Modern computer vision methods and deep learning networks have been widely applied to automate the classification of wildfire images, contributing to more efficient event monitoring. Considering the diversity of approaches, this study investigates and compares the performance of models based on Convolutional Neural Networks (CNNs) and Vision Transformers (ViTs) across fire scenarios with distinct visual characteristics. The methodology involved selecting three labeled datasets, defining a comparison pipeline, training and validating the models, followed by a multi-domain evaluation. The results, measured by classification metrics, indicate that CNNs capture local details more effectively, whereas ViTs show limitations, possibly due to the small volume of training images. Furthermore, it was found that model complexity does not determine its efficiency, but should be considered when there are computational constraints. Additionally, the intrinsic characteristics of the datasets directly influence performance, making them a crucial factor in the selection and training of architectures. Thus, this work contributes to guiding the selection of deep learning architectures for wildfire classification tasks, considering both effectiveness and computational efficiency.
Descrição
Palavras-chave
Incêndios florestais, Visão computacional, Aprendizado profundo, Classificação de imagens
Idioma
Português
Citação
STOPA, Lara Cesquini. Estudo e comparação de novas arquiteturas de aprendizado profundo para classificação de incêndios florestais em múltiplos domínios. 2025. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Estadual Paulista, Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto, 2025.

