Estudo e comparação de novas arquiteturas de aprendizado profundo para classificação de incêndios florestais em múltiplos domínios

Métodos modernos de visão computacional e redes de aprendizado profundo têm sido amplamente aplicados para automatizar a classificação de imagens de incêndios florestais, contribuindo para um monitoramento mais eficiente desses eventos. Considerando a diversidade de abordagens, este estudo investiga e compara o desempenho de modelos baseados em Convolutional Neural Networks (CNNs) e Vision Transformers (ViTs) em cenários de incêndios com distintas características visuais. A metodologia envolveu a seleção de três bases de dados rotuladas, a definição de um pipeline de comparação, o treinamento e a validação dos modelos, seguidos de uma avaliação multidomínio. Os resultados, aferidos por métricas de classificação, indicam que as CNNs capturam detalhes locais com maior eficácia, enquanto os ViTs demonstram limitações, possivelmente devido ao volume reduzido de imagens de treino. Além disso, constatou-se que a complexidade do modelo não determina sua eficiência, mas deve ser considerada quando há restrições computacionais. Adicionalmente, as características intrínsecas das bases de dados influenciam diretamente no desempenho, sendo um fator crucial na escolha e treinamento das arquiteturas. Assim, esta monografia contribui para orientar a seleção de arquiteturas de aprendizado profundo em tarefas de classificação de incêndios florestais, considerando tanto a eficácia quanto a eficiência computacional.

Resumo (inglês)

Modern computer vision methods and deep learning networks have been widely applied to automate the classification of wildfire images, contributing to more efficient event monitoring. Considering the diversity of approaches, this study investigates and compares the performance of models based on Convolutional Neural Networks (CNNs) and Vision Transformers (ViTs) across fire scenarios with distinct visual characteristics. The methodology involved selecting three labeled datasets, defining a comparison pipeline, training and validating the models, followed by a multi-domain evaluation. The results, measured by classification metrics, indicate that CNNs capture local details more effectively, whereas ViTs show limitations, possibly due to the small volume of training images. Furthermore, it was found that model complexity does not determine its efficiency, but should be considered when there are computational constraints. Additionally, the intrinsic characteristics of the datasets directly influence performance, making them a crucial factor in the selection and training of architectures. Thus, this work contributes to guiding the selection of deep learning architectures for wildfire classification tasks, considering both effectiveness and computational efficiency.

Palavras-chave

Incêndios florestais, Visão computacional, Aprendizado profundo, Classificação de imagens

Idioma

Português

Citação

STOPA, Lara Cesquini. Estudo e comparação de novas arquiteturas de aprendizado profundo para classificação de incêndios florestais em múltiplos domínios. 2025. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Estadual Paulista, Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto, 2025.

URI

https://hdl.handle.net/11449/316274

Coleções

São José do Rio Preto - IBILCE - Instituto de Biociências, Letras e Ciências Exatas

Estatísticas de acesso

Página do item completo

Estudo e comparação de novas arquiteturas de aprendizado profundo para classificação de incêndios florestais em múltiplos domínios

Arquivos

Data

Autores

Orientador

Coorientador

Pós-graduação

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Tipo

Direito de acesso

PlumX

Arquivos

Resumo

Resumo (português)

Resumo (inglês)

Descrição

Palavras-chave

Idioma

Citação

URI

Itens relacionados

Financiadores

Coleções

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação