Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convolucionais e visual transformers
Carregando...
Data
Autores
Orientador
Casaca, Wallace Correa de Oliveira 

Coorientador
Pós-graduação
Curso de graduação
São José do Rio Preto - IBILCE - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
A tomografia computadorizada (TC) de tórax é uma ferramenta relevante para detectar lesões pulmonares características da Covid-19, mesmo em estágios precoces. Neste contexto, soluções automatizadas via aprendizado profundo, como Redes Neurais Convolucionais (CNN) e Visual Transformers (ViT), destacam-se como ferramentas coadjuvantes para diagnóstico, visando diminuir a carga de trabalho dos profissionais de saúde. Contudo, a escassez de dados de imagens de qualidade para doenças emergentes pode dificultar o desenvolvimento de modelos de inteligência artificial. Este trabalho objetiva investigar e comparar o desempenho de arquiteturas CNN e ViT na tarefa de classificação de imagens de TC de Covid-19. Para isso, implementa-se e avalia-se a arquitetura ConvNeXt (uma CNN) e um modelo ViT, comparando seu desempenho em cenários que variam o conjunto de dados e a estratégia de treinamento: tábula rasa, com transferência de aprendizado (TL) e ajuste fino parcial, ou com TL e ajuste fino completo, utilizando modelos pré-treinados na base ImageNet. A análise considera métricas como acurácia, F1-score e tempo de treinamento. Os resultados demonstram que a classificação automática é viável e que ambas as arquiteturas podem atingir resultados satisfatórios. Em situações de escassez de dados, TL e ajuste fino parcial é preferível para CNNs, enquanto o ajuste fino completo é mais adequado para ViTs. Em casos de treino tábula rasa com dados limitados, os modelos ViT apresentam treinamento mais rápido e resultados mais satisfatórios.
Resumo (inglês)
Computed tomography (CT) of the chest is a relevant tool for detecting lung lesions characteristic of Covid-19, even in early stages. In this context, automated solutions via deep learning, such as Convolutional Neural Networks (CNN) and Visual Transformers (ViT), stand out as supporting tools for diagnosis, aiming to reduce the workload of health professionals. However, the scarcity of quality image data for emerging diseases can hinder the development of artificial intelligence models. This work aims to investigate and compare the performance of CNN and ViT architectures in the task of classifying Covid-19 CT images. For this, the ConvNeXt architecture (a CNN) and a ViT model are implemented and evaluated, comparing their performance in scenarios that vary the dataset and the training strategy: \textit{tabula rasa}, with transfer learning (TL) and partial fine-tuning, or with TL and complete fine-tuning, using models pre-trained on the ImageNet database. The analysis considers metrics such as accuracy, F1-score, and training time. The results demonstrate that automatic classification is feasible and that both architectures can achieve satisfactory results. In situations of data scarcity, TL is preferable for CNNs, while TL with fine-tuning is more suitable for ViTs. In cases of \textit{tabula rasa} training with limited data, ViT models show faster training and more satisfactory results.
Descrição
Palavras-chave
Ciência da computação, Aprendizagem profunda (Aprendizado do computador), COVID-19 (Doença), Computer science, Deep learning (Machine learning), COVID-19 (Disease)
Idioma
Português
Citação
CARDANA, Pedro Benedicto de Melo. Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convulsionais e visual transformers. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2025.

