Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convolucionais e visual transformers

A tomografia computadorizada (TC) de tórax é uma ferramenta relevante para detectar lesões pulmonares características da Covid-19, mesmo em estágios precoces. Neste contexto, soluções automatizadas via aprendizado profundo, como Redes Neurais Convolucionais (CNN) e Visual Transformers (ViT), destacam-se como ferramentas coadjuvantes para diagnóstico, visando diminuir a carga de trabalho dos profissionais de saúde. Contudo, a escassez de dados de imagens de qualidade para doenças emergentes pode dificultar o desenvolvimento de modelos de inteligência artificial. Este trabalho objetiva investigar e comparar o desempenho de arquiteturas CNN e ViT na tarefa de classificação de imagens de TC de Covid-19. Para isso, implementa-se e avalia-se a arquitetura ConvNeXt (uma CNN) e um modelo ViT, comparando seu desempenho em cenários que variam o conjunto de dados e a estratégia de treinamento: tábula rasa, com transferência de aprendizado (TL) e ajuste fino parcial, ou com TL e ajuste fino completo, utilizando modelos pré-treinados na base ImageNet. A análise considera métricas como acurácia, F1-score e tempo de treinamento. Os resultados demonstram que a classificação automática é viável e que ambas as arquiteturas podem atingir resultados satisfatórios. Em situações de escassez de dados, TL e ajuste fino parcial é preferível para CNNs, enquanto o ajuste fino completo é mais adequado para ViTs. Em casos de treino tábula rasa com dados limitados, os modelos ViT apresentam treinamento mais rápido e resultados mais satisfatórios.

Resumo (inglês)

Computed tomography (CT) of the chest is a relevant tool for detecting lung lesions characteristic of Covid-19, even in early stages. In this context, automated solutions via deep learning, such as Convolutional Neural Networks (CNN) and Visual Transformers (ViT), stand out as supporting tools for diagnosis, aiming to reduce the workload of health professionals. However, the scarcity of quality image data for emerging diseases can hinder the development of artificial intelligence models. This work aims to investigate and compare the performance of CNN and ViT architectures in the task of classifying Covid-19 CT images. For this, the ConvNeXt architecture (a CNN) and a ViT model are implemented and evaluated, comparing their performance in scenarios that vary the dataset and the training strategy: \textit{tabula rasa}, with transfer learning (TL) and partial fine-tuning, or with TL and complete fine-tuning, using models pre-trained on the ImageNet database. The analysis considers metrics such as accuracy, F1-score, and training time. The results demonstrate that automatic classification is feasible and that both architectures can achieve satisfactory results. In situations of data scarcity, TL is preferable for CNNs, while TL with fine-tuning is more suitable for ViTs. In cases of \textit{tabula rasa} training with limited data, ViT models show faster training and more satisfactory results.

Palavras-chave

Ciência da computação, Aprendizagem profunda (Aprendizado do computador), COVID-19 (Doença), Computer science, Deep learning (Machine learning), COVID-19 (Disease)

Idioma

Português

Citação

CARDANA, Pedro Benedicto de Melo. Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convulsionais e visual transformers. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2025.

URI

https://hdl.handle.net/11449/316216

Coleções

São José do Rio Preto - IBILCE - Instituto de Biociências, Letras e Ciências Exatas

Estatísticas de acesso

Página do item completo

Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convolucionais e visual transformers

Arquivos

Data

Autores

Orientador

Coorientador

Pós-graduação

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Tipo

Direito de acesso

PlumX

Arquivos

Resumo

Resumo (português)

Resumo (inglês)

Descrição

Palavras-chave

Idioma

Citação

URI

Itens relacionados

Financiadores

Coleções

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação