Atenção!


O atendimento às questões referentes ao Repositório Institucional será interrompido entre os dias 20 de dezembro de 2025 a 4 de janeiro de 2026.

Pedimos a sua compreensão e aproveitamos para desejar boas festas!

Logo do repositório

Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convolucionais e visual transformers

Carregando...
Imagem de Miniatura

Orientador

Casaca, Wallace Correa de Oliveira

Coorientador

Pós-graduação

Curso de graduação

São José do Rio Preto - IBILCE - Ciência da Computação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A tomografia computadorizada (TC) de tórax é uma ferramenta relevante para detectar lesões pulmonares características da Covid-19, mesmo em estágios precoces. Neste contexto, soluções automatizadas via aprendizado profundo, como Redes Neurais Convolucionais (CNN) e Visual Transformers (ViT), destacam-se como ferramentas coadjuvantes para diagnóstico, visando diminuir a carga de trabalho dos profissionais de saúde. Contudo, a escassez de dados de imagens de qualidade para doenças emergentes pode dificultar o desenvolvimento de modelos de inteligência artificial. Este trabalho objetiva investigar e comparar o desempenho de arquiteturas CNN e ViT na tarefa de classificação de imagens de TC de Covid-19. Para isso, implementa-se e avalia-se a arquitetura ConvNeXt (uma CNN) e um modelo ViT, comparando seu desempenho em cenários que variam o conjunto de dados e a estratégia de treinamento: tábula rasa, com transferência de aprendizado (TL) e ajuste fino parcial, ou com TL e ajuste fino completo, utilizando modelos pré-treinados na base ImageNet. A análise considera métricas como acurácia, F1-score e tempo de treinamento. Os resultados demonstram que a classificação automática é viável e que ambas as arquiteturas podem atingir resultados satisfatórios. Em situações de escassez de dados, TL e ajuste fino parcial é preferível para CNNs, enquanto o ajuste fino completo é mais adequado para ViTs. Em casos de treino tábula rasa com dados limitados, os modelos ViT apresentam treinamento mais rápido e resultados mais satisfatórios.

Resumo (inglês)

Computed tomography (CT) of the chest is a relevant tool for detecting lung lesions characteristic of Covid-19, even in early stages. In this context, automated solutions via deep learning, such as Convolutional Neural Networks (CNN) and Visual Transformers (ViT), stand out as supporting tools for diagnosis, aiming to reduce the workload of health professionals. However, the scarcity of quality image data for emerging diseases can hinder the development of artificial intelligence models. This work aims to investigate and compare the performance of CNN and ViT architectures in the task of classifying Covid-19 CT images. For this, the ConvNeXt architecture (a CNN) and a ViT model are implemented and evaluated, comparing their performance in scenarios that vary the dataset and the training strategy: \textit{tabula rasa}, with transfer learning (TL) and partial fine-tuning, or with TL and complete fine-tuning, using models pre-trained on the ImageNet database. The analysis considers metrics such as accuracy, F1-score, and training time. The results demonstrate that automatic classification is feasible and that both architectures can achieve satisfactory results. In situations of data scarcity, TL is preferable for CNNs, while TL with fine-tuning is more suitable for ViTs. In cases of \textit{tabula rasa} training with limited data, ViT models show faster training and more satisfactory results.

Descrição

Palavras-chave

Ciência da computação, Aprendizagem profunda (Aprendizado do computador), COVID-19 (Doença), Computer science, Deep learning (Machine learning), COVID-19 (Disease)

Idioma

Português

Citação

CARDANA, Pedro Benedicto de Melo. Classificação de imagens de tomografia computadorizada de covid-19 via redes neurais convulsionais e visual transformers. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2025.

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação