Logo do repositório

Construção e tradução de datasets multimodais na saúde: um estudo para casos de Covid-19

Carregando...
Imagem de Miniatura

Orientador

Papa, João Paulo

Coorientador

Garcia, Gabriel Lino

Pós-graduação

Curso de graduação

Bauru - FC - Ciência da Computação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A Covid-19 é uma doença de fácil transmissão e capaz de deixar sequelas em seus infectados. Com o devido tratamento e diagnóstico precoce, as chances de sequelas e sintomas graves caem. Algumas estratégias são utilizadas para a celeridade da detecção, dentre elas, modelos de Aprendizado de Máquina treinados para avaliar unicamente imagem de raio-X, por exemplo, e realizar o diagnóstico baseado na imagem. Já os Grandes Modelos de Linguagem Multimodais são capazes de compreender dados de modalidades diferentes conjuntamente, como imagem e texto. Neste trabalho, propõe-se avaliar o uso de multimodalidade para diagnóstico de covid-19 e a averiguação do impacto que a multimodalidade causa no resultado obtido. Para isso, foi traduzido um dataset multimodal de covid-19 e avaliado o desempenho de dois modelos usando este dataset em uma análise multimodal e unimodais.

Resumo (inglês)

Covid-19 is an easily transmitted disease capable of leaving sequelae in those infected. With proper treatment and early diagnosis, the chances of sequelae and severe symptoms decrease. Some strategies are used to accelerate detection, among them, Machine Learning models trained to evaluate solely X-ray images, for example, and perform the diagnosis based on the image. Multimodal Large Language Models, on the other hand, are capable of understanding data from different modalities jointly, such as image and text. This work proposes the use of multimodality for covid-19 diagnosis and an investigation into the impact of multimodality on the obtained results. For this purpose, a multimodal covid-19 dataset was translated and the performance of two models using this dataset with multimodal and unimodals perspective was evaluated.

Descrição

Palavras-chave

Multimodal, Covid-19, VLM, Aprendizado de máquina, Radiografia, Machine learning, Radiography

Idioma

Português

Citação

KANASHIRO, Daniel Hideki Rocha. Construção e tradução de datasets multimodais na saúde: um estudo para casos de covid-19. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2025.

Itens relacionados

Financiadores

Unidades

Item type:Unidade,
Faculdade de Ciências
FC
Campus: Bauru


Departamentos

Cursos de graduação

Item type:Curso de graduação,

Programas de pós-graduação