Registro de imagens de retina via aprendizado profundo não-supervisionado

Benvenuto, Giovana Augusta

Registro de imagens de retina via aprendizado profundo não-supervisionado

Arquivos

benvenuto_ga_me_prud.pdf (17.3 MB)

Data

2022-03-03

Autores

Benvenuto, Giovana Augusta

Orientador

Casaca, Wallace Correa de Oliveira

Pós-graduação

Ciência da Computação - FCT

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso aberto

Resumo

Resumo (português)

O problema de registro de imagens consiste em encontrar uma transformação geométrica que possibilite alinhar duas ou mais imagens. Este problema é importante no contexto médico, onde é comum o uso de exames recorrentes a partir da captura e armazenamento de imagens a fim de amparar diagnósticos e monitorar o progresso de doenças, principalmente em especialidades como a oftalmologia. Nessa frente, são utilizadas imagens de retina (fundus) que, em diversas circunstâncias, precisam ser comparadas com imagens adquiridas em diferentes instantes ou, ainda, por aparelhos distintos, o que torna essa tarefa difícil de ser conduzida manualmente. Os avanços da tecnologia permitiram um crescimento na literatura de registro de imagens, que emprega técnicas de Inteligência Artificial para a resolução desse problema. Apesar dos recentes progressos nessa linha, não há um consenso a respeito de uma metodologia ideal para uso sistemático diário de uma ferramenta de registro por profissionais oftalmologistas. Neste trabalho, foi abordada a classe de imagens médicas de fundus a partir da proposta de um framework computacional para realizar a tarefa de registro por meio de uma Rede Neural Convolucional combinada a um módulo de Transformação Espacial. Uma métrica de similaridade foi também explorada para calcular a perda da rede, de forma a originar um pipeline de aprendizado completamente não-supervisionado, isto é, que descarta o uso de dados de ground-truth na realização desta tarefa. Os experimentos realizados demonstraram que o método proposto, depois de treinado, foi capaz de lidar com diferentes categorias de imagens de fundus, apresentando resultados superiores quando comparado com métodos recentes de Otimização e de Aprendizado Profundo presentes na literatura.

Resumo (inglês)

The image registration problem consists of finding a geometric transformation which aligns a given set of images. Such a problem is important in the medical context, where it the use of exams taken from images is a common task in order to support diagnoses and monitor the progress of diseases, especially in specialties such as ophthalmology. On this field of study, retinal (fundus) images are used under different circumstances, as they have to be compared with other particular images acquired at different times or even by different devices, which makes this task difficult to be carried out manually. Advances in technology have allowed a growth in the registration literature, which employs Artificial intelligence techniques to solve such a problem. Despite recent progress in this area, there is no consensus on an ideal methodology for the systematic daily use of a registration tool by ophthalmic professionals. Therefore, in this work, we introduce a framework for registering fundus images by combining a Convolutional Neural Network with a Spatial Transformation module. We also take a similarity metric to calculate the loss of network in order to have a fully unsupervised pipeline, thus discarding the use of ground-truth data when carrying out the registration task. From an extensive battery of experimental tests, we conclude that our trained model was capable of dealing with different categories of fundus images while surpassing recent optimization and Deep Learning-based methods from the registration literature.