Auxílio ao diagnóstico de acidente vascular cerebral utilizando redes de boltzmann e agregação de informação com a transformada de Fourier

Carregando...
Imagem de Miniatura

Data

2023-06-07

Orientador

Papa, João Paulo

Coorientador

Pós-graduação

Ciência da Computação - FC

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Na última década, técnicas de aprendizado profundo (do inglês, Deep Learning - DL) têm sido amplamente pesquisadas e aplicadas a diversos problemas, abrangendo uma vasta gama que vai desde sistemas de recomendação de produtos para consumidores, até aplicações na área médica, como a classificação de acidente vascular cerebral (AVC), e do pré-processamento de imagens médicas. No entanto, mesmo com excelentes resultados nas tarefas de visão computacional mencionadas, ainda há áreas a serem exploradas à medida que os problemas tornam-se cada vez mais complexos, ou as aplicações do mundo real exigem novas restrições que prejudicam/limitam o desempenho das técnicas estado-da-arte. Com relação à classificação de acidente vascular cerebral, um problema de suprimento sanguíneo cerebral, pode-se observar algumas dificuldades nas pesquisas acadêmicas realizadas, como a falta de grandes conjuntos de dados para treinar redes neurais profundas, falta de imagens anotadas para utilizar o paradigma de aprendizado supervisionado, e a dificuldade em encontrar trabalhos com redes neurais de baixa complexidade, como as Máquinas de Boltzmann Restritas. Deste modo, o presente trabalho atua no estudo e desenvolvimento de modelos baseados em Máquinas de Boltzmann aplicados no contexto da classificação de acidente vascular cerebral, empregando redes neurais artificiais treinadas através dos paradigmas de aprendizado não-supervisionado e supervisionado, utilizando um banco de dados público com baixo volume de dados rotulados (principalmente para o ajuste-fino supervisionado), concomitante à transformada de Fourier para adicionar informação relevante aos modelos. Os resultados atingidos foram expressivos e apontam para um novo estado-da-arte do conjunto de dados empregado nesta tese, com taxas de acerto médias iguais a 99,94%. Além disso, a metodologia proposta que adiciona informação multimodal por meio da transformada de Fourier impactou positivamente no desempenho preditivo dos modelos. Por fim, a abordagem empregada utilizando Máquinas de Boltzmann Restritas e Redes de Crença Profundas, bem como suas variantes convolucionais, são mais simples que as estado-da-arte baseadas em redes neurais convolucionais padrão.

Resumo (inglês)

In the last decade, deep learning techniques (DL) have been widely researched and applied to several problems, covering a wide range that goes from product recommendation systems for consumers to noble applications in the medical field, such as stroke classification and medical image pre-processing. However, even with excellent results in the mentioned computer vision tasks, there are still areas to explore as the problems become more and more complex, or real-world applications prevent new restrictions that harm/limit the performance of the current techniques’ state-of-the-art. Regarding the classification of stroke, a problem of cerebral blood supply, some difficulties can be observed in the academic research carried out, such as the lack of large datasets to train Deep Neural Networks, lack of annotated images to use the supervised learning paradigm, and the difficulty in finding works with low complexity neural networks, such as Restricted Boltzmann Machines. In this way, the present thesis acts in the study and development of models based on Boltzmann Machines applied in the context of stroke classification, using artificial neural networks trained through the unsupervised and supervised learning paradigms, employing a public database with a low volume of labeled data (mainly for supervised fine-tuning), concomitantly with Fourier transform to add relevant information to the models. The achieved results were expressive and pointed to a new state-of-the-art for the dataset employed in this thesis, with an average accuracy of 99.94%. In addition, adding multimodal information through the Fourier transform, positively impacting the predictive performance of the models. Finally, the proposed approach with Restricted Boltzmann Machines and Deep Belief Networks, as well as their convolutional variants, is simpler than the state-of-the-art based on standard convolutional neural networks.

Descrição

Idioma

Português

Como citar

Itens relacionados

Financiadores