Desenvolvimento de rede neural convolucional utilizando classificadores para predição da agressividade biológica de subtipos de câncer de mama a partir de imagens de ressonância magnética de pacientes de hospital de referência do interior do estado de São Paulo

dc.contributor.advisorFerreira, Ana Silvia Sartori Barraviera Seabra [UNESP]
dc.contributor.advisorPessoa, Eduardo Carvalho [UNESP]
dc.contributor.authorEsposto, Fábio Augusto da Silva
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2023-04-20T12:27:10Z
dc.date.available2023-04-20T12:27:10Z
dc.date.issued2023-02-24
dc.description.abstractIntrodução: O Câncer de Mama é uma doença complexa e heterogênea, atualmente classificada em subtipos específicos que estão associados a diferentes prognósticos. A biópsia continua sendo o padrão-ouro para identificação dos biomarcadores, mas tem importantes limitações. A utilização de Aprendizagem de Máquina (AM) não é uma novidade na pesquisa do câncer. Redes neurais artificiais (RNAs) têm sido usadas na detecção e diagnóstico de câncer há aproximadamente 20 anos. Objetivos: Assim, essa pesquisa tem como objetivo desenvolver uma rede neural convolucional (RNC) que possa prever o subtipo específicos de um câncer de mama, classificados pela imuno-histoquímica, com base em imagens obtidas por ressonância magnética. Métodos: O estudo foi realizado no Hospital das Clínicas da Faculdade de Medicina de Botucatu em exames de ressonância magnética de 76 pacientes de gênero feminino. Os cortes das imagens de ressonância magnética foram usados para segmentação dos subtipos tumorais. Uma arquitetura de RNC foi projetada com uma máquina de Boltzmann convolucional personalizada utilizando exame de ressonância magnética de 76 pacientes, contendo 10 imagens cada, que foram utilizadas para treinamento e validação da RNC. As imagens foram ajustadas para validação. Um conjunto balanceado de 40 imagens (exame de 4 pacientes) foram utilizadas para definição de testes, sendo imagens de uma paciente para cada subtipo tumoral (Luminal A, Luminal B, HER2+ e Triplo Negativo). O código do software foi escrito em Python em uma estação de trabalho pessoal. Resultados e discussão: Dez imagens de cada subtipo tumoral foram avaliados (Luminal A, Luminal B, HER2+ e triplo negativo). Foram analisados o desempenho de cinco métodos classificadores utilizados em Machine Learning: K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Gaussian Naïve Bayes (GNB), SOFTMAX e Random Forest (RF). Esses algoritmos possuem variáveis definidas antes do treinamento, chamadas de hiperparâmetros. As métricas do conjunto de teste foram avaliadas de acordo com: precisão, revocação (recall), resultado f1 (f1 score) e acurácia. O algoritmo classificador SoftMax apresentou um resultado de melhor comparação em relação aos demais classificadores, em todas as métricas analisadas, apresentando a matriz de confusão com melhor acurácia, com média aproximada de 35% de precisão. Deste modo, optou-se por realizar testes com uma classificação binária (hormonal e não hormonal) com o algoritmo classificador de melhor resultado no estudo, o SoftMax. Assim, atingiu-se uma porcentagem de acurácia de 65%, apresentando-se como um classificador mais promissor na classificação binária (hormonal e não hormonal) de câncer de mama. Considerações finais: A análise de ressonância magnética de câncer de mama com a utilização de uma nova Rede Neural Convolucional pode realizar uma classificação binária de câncer de mama com uma precisão de 65%. Evidências mostram que conjuntos de dados maiores levam a um maior desempenho do modelo proposto. Assim, como continuidade desta pesquisa, serão utilizados maiores números de conjuntos de dados e outros classificadores em novos testes, com intuito de obter resultados mais promissores.pt
dc.description.abstractIntroduction: Breast Cancer is a complex and heterogeneous disease, currently classified into specific subtypes that are associated with different prognoses. Biopsy remains the gold standard for identifying biomarkers, but it has important limitations. The use of Machine Learning (ML) is not new in cancer research. Artificial neural networks (ANNs) have been used in cancer detection and diagnosis for approximately 20 years. Objectives: Thus, this research aims to develop a convolutional neural network (CNN) that can predict the molecular subtype of breast cancer based on images obtained by magnetic resonance imaging. Methods: The study was carried out at the Hospital das Clínicas da Faculdade de Medicina de Botucatu in magnetic resonance imaging of 76 female patients. The sections of magnetic resonance images were used for segmentation of tumor subtypes. An RNC architecture was designed with a customized convolutional Boltzmann machine using magnetic resonance imaging of 76 patients, containing 10 images each, which were used for training and validation of the RNC. Images were adjusted for validation. A balanced set of 40 images (examination of 4 patients) were used to define tests, with images of one patient for each tumor subtype (Luminal A, Luminal B, HER2+ and Triple Negative). The software code was written in Python on a personal workstation. Discussion and Results: Ten images of each tumor subtype were evaluated (Luminal A, Luminal B, HER2+ and triple negative). The performance of five classifier methods used in Machine Learning were evaluated: K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Gaussian Naïve Bayes (GNB), SOFTMAX and Random Forest (RF). These algorithms have variables defined before training, called hyperparameters. The test set metrics were evaluated according to: precision, recall, f1 score and accuracy. The SoftMax classifier algorithm presented a result of better comparison in relation to the other classifiers, in all analyzed metrics, presenting the confusion matrix with better accuracy, with an approximate average of 35% of precision. Thus, it was decided to carry out tests with a binary classification (hormonal and non-hormonal) with the classification algorithm with the best result in the study, SoftMax. Thus, an accuracy percentage of 62% was reached, presenting itself as a more promising classifier in the binary classification (hormonal and non-hormonal) of breast cancer. Final considerations: Breast cancer magnetic resonance analysis using a new Convolutional Neural Network can perform a binary classification of breast cancer with an accuracy of 62%. Evidence shows that larger datasets lead to greater performance of the proposed model. Thus, as a continuation of this research, larger numbers of datasets and other classifiers will be used in new tests, with the aim of obtaining more promising results.en
dc.identifier.capes33004064079P5
dc.identifier.urihttp://hdl.handle.net/11449/243059
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectMachine learningen
dc.subjectBreast neoplasmsen
dc.subjectArtificial neural networksen
dc.subjectArtificial intelligenceen
dc.subjectRedes neurais artificiaispt
dc.subjectAprendizado de máquinapt
dc.subjectInteligência artificialpt
dc.subjectCâncer de mamapt
dc.subjectCarcinoma de mamapt
dc.titleDesenvolvimento de rede neural convolucional utilizando classificadores para predição da agressividade biológica de subtipos de câncer de mama a partir de imagens de ressonância magnética de pacientes de hospital de referência do interior do estado de São Paulopt
dc.title.alternativeDevelopment of a convolutional neural network using classifiers to predict the biological aggressivity of breast cancer subtypes from magnetic resonance images of patients at a reference hospital in the interior of the state of São Pauloen
dc.typeDissertação de mestrado
unesp.campusUniversidade Estadual Paulista (Unesp), Faculdade de Medicina, Botucatupt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramPesquisa e Desenvolvimento (Biotecnologia Médica) - FMBpt
unesp.knowledgeAreaBiotecnologiapt
unesp.researchAreaInovação e Tecnologia em Saúdept

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
esposto_fas_me_bot.pdf
Tamanho:
1.69 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
3.16 KB
Formato:
Item-specific license agreed upon to submission
Descrição: