UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” FACULDADE DE MEDICINA Edson Luiz Pontes Perger Aprendizado de Máquina Aplicado ao Diagnóstico por Imagem para Aplicação em Prick Test Tese apresentada à Faculdade de Medicina, Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de Botucatu, para obtenção do título de Doutor em Pesquisa e Desenvolvimento – Biotecnologia Médica. Orientador: Prof. Dr. Rafael Plana Simões Botucatu 2024 Edson Luiz Pontes Perger Aprendizado de Máquina Aplicado ao Diagnóstico por Imagem para Aplicação em Prick Test Tese apresentada à Faculdade de Medicina, Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de Botucatu, para obtenção do título de Doutor em Pesquisa e Desenvolvimento – Biotecnologia Médica. Orientador: Prof. Dr. Rafael Plana Simões Botucatu 2024 FICHA CATALOGRÁFICA ELABORADA PELA SEÇÃO TÉC. AQUIS. TRATAMENTO DA INFORM. DIVISÃO TÉCNICA DE BIBLIOTECA E DOCUMENTAÇÃO - CÂMPUS DE BOTUCATU - UNESP BIBLIOTECÁRIA RESPONSÁVEL: ROSANGELA APARECIDA LOBO-CRB 8/7500 Perger, Edson Luiz Pontes. Aprendizado de máquina aplicado ao diagnóstico por imagem para aplicação em Prick Test / Edson Luiz Pontes Perger. - Botucatu, 2024 Tese (doutorado) - Universidade Estadual Paulista (UNESP), Faculdade de Medicina, Botucatu Orientador: Rafael Plana Simões Capes: 10301038 1. Aprendizado profundo. 2. Diagnóstico por imagem. 3. Hipersensibilidade imediata. 4. Inteligência artificial. 5. Testes cutâneos. Palavras-chave: Aprendizado profundo; Diagnóstico por imageamento; Hipersensibilidade mediada por IgE; Inteligência artificial; Testes cutâneos. Resumo O Teste Cutâneo de Puntura (TCP) é utilizado para diagnosticar a sensibilização a antígenos por meio de uma resposta mediada pela Imunoglobulina E (IgE). Para tornar esse diagnóstico menos dependente da interpretação humana, o presente estudo propôs um método alternativo para inferir sobre a reação alérgica utilizando aprendizado profundo, propõem ainda o desenvolvimento de um aplicativo mobile e web para agilizar o processo do especialista, além de poder ser acessado em qualquer lugar e aplica a metodologia em um conjunto de imagens de microscópio para verificar a reprodutibilidade do método proposto em outros casos de análise e/ou diagnóstico por imagem. Um conjunto de dados com 5844 imagens de TCP foi criado e utilizado para treinar uma rede neural totalmente convolucional e inferir um modelo de segmentação da pápula (modelo de ML). O modelo inferido foi comparado a dois outros métodos: 1 - aproximação da área da pápula como um círculo com o diâmetro médio medido por um médico; e 2 - segmentação de imagem assistida (AIS), considerada o método mais preciso. A análise de Bland-Altman mostrou que a diferença entre os métodos não está correlacionada com a magnitude da área e que as estimativas produzidas por diferentes métodos podem ser relacionadas pela adição ou subtração do respectivo valor de viés. O modelo de machine learning (ML) apresentou uma precisão de segmentação de 85,82% e uma precisão de detecção de 93,55%, demonstrando uma forte correlação com o método AIS. O protocolo desenvolvido possui potencial para automatizar a interpretação da reação do TCP e ser utilizado na prática clínica no futuro, especialmente com o uso do aplicativo desenvolvido, que apresentou um desempenho aceitável. Palavras-chave: aprendizado profundo; inteligência artificial; hipersensibilidade mediada por IgE; diagnóstico por imageamento; testes cutâneos Abstract The Skin Prick Test (SPT) is utilized to diagnose sensitization to antigens through an Immunoglobulin E (IgE)-mediated response. To reduce the reliance on human interpretation for this diagnosis, the present study proposes an alternative method to infer allergic reactions using deep learning. Additionally, it proposes the development of a mobile and web application to expedite the specialist's process, as well as to enable accessibility from anywhere, applying the methodology to a set of microscope images to verify the reproducibility of the proposed method in other cases of image analysis and/or diagnosis. A dataset containing 5844 SPT images was created and utilized to train a fully convolutional neural network and infer a papule segmentation model (ML model). The inferred model was compared to two other methods: 1 - approximation of the papule area as a circle with the average diameter measured by a physician; and 2 - Assisted Image Segmentation (AIS), considered the most accurate method. Bland-Altman analysis showed that the difference between the methods is not correlated with the magnitude of the area and that the estimates produced by different methods can be related by adding or subtracting the respective bias value. The machine learning (ML) model demonstrated a segmentation accuracy of 85.82% and a detection accuracy of 93.55%, showing a strong correlation with the AIS method. The developed protocol has the potential to automate the interpretation of the TCP reaction and to be used in clinical practice in the future, particularly with the use of the developed application, which demonstrated acceptable performance. Keywords: deep learning; artificial intelligence; mediated IgE hypersensitivity; diagnostic imaging; skin tests. Lista de ilustrações Figura 1 - Fotografia ilustrando os possíveis contornos irregulares da área de hiperemia. 7 Figura 2 - Foto capturada após 15 minutos da aplicação da punção. 10 Figura 3 - Foto original em A e editada (segmentada) em B. 11 Figura 4 - Arquitetura do fluxograma da Plataforma desenvolvida na Microsoft Azure. 15 Figura 5 - Imagem contendo as pápulas segmentadas e identificadas por um número e um relatório no canto superior esquerdo contendo a área de cada pápula em cm². 16 Figura 6 - Braço do paciente 15 minutos após a punção de histamina (A) e segmentação pelo modelo de ML onde ocorreu um erro do Tipo I (B). 17 Figura 7 - Análises de Bland-Altman para ML x Médico (A), ML x AIS (B) e Médico x AIS (C). Gráficos de correlação de Pearson entre ML e Médico (D), ML e AIS (E) e Médico e AIS (F). 18 Figura 8 - Funções de probabilidade cumulativa para as áreas estimadas pelos três métodos para os dados originais (A) e após adicionar o viés entre um método e o método médico (B). 19 Figura 9 - Telas do aplicativo desenvolvido: A) Splash Screen, B) Login, C) Cadastro, caso não seja cadastrado na plataforma, D) Principal (Home), E) Ir para captura de foto e F) Captura e upload da foto (Câmera do smartphone acionada). 22 Figura 10 - Continuação das telas do aplicativo desenvolvido: G) Confirmação da segmentação, H) Resultado das medidas, I) Menu para gerar PDF do relatório médico, encerrar atendimento ou continuar atendimento e J) Tela de desktop para visualização das imagens a distância na mesma etapa do resultado das medidas (H). 23 Figura 11 - Tabela contendo tipos e configurações de smartphones e velocidade de Internet testados, demonstrando o tempo despendido para realizar o teste de software. 24 Figura 12 - Representação da análise da diferenciação osteogênica (A) e histomorfométrica (B). 25 Figura 13 - Representação da análise da histomorfométrica da diferenciação osteogênica (A) e ML (B). 26 Sumário 1. INTRODUÇÃO 6 2. JUSTIFICATIVA 8 3. OBJETIVOS 9 4. METODOLOGIA 9 4.1 Aquisição de Fotos do Teste Cutâneo de Puntura (TCP) 9 4.2 Padronização do Conjunto de Dados 10 4.3 Treinamento do Modelo de Aprendizado de Máquina e Agrupamento das Pápulas 12 4.4 Avaliação de Desempenho e Análise Estatística 12 4.5 Desenvolvimento dos Aplicativos Mobile e Web 14 4.6 Desenvolvimento da Plataforma de Administração 14 5. RESULTADOS E DISCUSSÕES 15 5.1 Aplicativo desenvolvido 21 5.2 Aplicação da Metodologia para outro tipo de análise de imagem 25 6. CONCLUSÕES 26 REFERÊNCIAS 28 APÊNDICE A – CONTRATO DE DESENVOLVIMENTO E INOVAÇÃO TECNOLÓGICA 31 APÊNDICE B – EXEMPLO DE TCLE APLICADO 39 APÊNDICE C – APLICATIVOS MOBILE E WEB E SUAS FUNCIONALIDADES 41 APÊNDICE D – CERTIFICADO DE REGISTRO DE PROGRAMA DE COMPUTADOR 48 6 1. INTRODUÇÃO Testes cutâneos in vivo para identificação de sensibilização por alérgenos iniciaram-se no século 19 de forma empírica e sem padronização. Na metade do século passado a administração de antígenos através de puntura foi sugerida. A padronização dos testes tornou-se necessária para que se pudesse haver comparação, independentemente de onde e quem estivesse realizando o teste. A padronização envolve o puntor, o alérgeno e como o teste é realizado para diagnóstico. O Teste Cutâneo de Puntura (TCP) é um teste de leitura imediata de reação mediada pela Imunoglobulina E (IgE). Esse teste é relativamente simples e fácil de realizar, porém apresenta limitações na precisão do diagnóstico. (FRATI et al., 2018; HEINZERLING et al., 2013; KNIGHT et al., 2018). As medidas do tamanho da pápula formada pelo alérgeno aplicado na pele através de puntura, e que correspondem a um resultado positivo, são feitas manualmente e, dessa forma, a avaliação depende do alergista (TOPAL et al., 2017). A média entre o maior diâmetro da pápula e sua perpendicular resulta na medida aceita como forma de amparar resultados (VAN DER VALK et al., 2016). Tal medida, quando acima de 3 mm, é considerada positiva, indicando sensibilização alérgica. Utiliza-se um controle negativo para excluir o dermografismo, que dificulta a interpretação do teste, e um controle positivo (histamina) para se assegurar que o paciente está reativo, considerando que algumas medicações bloqueiam o teste (HAAHTELA et al., 2014; HEINZERLING et al., 2013; JUSTO et al., 2016). A avaliação de um mesmo contorno geométrico por diferentes examinadores (ou até pelo mesmo, em diferentes momentos) produz resultados variáveis e, portanto, limita a necessária reprodutibilidade (TOPAL et al., 2017). Há dúvidas se o mesmo teste realizado na região volar e na infraescapular teriam o mesmo resultado, ou indicariam a mesma sensibilidade (ANDERSEN et al., 2016). Para evitar esses conflitos seriam necessários métodos que reduzissem os fatores de erro durante a avaliação do contorno e área da reação. Uma alternativa seria o desenvolvimento de tecnologias que pudessem avaliar os limites geométricos da pápula, conforme figura abaixo. Os contornos irregulares e a extensa área de 7 hiperemia podem confundir a interpretação (JUSTO et al., 2018; VAN DER VALK et al., 2016). A Figura 1 apresenta um exemplo dos possíveis contornos da área de hiperemia. Figura 1 - Fotografia ilustrando os possíveis contornos irregulares da área de hiperemia. Isso tem importância aumentada na medida em que, dependendo da pigmentação da pele, a identificação do contorno e principalmente da área hiperemiada representa um fator a mais de complicação (JUSTO et al., 2018). Métodos utilizando câmera fotográfica e análise cromatográfica feita com uso de programas de computador têm sido propostos, porém são fatores limitantes: iluminação, distância do foco, características da câmera e cor da pele do paciente (JUSTO et al., 2016, 2018; MARRUGO et al., 2019; PINEDA et al., 2019; ROK et al., 2016; SANTOS; TITUS; LIMA, 2007; SETARO; SPARAVIGNA, 2002; SVELTO et al., 2016, 2018). Outro fator limitante desses métodos propostos é o alto custo dos equipamentos necessários para utilização dessas tecnologias. 8 Nesse contexto, técnicas de aprendizado de máquina (ou machine learning) têm sido utilizadas para diagnósticos clínicos a partir de imagens. Estudos mostram que os modelos classificadores gerados por técnicas de aprendizado de máquina têm performance superior à avaliação humana para determinação de parâmetros geométricos em imagens, como: raio, perímetro, área, compacidade (perímetro/área), suavidade, concavidade, textura e dimensão fractal (BECKER et al., 2017; EHTESHAMI BEJNORDI et al., 2017). Uma das técnicas de aprendizado de máquina é a Segmentação Semântica de Imagens, que utiliza algoritmos de aprendizado profundo, mais especificamente redes neurais artificiais, para inferir modelos visando identificar padrões na imagem e classificar pixels em segmentos pré-definidos (ou rótulos) (LONG et al., 2015; SHELHAMER et al., 2016; SHI e MALIK, 2000). Com o intuito de aprimorar as técnicas de medição do TCP, o presente projeto desenvolveu um aplicativo multiplataforma para avaliação do tamanho das pápulas e diagnóstico dos resultados do TCP através de uma abordagem utilizando aprendizado de máquina. Essa mesma metodologia foi empregada para outros tipos de diagnósticos a partir de imagens. 2. JUSTIFICATIVA Como já comprovado em pesquisas e aplicações, a Inteligência Artificial (IA), utilizando algoritmos de redes neurais têm apresentado resultados satisfatórios no diagnóstico por imagem e na determinação de parâmetros geométricos em imagens, com nível de acurácia significativa em relação ao ser humano, que por vários fatores fisiológicos ou interpretativos tendem a não ter uma reprodutibilidade no padrão pré-estabelecido. Nesse cenário, justifica-se a utilização de algoritmos de redes neurais para gerar modelos padronizados de leitura e interpretação de imagens digitais, garantindo a reprodutibilidade. Outro ponto significativo, é o tempo despendido pelo profissional para analisar e dimensionar os contornos de cada pápula na pele, visto que um teste pode conter inúmeros alérgenos que resultam positivos. Nesse sentido, a utilização de tecnologias que possam analisar todas as pápulas no mesmo instante tem um potencial de agilizar esse processo. Para utilizar 9 essas tecnologias foi desenvolvido um software em parceria com a empresa do setor privado ITST Consultoria em Informática LTDA (apêndice A), que no ano de 2021 foi integrada à SoftwareONE Holding AG. Foi fundada em 2000 na cidade de São Paulo, Brasil. A empresa fornece soluções e serviços abrangentes à tecnologia SAP. 3. OBJETIVOS Os principais objetivos deste projeto de pesquisa foram: • Construir um banco de dados de imagens oriundas de TCP e realizar a edição/classificação dessas imagens para compor um banco de dados de treinamento para o algoritmo de deep learning. • Elaboração do algoritmo de deep learning, em linguagem Python, para detecção, segmentação e cálculo das áreas das pápulas. • Elaboração de uma plataforma para administrar as imagens (coleta, armazenamento e processamento), aplicando serviços de machine learning (construção de modelos, banco de dados para treinamentos e verificação). A plataforma deverá ser acessada via web e aplicativos móveis e deverá garantir a segurança da informação. • Aplicar a metodologia proposta para outros tipos de diagnóstico ou análise de imagem, com o intuito de verificar possíveis aplicações futuras. 4. METODOLOGIA 4.1 Aquisição de Fotos do Teste Cutâneo de Puntura (TCP) As fotos do TCP, utilizadas para compor o conjunto de dados de treinamento, foram adquiridas de pacientes voluntários que concordaram em participar desta pesquisa após assinarem o termo de consentimento informado (apêndice B). No total, foram coletadas 1.461 fotografias por meio de smartphones, 10 sem a padronização de modelo, configuração de câmera ou sistema operacional. O TCP foi realizado de acordo com o método estabelecido pela Academia Europeia de Alergia e Imunologia Clínica (HEINZERLING et al., 2013). Imediatamente após 15 minutos da aplicação da punção: (1) uma etiqueta em forma de quadrado na cor chroma key verde, denominada Etiqueta de Referência (ER) e com dimensões conhecidas (3 cm × 3 cm), foi colocada no antebraço ou parte superior das costas próximo às pápulas formadas; (2) o smartphone foi posicionado perpendicularmente à região de teste a uma distância de aproximadamente 10 cm a 30 cm; (3) verificou-se o foco; e então (4) a foto foi capturada. A Figura 2 ilustra uma foto capturada com esse método. Figura 2 - Foto capturada após 15 minutos da aplicação da punção. 4.2 Padronização do Conjunto de Dados As fotos do TCP foram editadas utilizando os softwares Corel Photo-Paint e Inkscape para criar segmentos (ou rótulos) na cor magenta (R = 255, G = 0, B = 255) nos pixels correspondentes à área da pápula, em preto (R = 0, G = 0, B = 0) nos pixels correspondentes à ER e em vermelho (R = 255, G = 0, B = 0) em todo o restante da imagem. A Figura 3 mostra um exemplo de foto do TCP original e como foi segmentada. Além da segmentação das fotos, o software ImageMagic (ImageMagick Studio LLC) foi utilizado para redimensionar as imagens para o tamanho de 640x480, a fim de padronizar o conjunto de dados e acelerar o treinamento do modelo. 11 Figura 3 - Foto original em A e editada (segmentada) em B. O ImageMagic (ImageMagick Studio LLC) também foi utilizado para aumentar a quantidade de dados (Data Augmentation) por meio da técnica de transformação geométrica das imagens originais. Uma técnica amplamente utilizada em trabalhos com aprendizado profundo para aumentar dados e reduzir o sobreajuste (overfitting) do modelo (SHORTEN e KHOSHGOFTAAR, 2019; TAYLOR e NITSCHKE, 2017). Essa técnica consiste em alterar a geometria da imagem para tornar o aprendizado profundo invariante a mudanças de posição e orientação. A transformação aplicada aos dados neste estudo foi espelhar as imagens horizontalmente, em seguida, a imagem espelhada foi rotacionada 180º e, finalmente, a imagem rotacionada foi espelhada horizontalmente. Dessa forma, o número de dados foi quadruplicado, e o modelo foi treinado com 5844 imagens. 12 4.3 Treinamento do Modelo de Aprendizado de Máquina e Agrupamento das Pápulas Para o treinamento do modelo de aprendizado de máquina (aqui denominado ML de machine learning) e leitura automática do TCP (segmentação das pápulas), foi utilizado uma rede neural convolucional totalmente genérica e extensível para qualquer conjunto de dados desenvolvida por Janyst (2017). A rede foi implementada na linguagem de programação Python utilizando a biblioteca TensorFlow (ABADI et al., 2016) e baseada na arquitetura VGG-16 (Visual Geometry Group, o número 16 refere-se à quantidade de camadas de peso, que contêm os parâmetros treináveis ou ajustáveis durante o processo de aprendizado da rede, sendo 13 camadas convolucionais e 3 camadas totalmente conectadas) (SIMONYAN e ZISSERMAN, 2015). Para determinar a área de cada pápula, foi desenvolvido um algoritmo em Python utilizando a biblioteca de Visão Computacional de Código Aberto (OpenCV) (BRADSKI, 2000) para agrupar as pápulas segmentadas pelo modelo de ML e estimar a área de cada uma delas por meio de uma proporção simples usando a área conhecida da ER. 4.4 Avaliação de Desempenho e Análise Estatística Para avaliar o desempenho do protocolo computacional desenvolvido, um conjunto de dados de validação com 30 imagens contendo um total de 152 pápulas foi constituído. As imagens desse conjunto foram obtidas e segmentadas de maneira semelhante ao descrito nas seções 4.1 e 4.2, com a diferença de que as pápulas tiveram seus contornos marcados a caneta por um médico qualificado para realizar o TCP, como representado na Figura 6-A. Esse contorno foi usado como guia para a segmentação manual da imagem (pintura da superfície da pápula). Chamamos esse procedimento de Segmentação Assistida por Imagem (Assisted Image Segmentation (AIS)) e utilizamos como a medida referência para esse trabalho, por ser a mais aproximada da área real da pápula. 13 Duas formas de acurácia foram determinadas para o modelo, acurácia de detecção e acurácia de segmentação. A primeira foi determinada usando a equação 1 (eq.). A acurácia de segmentação foi avaliada a partir das variáveis de uma matriz de confusão determinada por um agrupamento de pixels ao redor da pápula. Os rótulos esperados usados nessas análises são aqueles gerados pelo método AIS. A escolha do agrupamento foi devido ao grande número de pixels não relacionados à pápula nas imagens, o que levou a uma superestimação da acurácia de segmentação do modelo. O desempenho de segmentação do modelo foi determinado como a média das acurácias de segmentação das 145 pápulas corretamente detectadas. 𝑎𝑐𝑢𝑟á𝑐𝑖𝑎 𝑑𝑎 𝑑𝑒𝑡𝑒𝑐çã𝑜 %  =   𝑑𝑒𝑡𝑒𝑐çõ𝑒𝑠 𝑐𝑜𝑟𝑟𝑒𝑡𝑎𝑠 𝑑𝑒𝑡𝑒𝑐çõ𝑒𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 + 𝑒𝑟𝑟𝑜𝑠 𝑡𝑖𝑝𝑜 𝐼  ×100         𝑒𝑞.  1( ) A concordância do modelo proposto aqui com o método atualmente utilizado foi avaliada com base na análise proposta por Bland e Altman (1986). Para poder comparar os métodos, estimamos os valores de área da pápula a partir do diâmetro médico (forma padrão de medida da pápula pelos alergistas) usando a eq. 2. Testes pareados de Wilcoxon (WILCOXON, 1945) e análises de correlação também foram realizados entre os valores de área obtidos por cada método. Por fim, a função de probabilidade cumulativa foi determinada para as áreas estimadas pelos três métodos. á𝑟𝑒𝑎  𝑐𝑚2( )  =  π  𝑑𝑖â𝑚𝑒𝑡𝑟𝑜 𝑚é𝑑𝑖𝑐𝑜 𝑐𝑚 2( )2                   𝑒𝑞.  2( ) Todas essas análises foram realizadas utilizando o software R (versão 4.2.2, R Foundation for Statistical Computing, Viena, Áustria) (R CORE TEAM, 2021) e Python3 (versão 3.9, Python Software Foundation) (ROSSUM e DRAKE, 2009). 14 4.5 Desenvolvimento dos Aplicativos Mobile e Web A solução desenvolvida foi chamada de PRICKI, do conceito de Prick Test Inteligente. Os aplicativos foram desenvolvidos com o conceito mobile first, possibilitando sua utilização em qualquer lugar, desde que haja acesso à internet. A linguagem de programação utilizada para desenvolver os softwares foi o JavaScript. Essa escolha se deu em virtude de permitir que o código escrito para o aplicativo mobile, que utilizou a biblioteca React Native, seja empregado na aplicação web por meio da biblioteca React. O aplicativo mobile foi desenvolvido com compatibilidade para os sistemas operacionais Android e IOS. O aplicativo mobile apresenta as seguintes funcionalidades: cadastro de usuário (Médico, técnico e clínica), login do usuário; captura de fotos; upload de fotos para a plataforma em nuvem; recebimento da foto inferida na plataforma, armazenamento das imagens com os dados inferidos e geração de laudo médico; já a versão web só não executa as funcionalidades de capturar fotos e fazer upload das fotos para a plataforma em nuvem (apêndice C). 4.6 Desenvolvimento da Plataforma de Administração Foi desenvolvida uma plataforma em nuvem para administrar toda a operação que gerencia os dados e aprendizado de máquina propostos neste trabalho (Figura 4), que foi chamada de GoAppsMed. Para isso, foram empregados os serviços da Microsoft Azure, oferecendo suporte às seguintes funcionalidades: ● Recebimento de dados por meio do aplicativo mobile e de arquivos anexados via e-mail; 15 ● Armazenamento, edição e classificação de dados rotulados e não rotulados, para uso no treinamento e inferência do modelo; ● Serviço de Aprendizado de Máquina com suporte às bibliotecas TensorFlow e Open Source Computer Vision (OpenCV); ● Aplicação web administrativa; ● Criptografia de dados. Essa plataforma possui a capacidade de suportar tanto um aplicativo independente quanto integrações possíveis com outros sistemas de clínicas, hospitais e até mesmo sistemas de instituições educacionais. Figura 4 - Arquitetura do fluxograma da Plataforma desenvolvida na Microsoft Azure. 5. RESULTADOS E DISCUSSÕES O protocolo computacional desenvolvido é capaz de segmentar e agrupar as pápulas presentes em uma imagem de TCP. A área de cada pápula é estimada por uma proporção simples usando uma ER com uma área conhecida. Ao final do processo, é gerada uma imagem contendo as pápulas segmentadas identificadas 16 por um número, que representa a sequência da segmentação pelo modelo, e um relatório no canto superior esquerdo contendo a área das pápulas em cm². A Figura 5 mostra um resultado final de segmentação realizada pelo protocolo mencionado. Figura 5 - Imagem contendo as pápulas segmentadas e identificadas por um número e um relatório no canto superior esquerdo contendo a área de cada pápula em cm². O desempenho do modelo de aprendizado de máquina (ML) para segmentação de pápulas foi avaliado em um conjunto de dados com 30 imagens distintas e não utilizadas no treinamento do modelo, contendo o total de 152 pápulas. Nesse conjunto de dados, 10 pápulas não foram corretamente detectadas, com 3 detecções de pápulas ausentes (Erro Tipo I) e 7 pápulas existentes não foram detectadas (Erro Tipo II), resultando em uma acurácia de detecção de 93,55%. A acurácia de segmentação nas 145 pápulas restantes foi determinada utilizando as variáveis da matriz de confusão, resultando em uma acurácia média de 85,82% para este conjunto de dados. Em relação aos três erros do Tipo I que ocorreram no conjunto de dados de validação, duas marcas de punção no controle negativo foram detectadas como pápulas, e o terceiro erro de detecção (Figura 6) foi uma pequena pinta avermelhada no braço do paciente que foi segmentada. Os erros do Tipo II não apresentaram uma razão clara, podendo ter ocorrido devido às condições de iluminação das imagens, à cor da pele do paciente ou ao pequeno tamanho da pápula. Embora a 17 acurácia de detecção tenha sido considerada satisfatória, acredita-se que ambos os tipos de erros tendem a diminuir à medida que o conjunto de dados de treinamento aumenta. Além disso, espera-se que a segmentação pelo modelo de ML seja sempre interpretada e validada por um especialista, uma vez que o objetivo do protocolo desenvolvido é fornecer uma ferramenta para auxiliá-los na realização de um diagnóstico mais rápido e preciso, e não os substituir. Figura 6 - Braço do paciente 15 minutos após a punção de histamina (A) e segmentação pelo modelo de ML onde ocorreu um erro do Tipo I (B). O teste pareado de Wilcoxon revelou que há uma diferença estatisticamente significativa entre a área determinada pelo diâmetro médico, AIS e método de ML (valor p < 2.2e-16 em todos os três testes). Apesar disso, as análises de Bland-Altman (Figura 7) indicam que a diferença entre a medida de dois métodos está concentrada em torno de um viés (diferença média), indicando que não há correlação entre a diferença obtida entre os dois métodos de medição e a magnitude da variável de área. Determinamos também a função de distribuição cumulativa das áreas estimadas pelos três métodos (ML, AIS e Médico) (Figura 8). Isso confirmou a diferença estatisticamente significativa observada no teste pareado de Wilcoxon e deixou claro que as distribuições podem ser sobrepostas deslocando as curvas no valor do viés. Assim, os vieses podem possivelmente ser utilizados para relacionar as áreas obtidas por diferentes métodos. Além disso, os diferentes métodos também podem ser relacionados por meio de equações lineares. 18 Figura 7 - Análises de Bland-Altman para ML x Médico (A), ML x AIS (B) e Médico x AIS (C). Gráficos de correlação de Pearson entre ML e Médico (D), ML e AIS (E) e Médico e AIS (F). 19 Figura 8 - Funções de probabilidade cumulativa para as áreas estimadas pelos três métodos para os dados originais (A) e após adicionar o viés entre um método e o método médico (B). As funções de probabilidade cumulativa também confirmam que o método de ML produz medidas mais próximas à distribuição do AIS em comparação com o método Médico. Além disso, os valores obtidos pelo método de ML têm uma distribuição mais contínua quando comparados ao método Médico, o que pode indicar uma maior resolução de análise deste último. Isso provavelmente ocorre porque o método Médico tem sua resolução vinculada à graduação do instrumento usado para medir o diâmetro da pápula (geralmente uma régua ou paquímetro), enquanto os métodos de ML e AIS realizam uma análise de pixel a pixel. Os coeficientes de correlação de Pearson entre os métodos de medição foram verificados, conforme mostrado na Figura 7. Consistentemente com os resultados das análises anteriores, foi encontrada uma forte correlação entre as áreas inferidas pelo método de ML e o método AIS, consideravelmente maior do que a correlação entre os métodos AIS e Médico. Em estudos anteriores realizados por nosso grupo (ALMEIDA et al., 2020), determinamos um coeficiente de correlação de Pearson estatisticamente significativo entre a temperatura da pele na região da pápula e a área determinada de maneira semelhante ao método AIS. Como o método de ML apresenta uma forte correlação com o método AIS, é razoável supor que o método de ML também está associado à temperatura da pápula durante a 20 reação de sensibilidade, característica conhecida por ser proporcional à intensidade da sensibilidade ao antígeno aplicado. Além da limitada resolução mencionada anteriormente do método Médico, ele pode apresentar outros problemas, como erro de paralaxe, o que pode levar a uma maior soma de erros e redução na precisão do diagnóstico. Nesse sentido, a automação da leitura da área da pápula, além de acelerar o procedimento diagnóstico, também tem o potencial de torná-lo mais preciso, uma vez que eliminaria qualquer erro decorrente do experimentador ou instrumento durante o processo de leitura das reações. Além disso, o protocolo desenvolvido pode ser facilmente integrado aos sistemas de informação hospitalar, gerando prontuários médicos com imagens do TCP, proporcionando assim mais um dado para o histórico do paciente. Não há artigos na literatura que apresentem um sistema que utilize IA para automatizar o processo de medição das pápulas de forma rápida e sem pós-processamento computacional das imagens. Dessa forma, o que encontramos para comparar com nossos resultados foi a acurácia do método de validação para medir a área da pápula. Diante disso, nosso método obteve uma média de 7,4% de erro, validada em outro trabalho do nosso grupo de pesquisa (ALMEIDA et al., 2020). Outros autores também apresentaram margem de erro inferior a 10% (JUSTO et al., 2018; SVELTO et al., 2016, 2018), o que é considerado aceitável se comparado à variação da medição da pápula por profissionais experientes, que pode chegar a 30% para mais ou para menos (SVELTO et al., 2016, 2018). É importante ressaltar que, assim como este trabalho evidencia que o método padrão (média dos diâmetros) para medir a pápula não representa seu tamanho real, outros autores também concordam com esse fato. No entanto, os métodos de cálculo de área e o método padrão tendem a ser concordantes para o diagnóstico (VAN DER VALK et al., 2016; SANTOS; TITUS; LIMA, 2007). De acordo com Fraser et al. (2023), os caminhos metodológicos para o desenvolvimento e validação de sistemas de IA em dispositivos médicos ainda não têm um consenso amplo sobre as melhores práticas, entretanto, há algumas fases que são consenso entre especialistas das diversas áreas da medicina e o software Pricki, desenvolvido neste trabalho, seguiu todas as recomendações, que são: 21 Validação Interna In Silico (o sistema de IA é validado internamente utilizando dados simulados para verificar sua precisão e funcionalidade dentro do ambiente de desenvolvimento. Este passo inicial garante que o modelo esteja operando conforme o esperado com os dados conhecidos); Validação Externa In Silico (após a validação interna, o sistema é testado com dados novos que não foram usados no desenvolvimento inicial. Isso ajuda a confirmar a robustez e a capacidade do modelo de generalizar para novos dados); Ajustes no Modo Offline ou 'Shadow Mode' (o sistema é ajustado para o contexto específico em que será implementado. Nesta fase, o sistema funciona em paralelo com os processos clínicos reais, mas sem influenciar diretamente o cuidado dos pacientes, permitindo adaptações necessárias ao ambiente clínico real); Avaliação de Desempenho em Configurações de Implantação (o desempenho da IA é avaliado nas configurações de implantação real, operando de forma independente das decisões clínicas padrão. Isso garante que o sistema funcione corretamente no ambiente do mundo real sem afetar o cuidado do paciente); Avaliação Clínica Inicial ao Vivo (as recomendações da IA começam a impactar o cuidado dos pacientes nesta fase. Esta etapa inicial de uso clínico real ajuda a validar a eficácia e segurança da IA em um cenário prático) e Avaliação Comparativa Multicêntrica e de Escalonamento (recomenda-se uma avaliação ampla, possivelmente em múltiplos centros de saúde. Após esta fase, o sistema é escalado para uso mais amplo, com monitoramento adequado a longo prazo. Este processo de vigilância contínua assegura que o sistema mantenha sua performance e segurança ao longo do tempo). Todo o método de ML foi registrado como Programa de Computador no INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL (INPI) (apêndice D). 5.1 Aplicativo desenvolvido A última versão do aplicativo desenvolvido foi constituído de 10 telas, contando com a tela do desktop, conforme Figuras 9 e 10. 22 Figura 9 - Telas do aplicativo desenvolvido: A) Splash Screen, B) Login, C) Cadastro, caso não seja cadastrado na plataforma, D) Principal (Home), E) Ir para captura de foto e F) Captura e upload da foto (Câmera do smartphone acionada). 23 Figura 10 - Continuação das telas do aplicativo desenvolvido: G) Confirmação da segmentação, H) Resultado das medidas, I) Menu para gerar PDF do relatório médico, encerrar atendimento ou continuar atendimento e J) Tela de desktop para visualização das imagens a distância na mesma etapa do resultado das medidas (H). 24 Testes de software foram conduzidos com o objetivo de aprimorar o tempo de resposta nos principais processos, uma vez que o TCP é cronometrado a partir da punção na pele do paciente. Dessa forma, os processos avaliados foram: captura de uma foto e upload para inferência (Figura 9 - Tela F); download e análise da segmentação pelo especialista (Figura 10 - Tela G); e resultado das medidas das pápulas (Figura 10 - Tela H). Para isso, foram considerados 6 fatores: marca do smartphone; modelo; sistema operacional (SO); processador de aplicativos (AP); tamanho da foto em MP (megapixels) da câmera traseira; e velocidade da internet em Mbps (megabits por segundo). A Figura 11 apresenta os resultados do tempo de resposta de cada smartphone e a velocidade da internet em cada caso testado. Smartphone Model OS AP Rear camera Internet speed Processing time in seconds Samsung Galaxy J7 Pro Android 8 Core 1.6 GHz 13 MP 5 Mbps 29 Xiaomi Redmi Note 9S Android 8 Core 1.9 GHZ 48 MP 75 Mbps 20 Samsung Galaxy J7 Prime Android 8 Core 1.6 GHz 13 MP 25 Mbps 18 Asus ZenFone 5Z Android 8 Core 2.8 GHz 12 MP 250 Mbps 18 Xiaomi Mi A1 Android 8 Core 2.0 GHz 12 MP 230 Mbps 18 Xiaomi Pocophone F1 Android 8 Core 2.8 GHz 12 MP 120 Mbps 27 Samsung Galaxy S10 Plus Android 8 Core 2.7 GHz 16 MP 240 Mbps 18 Oneplus Oneplus 5 Android 8 Core 2.2 GHZ 20MP 250 Mbps 23 Figura 11 - Tabela contendo tipos e configurações de smartphones e velocidade de Internet testados, demonstrando o tempo despendido para realizar o teste de software. Os testes revelaram que a velocidade da internet é o principal fator que aumenta ou diminui o tempo de resposta do software para os usuários. Outros fatores não apresentaram correlação estatística significativa, considerando que a definição da câmera aumenta a qualidade e tamanho da imagem. Em média, o tempo de execução foi de 21,37 segundos, considerado aceitável mesmo para o TCP que requer tempo para sua leitura. Não foram feitos testes com smartphones com o sistema operacional IOS, pois não havia aparelhos disponíveis quando os testes foram realizados. 25 5.2 Aplicação da Metodologia para outro tipo de análise de imagem Este trabalho também propôs como um dos objetivos, testar a metodologia ML em outro conjunto de imagens, para análise ou diagnóstico. Nesse contexto, foi acordado uma parceria com o Programa de Pós-Graduação em Odontologia da Universidade de Pernambuco e a empresa do setor privado Viziomed Al Health Solutions, também localizada em Recife, Pernambuco, para utilizar o método ML para avaliar o efeito da fotobiomodulação laser na proliferação e diferenciação de células tronco. Este trabalho concluiu que “o ML é uma ótima ferramenta para mensurar com precisão e celeridade os resultados obtidos de forma automatizada.” Neste trabalho foi comparado a análise Histomorfométrica (Figura 12) e análise através do método ML (Figura 13), evidenciando, visualmente, a similaridade do resultado nas duas técnicas. Figura 12 - Representação da análise da diferenciação osteogênica (A) e histomorfométrica (B). 26 Figura 13 - Representação da análise da histomorfométrica da diferenciação osteogênica (A) e ML (B). 6. CONCLUSÕES Os resultados mostram que as medidas realizadas pelo método de ML desenvolvido, estão relacionadas às medidas dos outros métodos estudados (AIS e Médico) por meio do valor de um viés, além disso, demonstrou grande concordância com o método AIS. Esses resultados indicam que o protocolo desenvolvido tem o potencial de automatizar a leitura da reação do TCP e ser utilizado na rotina clínica como ferramenta para benefício do profissional e do paciente. No entanto, são necessários estudos para a normalização do uso dos valores de área para realizar o diagnóstico durante o TCP e o contínuo uso por especialistas para aumentar o número e a variedade dos dados. A performance do aplicativo mobile também apresentou resultados satisfatórios quanto a velocidade de processamento, possibilitando a implementação da tecnologia desenvolvida para diminuir o tempo do profissional na leitura do teste, eliminar o uso de papel ou fitas para anotação das medidas, eliminar o uso de instrumentos de medição e digitalizar o laudo com as imagens do teste. A utilização da metodologia desse trabalho para outros tipos de imagem, no caso aqui descrito, também se mostrou satisfatória. Conclui-se que a metodologia 27 desse trabalho pode ser utilizada em diferentes aplicações que envolvam análise ou diagnóstico por imagem. 28 REFERÊNCIAS ABADI, M. et al. TensorFlow: A system for large-scale machine learning. In: 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16), 2016, pp. 265–283. ALMEIDA, A.L.M. et al. Objective evaluation of immediate reading skin prick test applying image planimetric and reaction thermometry analyses Journal of Immunological Methods, 2020. Disponível em: https://doi.org/10.1016/j.jim.2020.112870. AN, G. et al. Glaucoma Diagnosis with Machine Learning Based on Optical Coherence Tomography and Color Fundus Images. Journal of Healthcare Engineering, 2019. Disponível em: https://doi.org/10.1155/2019/4061313. ANDERSEN, H.H. et al. The Lancet Weight Determines Wheal Diameter in Response to Skin Prick Testing with Histamine. PLoS One, v. 11, 2016. Disponível em: https://doi.org/10.1371/journal.pone.0156211. BECKER, A.S. et al. Deep Learning in Mammography: Diagnostic Accuracy of a Multipurpose Image Analysis Software in the Detection of Breast Cancer. Investigative Radiology, v. 52, p. 434–440, 2017. Disponível em: https://doi.org/10.1097/RLI.0000000000000358. BLAND, J.M.; ALTMAN, D.G. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet, v. 1, n. 8476, p. 307-10, 1986. Disponível em: https://doi.org/10.1016/S0140-6736(86)90837-8. BRADSKI, G. The OpenCV Library. Dr. Dobb’s Journal of Software Tools, 2000. Dessau, R.B.; Pipper, C.B. R--en programpakke til statistisk databehandling og grafik [''R"--project for statistical computing]. Ugeskrift for laeger, v. 170, n. 5, p. 328–330, 2008. EHTESHAMI BEJNORDI, B. et al. Diagnostic Assessment of Deep Learning Algorithms for Detection of Lymph Node Metastases in Women With Breast Cancer. JAMA, v. 318, p. 2199–2210, 2017. Disponível em: https://doi.org/10.1001/jama.2017.14585. FRATI, F. et al. The skin prick test. Journal of Biological Regulators and Homeostatic Agents, v. 32, n. 1, p. 19-24, 2018. FRASER, A. G. et al. Artificial intelligence in medical device software and high-risk medical devices – a review of definitions, expert recommendations and regulatory initiatives. Expert review of medical devices, v. 20, n. 6, p. 467–491, 2023. Disponível em: https://www.tandfonline.com/doi/epdf/10.1080/17434440.2023.2184685?needAccess =true. GATOS, I. et al. A Machine-Learning Algorithm Toward Color Analysis for Chronic Liver Disease Classification, Employing Ultrasound Shear Wave Elastography. Ultrasound in Medicine & Biology, v. 43, p. 1797-1810, 2017. Disponível em: https://doi.org/10.1016/j.ultrasmedbio.2017.05.002. https://doi.org/10.1016/j.jim.2020.112870 https://doi.org/10.1155/2019/4061313 https://doi.org/10.1371/journal.pone.0156211 https://doi.org/10.1097/RLI.0000000000000358 https://doi.org/10.1016/S0140-6736(86)90837-8 https://doi.org/10.1001/jama.2017.14585 https://www.tandfonline.com/doi/epdf/10.1080/17434440.2023.2184685?needAccess=true https://www.tandfonline.com/doi/epdf/10.1080/17434440.2023.2184685?needAccess=true https://doi.org/10.1016/j.ultrasmedbio.2017.05.002 29 HAAHTELA, T. et al. Clinical relevance is associated with allergen-specific wheal size in skin prick testing. Clinical and Experimental Allergy, v. 44, n. 3, p. 407-416, 2014. Disponível em: https://doi.org/10.1111/cea.12240. HEINZERLING, L. et al. The skin prick test – European standards. Clinical and Translational Allergy, v. 3, n. 3, 2013. Disponível em: https://doi.org/10.1186/2045-7022-3-3. ImageMagick Studio LLC, 2023. ImageMagick. Disponível em: https://imagemagick.org. JANYST, L. Semantic Image Segmentation using a Fully Convolutional Neural Network GitHub Repository (2017). Disponível em: https://github.com/ljanyst/image-segmentation-fcn. JUSTO, X. et al. Medical Device for Automated Prick Test Reading. IEEE Journal of Biomedical and Health Informatics, v. 22, p. 895–903, 2018. Disponível em: https://doi.org/10.1109/JBHI.2017.2680840. JUSTO, X. et al. Prick test: evolution towards automated reading. Allergy, v. 71, p. 1095–1102, 2016. Disponível em: https://doi.org/10.1111/all.12921. KNIGHT, V. et al. A comparison of specific IgE and skin prick test results to common environmental allergens using the HYTECTM 288. Journal of Immunological Methods, v. 462, p. 9–12, 2018. Disponível em: https://doi.org/10.1016/j.jim.2018.07.005. LONG, J., SHELHAMER, E., DARRELL, T., 2015. Fully Convolutional Networks for Semantic Segmentation. arXiv:1411.4038 [cs]. MARRUGO, A.G. et al. Toward an automatic 3D measurement of skin wheals from skin prick tests, in: Dimensional Optical Metrology and Inspection for Practical Applications VIII. Presented at the Dimensional Optical Metrology and Inspection for Practical Applications VIII, International Society for Optics and Photonics, p. 1099104, 2019. Disponível em: https://doi.org/10.1117/12.2519034. PENNISI, A. et al. Skin lesion image segmentation using Delaunay Triangulation for melanoma detection. Computerized Medical Imaging and Graphics, v. 52, p. 89–103, 2016. Disponível em: https://doi.org/10.1016/j.compmedimag.2016.05.002. PINEDA, J. et al. Robust automated reading of the skin prick test via 3D imaging and parametric surface fitting. PLOS ONE, v. 14, p. e0223623, 2019. Disponível em: https://doi.org/10.1371/journal.pone.0223623. R CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2021. Disponível em: https://www.R-project.org/. ROK, T. et al. Thermographic assessment of skin prick tests in comparison with the routine evaluation methods. Postepy Dermatol Alergol, v. 33, p. 193–198, 2016. Disponível em: https://doi.org/10.5114/ada.2016.60611. ROSSUM, G. V.; DRAKE, F. L. Python 3 Reference Manual. Hampton, NH: CreateSpace Independent Publishing Platform, 2009. https://doi.org/10.1111/cea.12240 https://doi.org/10.1186/2045-7022-3-3 https://imagemagick.org https://github.com/ljanyst/image-segmentation-fcn https://doi.org/10.1109/JBHI.2017.2680840 https://doi.org/10.1111/all.12921 https://doi.org/10.1016/j.jim.2018.07.005 https://doi.org/10.1117/12.2519034 https://doi.org/10.1016/j.compmedimag.2016.05.002 https://doi.org/10.1371/journal.pone.0223623 https://www.r-project.org/ https://doi.org/10.5114/ada.2016.60611 30 SANTOS, R. V. DOS; TITUS, R. G.; LIMA, H. C. Objective evaluation of skin prick test reactions using digital photography. Skin Research and Technology, v. 13, n. 2, p. 148–153, 2007. SETARO, M.; SPARAVIGNA, A. Quantification of erythema using digital camera and computer-based colour image analysis: a multicentre study. Skin Research and Technology, v. 8, n. 2, p. 84–88, 2002. SHELHAMER, E. et al. Fully Convolutional Networks for Semantic Segmentation. arXiv:1605.06211 [cs], 2016. SHI, J. & MALIK, J. Normalized Cuts and Image Segmentation. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, v. 22, 2000. SHORTEN, C. & KHOSHGOFTAAR, T. M. A survey on Image Data Augmentation for Deep Learning. Journal of Big Data, v. 6, Article number: 60, 2019. Disponível em: https://doi.org/10.1186/s40537-019-0197-0. SIMONYAN, K. & ZISSERMAN, A. Very deep convolutional networks for large-scale image recognition. In Proceedings of the 3rd International Conference on Learning Representations. (DBIP, San Diego, CA, 2014). SVELTO, C. et al. Skin prick test digital imaging system with manual, semiautomatic, and automatic wheal edge detection and area measurement. Multimed Tools Appl, v. 77, p. 9779–9797, 2018. Disponível em: https://doi.org/10.1007/s11042-018-5823-x. SVELTO, C. et al. Semi-and-automatic wheal measurement system for prick test digital imaging and analysis, in: 2016 IEEE International Conference on Imaging Systems and Techniques (IST). Presented at the 2016 IEEE International Conference on Imaging Systems and Techniques (IST), pp. 482–486, 2016. Disponível em: https://doi.org/10.1109/IST.2016.7738274. TAYLOR, L. & NITSCHKE, G. Improving Deep Learning using Generic Data Augmentation, 2017. Disponível em: https://doi.org/10.48550/arXiv.1708.06020. TOPAL, S.G., KARAMAN, B.F., AKSUNGUR, V.L. Variables affecting interpretation of skin prick test results. Indian Journal of Dermatology, Venereology, and Leprology, v. 83, 2017. Disponível em: https://doi.org/10.4103/0378-6323.192956. VAN DER VALK, J.P.M. et al. Measurement and interpretation of skin prick test results. Clinical and Translational Allergy, v. 6, 2016. Disponível em: https://doi.org/10.1186/s13601-016-0092-0. WILCOXON, F. Individual Comparisons by Ranking Methods. Biometrics Bulletin, v. 1, n. 6, p. 80–83, 1945. Disponível em: https://doi.org/10.2307/3001968. ZHU, X., GOLDBERG, A.B. Introduction to Semi-Supervised Learning. Synthesis Lectures on Artificial Intelligence and Machine Learning, v. 3, p. 1–130, 2009. Disponível em: https://doi.org/10.2200/S00196ED1V01Y200906AIM006. https://doi.org/10.1186/s40537-019-0197-0 https://doi.org/10.1007/s11042-018-5823-x https://doi.org/10.1109/IST.2016.7738274 https://doi.org/10.48550/arXiv.1708.06020 https://doi.org/10.4103/0378-6323.192956 https://doi.org/10.1186/s13601-016-0092-0 https://doi.org/10.2307/3001968 https://doi.org/10.2200/S00196ED1V01Y200906AIM006 31 APÊNDICE A – CONTRATO DE DESENVOLVIMENTO E INOVAÇÃO TECNOLÓGICA 32 33 34 35 36 37 38 39 APÊNDICE B – EXEMPLO DE TCLE APLICADO TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO (TCLE) RESOLUÇÃO 466/2012 PARA PARTICIPANTE MAIOR DE 18 ANOS CONVIDO, o Senhor (a) para participar do Projeto de Pesquisa intitulado “APRENDIZADO DE MÁQUINA APLICADO AO DIAGNÓSTICO POR IMAGEM PARA APLICAÇÃO EM PRICK TEST”, que será desenvolvido pelo aluno de Doutorado Edson Luiz Pontes Perger, com orientação do profissional Físico e Professor (a) Rafael Plana Simões do Programa de Pós-graduação Pesquisa e Desenvolvimento – Biotecnologia Médica da Faculdade de Medicina de Botucatu – UNESP. O objetivo dessa pesquisa é desenvolver um software (aplicativo de celular e computador) capaz de diagnosticar o Teste Cutâneo de Puntura (Prick Test) por Inteligência Artificial, que auxiliará o médico a ter um resultado mais rápido e mais preciso. Para desenvolver esse software com Inteligência Artificial eu preciso capturar uma foto da região onde será feito o Prick Test. Para cumprirmos o objetivo dessa pesquisa, nós precisamos que autorize a captura de uma ou mais fotos da região onde o médico (a) prescreveu a realização do teste de punctura (Prick test). Não precisamos de seus dados e nem a foto do seu rosto, somente da foto das “picadinhas” que serão feitas onde o médico(a) indicou. Precisamos também, colocar uma identificação quadrada perto da região onde o teste foi feito para sair na foto. Podemos capturar essa (s) foto (s)? ( ) Sim. ( ) Não. Seu benefício em participar será ajudar os pesquisadores a desenvolverem um novo método de diagnóstico por Inteligência Artificial. Fique ciente de que sua participação neste estudo é voluntária e que mesmo após ter dado seu consentimento para participar da pesquisa, você poderá retirá-lo a qualquer momento, sem qualquer prejuízo na continuidade do seu teste. Este Termo de Consentimento Livre e Esclarecido será elaborado em 2 vias de igual teor, o qual 01 via será entregue ao Senhor (a) devidamente rubricada, e a outra via será arquivada e mantida pelos pesquisadores por um período de 5 anos após o término da pesquisa. Qualquer dúvida adicional você poderá entrar em contato com o Comitê de Ética em Pesquisa através dos telefones (14) 3880-1608 ou 3880-1609 que funciona de 2ª a 6ª feira das 8:00h às 12:00h e das 13:30h às 17h, na Chácara Butignolli s/nº em Rubião Júnior – Botucatu - São Paulo. Os dados de localização dos pesquisadores estão abaixo descritos: Após terem sido sanadas todas minhas dúvidas a respeito deste estudo, CONCORDO em participar de forma voluntária, estando ciente que todos os meus dados estarão resguardados através do sigilo que os pesquisadores se comprometeram. Estou ciente que os resultados desse estudo poderão ser publicados em revistas científicas. 40 _________________________, _____/___/______ Cidade _______________________ _________________________ Pesquisador Participante da Pesquisa Nome: Edson Luiz Pontes Perger Endereço: Avenida Universitária,3780 – Altos do Paraíso, Botucatu - SP Telefone: (15) 9 8177-3847 Email: elpperger@gmail.com Nome: Rafael Plana Simões Endereço: Avenida Universitária,3780 – Altos do Paraíso, Botucatu - SP Telefone: (14) 3880-7512 Email: rafael.simoes@unesp.br mailto:elpperger@gmail.com mailto:rafael.simoes@unesp.br 41 APÊNDICE C – APLICATIVOS MOBILE EWEB E SUAS FUNCIONALIDADES 42 43 44 45 46 47 48 APÊNDICE D – CERTIFICADO DE REGISTRO DE PROGRAMA DE COMPUTADOR