DISSERTAÇÃO DE MESTRADO PREDIÇÃO DE BATIMENTO CARDÍACO FETAL POR MEIO DE INTELIGÊNCIA ARTIFICIAL E DE VARIÁVEIS MORFOLÓGICAS, MORFOCINÉTICAS E RELACIONADAS COM A PACIENTE Nome: Dóris Spinosa Chéles Orientador: Marcelo Fábio Gouveia Nogueira Programa de Farmacologia e Biotecnologia - Instituto de Biociências de Botucatu (IBB) - Universidade Estadual Paulista (UNESP). Curso: Mestrado. DÓRIS SPINOSA CHÉLES PREDIÇÃO DE BATIMENTO CARDÍACO FETAL POR MEIO DE INTELIGÊNCIA ARTIFICIAL E DE VARIÁVEIS MORFOLÓGICAS, MORFOCINÉTICAS E RELACIONADAS COM A PACIENTE Dissertação apresentada ao Instituto de Biociências de Botucatu (IBB) - UNESP - Universidade Estadual Paulista para a obtenção do título de Mestre em Farmacologia e Biotecnologia. Orientador: Marcelo Fábio Gouveia Nogueira Coorientador: José Celso Rocha Botucatu 2022 Palavras-chave: Embriologia; Inteligência artificial; Reprodução humana. Chéles, Dóris Spinosa. Predição de batimento cardíaco fetal por meio de inteligência artificial e de variáveis morfológicas, morfocinéticas e relacionadas com a paciente / Dóris Spinosa Chéles. - Botucatu, 2022 Dissertação (mestrado) - Universidade Estadual Paulista "Júlio de Mesquita Filho", Instituto de Biociências de Botucatu Orientador: Marcelo Fábio Gouveia Nogueira Coorientador: José Celso Rocha Capes: 90400003 1. Reprodução humana. 2. Inteligência artificial - Aplicações médicas. 3. Embriologia. 4. Morfologia. DIVISÃO TÉCNICA DE BIBLIOTECA E DOCUMENTAÇÃO - CÂMPUS DE BOTUCATU - UNESP BIBLIOTECÁRIA RESPONSÁVEL: ROSEMEIRE APARECIDA VICENTE-CRB 8/5651 FICHA CATALOGRÁFICA ELABORADA PELA SEÇÃO TÉC. AQUIS. TRATAMENTO DA INFORM. AGRADECIMENTOS Agradecemos à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo apoio à pesquisa (auxílio e bolsa - nº 2017/19323-5 e nº 2020/07634-9), bem como os recursos computacionais, instalações, equipamentos e assistência fornecidos pela Faculdade de Ciências e Letras, UNESP/Assis. Agradecemos à IVI Valencia, clínica parceira no fornecimento de dados para este trabalho. O presente trabalho também foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) – Código de Financiamento 001. SUMÁRIO 1 Introdução geral ............................................................................................... 8 1.1 Introdução ..................................................................................................... 8 1.2 Sistema time-lapse ....................................................................................... 9 1.3 Processamento de imagens ........................................................................ 10 1.3.1 Transformada de Hough ........................................................................... 11 1.3.2 Análises de textura ................................................................................... 11 1.4 Morfocinética embrionária .......................................................................... 11 1.5 Pacientes ..................................................................................................... 13 1.6 Inteligência artificial ......................................................................................... 14 1.6.1 Redes neurais artificiais ............................................................................ 15 1.6.2 Algoritmo genético .................................................................................... 16 1.7 Análises estatísticas .................................................................................... 16 1.7.1 Análise de colinearidade .......................................................................... 17 1.7.2 Simulação ................................................................................................. 17 1.7.3 Matriz de confusão .................................................................................. 17 1.7.4 Receiver Operating Characteristic (ROC) Curve e Area Under the Curve (AUC) ............................................................................................................... 18 2 Materiais e Métodos ....................................................................................... 19 2.1 Desenvolvimento do banco de dados ............................................................. 19 2.2 Morfologia embrionária ................................................................................ 21 2.3 Morfocinética embrionária ............................................................................... 29 2.4 Pacientes ..................................................................................................... 30 2.4.1 Idade ........................................................................................................ 31 2.4.2 Índice de massa corporal ......................................................................... 31 2.4.3 Número de oócitos ................................................................................... 32 2.4.4 Tentativas anteriores ................................................................................ 32 2.5 Implementação das técnicas de inteligência artificial ................................... 33 2.6 Referências Bibliográficas............................................................................ 44 3 Artigo .............................................................................................................. 56 3.1 Introdução .................................................................................................. 59 3.2 Materiais e Métodos ..................................................................................... 61 3.2.1 Desenho do estudo ................................................................................... 61 3.2.2 Morfologia do blastocisto .......................................................................... 62 3.2.3 Morfocinética embrionária ......................................................................... 64 3.2.4 Parâmetros relacionados com a paciente ................................................. 66 3.2.5 Implementação das técnicas de IA ........................................................... 68 3.2.6 Análises estatísticas ................................................................................. 68 3.3 Resultados................................................................................................... 69 3.4 Discussão .................................................................................................... 80 3.5 Referências ................................................................................................. 85 4 Conclusão ...................................................................................................... 93 5 Perspectivas Futuras ...................................................................................... 95 6 Atividades Acadêmicas desenvolvidas pela Aluna ......................................... 96 7 Anexo 1 .......................................................................................................... 98 7.1 Variáveis com colinearidade ........................................................................ 98 7.2 Resultados gerados pelas RNAs ................................................................ 101 7.3 Relação do número de melhores RNAs obtidas ........................................ 157 8 Anexo 2 ........................................................................................................ 158 Normas de publicação – Human Reproduction ................................................. 158 RESUMO As tecnologias de reprodução assistida vêm sendo cada vez mais utilizadas e aprimoradas com o passar do tempo. Para a transferência embrionária, a escolha do embrião de melhor qualidade é uma etapa decisiva para a ocorrência de gestação. Para isso, os embriologistas dispõem de sistemas de classificação no momento da avaliação embrionária. Entretanto, esta avaliação é dependente da experiência que os embriologistas possuem e consequentemente é influenciada pela subjetividade intrínseca, tanto entre avaliadores diferentes quanto pelo mesmo avaliador. Além disso, os conhecimentos acerca dos tempos do desenvolvimento embrionário – facilitado pela implementação do sistema time-lapse na rotina laboratorial – e acerca das características relacionadas com a paciente que passa pelo tratamento de reprodução assistida são fatores que podem auxiliar no momento da seleção embrionária, e potencialmente, melhorar a taxa de gestação obtida em clínicas. Portanto, uma forma de avaliação objetiva é necessária para melhorar o sucesso destas tecnologias. Assim, foram utilizados três conjuntos de variáveis de entrada distintas (morfologia do blastocisto, morfocinética embrionária e características relacionadas com a paciente) para a aplicação em inteligência artificial (redes neurais artificiais e algoritmo genético). Para a morfologia, foi realizado o processamento digital de imagens de blastocistos humanos para a obtenção de variáveis preditivas da qualidade do blastocisto. Para a morfocinética, foram utilizados parâmetros relacionados aos tempos do desenvolvimento embrionário. Para a paciente, foram elaboradas pontuações para cada variável de entrada com base em pesquisa bibliográfica. Estes conjuntos de variáveis foram treinados e simulados separadamente e em conjunto para predizer o batimento cardíaco fetal. Além disso, os três conjuntos juntos também foram utilizados para predizer o nascimento vivo. Considerando os três conjuntos juntos como entrada, a melhor rede neural artificial encontrada para a predição de batimento cardíaco fetal obteve uma acurácia geral de 95,2% no treinamento e 78,4% na simulação. Já a melhor rede encontrada para a predição de nascimento vivo obteve uma acurácia geral de 98,0% no treinamento e 81,1% na simulação. Dessa forma, a aplicação de inteligência artificial apresenta potencial para auxiliar, de forma objetiva, os embriologistas durante a escolha do embrião mais apto para a transferência, e assim, transpassar do campo in silico (laboratorial) em direção à prática clínica na reprodução assistida. ABSTRACT Assisted reproduction technologies have been increasingly used and improved over time. For embryo transfer, choosing the best quality embryo is a decisive step for the pregnancy occurrence. For this, embryologists have classification systems at the moment of embryos evaluation. However, this evaluation depends on the embryologists’ experience and, consequently, is influenced by intrinsic subjectivity, both between different evaluators and by the same evaluator. In addition, knowledge about the times of embryo development - facilitated by the implementation of the time-lapse system in the laboratory routine - and about the characteristics related to the patient undergoing assisted reproduction treatment are factors that can help at the time of embryo selection, and potentially improve the pregnancy rate achieved in clinics. Therefore, an objective evaluation is necessary to improve the success of these technologies. Thus, three sets of distinct input variables (blastocyst morphology, embryo morphokinetics and patient-related characteristics) were used for application in artificial intelligence (artificial neural networks and genetic algorithm). For morphology, digital image processing of human blastocysts was performed to obtain predictive variables of blastocyst quality. For morphokinetics, parameters related to the times of embryo development were used. For the patient, scores were developed for each input variable based on a literature search. These sets of variables were trained and simulated separately and together to predict fetal heartbeat. In addition, the three sets together were also used to predict live birth. Considering the three sets together as input, the best artificial neural network found for the prediction of fetal heartbeat had an overall accuracy of 95.2% in training and 78.4% in simulation. The best artificial neural network for live birth prediction had an overall accuracy of 98.0% in training and 81.1% in simulation. Thus, the application of artificial intelligence has the potential to objectively assist embryologists during the choice of the most suitable embryo for transfer, and thus, moving from the in silico (laboratory) field towards clinical practice in assisted reproduction. LISTA DE ABREVIATURAS E SIGLAS ART - Assisted Reproductive Technology; IA - Inteligência Artificial; GLCM - Gray Level Co-occurrence Matrix; LBP - Local Binary Patterns; RNA - Rede Neural Artificial; AG - Algoritmo Genético; ROC - Receiver Operating Characteristic; AUC - Area Under the Curve; SET - Single Embryo Transfer; DET - Double Embryo Transfer; TE – Trofectoderme; MCI - Massa Celular Interna; EX - Expansão do blastocisto. 8 1 INTRODUÇÃO GERAL Esta dissertação para o programa de Mestrado em Farmacologia e Biotecnologia se encontra dividida em quatro seções principais. A primeira, denominada Introdução Geral aborda os aspectos teóricos do trabalho e metodologias utilizadas. A seção de Materiais e Métodos aborda os materiais e metodologias desenvolvidos e utilizados durante o trabalho de maneira mais detalhada. A parte subsequente, Artigo, corresponde a uma proposta de publicação resultante do trabalho efetuado. Finalizando, as seções Anexos 1 e 2 compreendem uma parte dos resultados obtidos e as normas de publicação do periódico escolhido, respectivamente. 1.1 Introdução As tecnologias de reprodução assistida, do inglês, assisted reproductive technology (ART) revolucionaram a fertilidade humana por meio do oferecimento de tratamentos reprodutivos a pacientes sub/inférteis. Desde o início da utilização destas técnicas, em 1978, com o nascimento de Louise Brown (Steptoe e Edwards, 1978), foi relatado que cerca de metade dos nascimentos obtidos por meio da ART ocorreram na última década, demonstrando o seu crescente uso e progressivo aprimoramento ao longo do tempo (Ledford, 2018; Sciorio et al., 2019; Pinto et al., 2021). Durante a utilização destas técnicas em clínicas de reprodução assistida, a seleção do embrião de melhor qualidade a ser transferido para a paciente é uma etapa fundamental para o sucesso da futura gestação. Para isso, são utilizados parâmetros baseados em aspectos morfológicos do embrião e observados por meio de microscopia óptica para a avaliação de sua qualidade (Balaban et al., 2011; Nasiri e Eftekhari-Yazdi, 2015; Puga-Torres et al., 2017). Dentre os sistemas de avaliação existentes, o mais utilizado no Brasil é o sistema de classificação desenvolvido por Gardner e Schoolcraft (1999), no qual a qualidade morfológica é avaliada com base no estágio de blastocisto, os quais incluem os estágios de expansão e eclosão: classificados de 1 (menor grau de expansão) a 6 (totalmente eclodido); os graus de compactação da massa celular interna, classificada de A (muitas células firmemente compactadas) a C (poucas células) e da trofectoderme, classificada de A (muitas células formando epitélio 9 coeso) a C (células grandes e escassas) (Balaban et al., 2011; Puga-Torres et al., 2017; Van Den Abbeel et al., 2013). Com base nisso, a seleção embrionária depende da experiência do avaliador (embriologista) no momento da classificação e, além disso, pode ser influenciada pelo seu humor, fadiga etc. Portanto, a subjetividade e consequente divergências na classificação embrionária são fatores intrínsecos no momento da avaliação, tanto entre embriologistas (erro inter-observador) quanto pelo mesmo embriologista (erro intra-observador) (Sundvall et al., 2013). Assim, mesmo com os avanços obtidos ao longo do tempo e a existência de parâmetros que auxiliam na avaliação embrionária, a gestação após a ART não é garantida. A taxa de sucesso permanece baixa, em torno de 30 a 40% dos embriões produzidos in vitro resultam em gestação clínica, e cerca de 10 a 30% progridem para o nascimento a termo (Weitzman et al., 2010; De Geyter, 2018; Vogiatzi et al., 2019). Dessa maneira, uma forma de avaliação objetiva e reprodutível é necessária para o aumento do sucesso gestacional na ART. Assim, o objetivo deste trabalho foi avaliar a exequibilidade de variáveis originadas de três fontes distintas - morfologia do blastocisto, morfocinética do desenvolvimento embrionário e características relacionadas com a paciente que passa pelo tratamento de reprodução assistida - serem preditivas de gestação por meio da detecção de batimento cardíaco fetal, quando utilizadas como entradas para um software baseado em inteligência artificial (IA). 1.2 Sistema time-lapse Nas clínicas, em geral, os embriologistas retiram os embriões das incubadoras algumas vezes para avaliar sua morfologia. Todavia, esta avaliação não permite o pleno acesso à dinâmica de todo o desenvolvimento embrionário. Além disso, retirá-los em excesso pode submeter as células ao estresse oxidativo e prejudicar o seu desenvolvimento (Kovacs, 2014; Cruz et al., 2011). Em busca do aumento da taxa de gestação, os sistemas de cultivo de embriões vêm sendo melhorados, aliados à implementação de uma cultura ininterrupta, a qual permite o acompanhamento do desenvolvimento embrionário sem a necessidade de retirá-los da incubadora (Kovacs, 2014). O sistema time-lapse inclui uma incubadora acoplada a um microscópio e câmeras conectadas a um computador externo. As imagens capturadas são 10 dadas em intervalos definidos, podendo ser entre 5 a 20 minutos, e em até 11 planos focais. O agrupamento das imagens capturadas por este sistema forma um vídeo, o qual permite o acesso, de modo não-invasivo, à morfologia e à morfocinética (tempos do desenvolvimento) embrionárias (Wong et al., 2010; Milewski e Ajduk, 2017; Rubio et al., 2012; Kovacs, 2014; Minasi et al., 2020). Dentre os equipamentos que utilizam o sistema time-lapse estão o Primo Vision® (Vitrolife), o Geri® (Genea Biomedx) e o EmbryoScope® (Vitrolife). O investimento nestes equipamentos vêm crescendo dentro das clínicas, com o intuito de melhorar a seleção embrionária (Tejera et al., 2016; Aparicio-Ruiz et al., 2018). Em comparação à avaliação estática convencional, o sistema time- lapse tem possibilitado que mais de um embriologista realize várias observações do mesmo embrião, permitindo um controle não-invasivo de todo o seu desenvolvimento (Meseguer et al., 2012). 1.3 Processamento de imagens Após a obtenção de imagens mediante sistema time-lapse, é possível realizar o processamento digital de imagens, e posterior extração automatizada de variáveis preditivas da qualidade morfológica do blastocisto humano (Rocha et al., 2018). O processamento digital de imagens refere-se a técnicas computacionais utilizadas para o aprimoramento de imagens. Estas técnicas permitem a extração de características quantitativas da imagem, como aquelas relacionadas à circularidade, padrões de luminosidade, textura, entre outras (Gonzalez e Woods, 2007; Rocha et al., 2016). Técnicas de processamento digital de imagens foram realizadas anteriormente para a seleção semiautomatizada da qualidade de blastocistos de camundongos (Matos et al., 2014) e para a seleção automatizada de blastocistos bovinos (Rocha et al., 2017a e 2017b). Descrições detalhadas de cada etapa podem ser encontradas na seção de Materiais e Métodos, sendo que, os próximos tópicos abordarão os aspectos teóricos das principais técnicas utilizadas. 11 1.3.1 Transformada de Hough A Transformada de Hough pode ser considerada um dos métodos mais utilizados para a detecção de qualquer forma definida, e mais especificamente, de círculos em processamento de imagens, por meio da Circle Hough Transform. De forma resumida, esta transformada realiza um mapeamento entre o espaço da imagem e um espaço de parâmetros, considerando como base uma versão binária da imagem original, após tal imagem ter sido submetida à um procedimento de detecção de bordas (Atherton e Kerbyson, 1999; Matos, 2014). 1.3.2 Análises de textura A textura é uma característica relevante para a identificação de regiões de interesse em uma imagem. A textura pode ser definida como padrões aleatórios regulares que se repetem por uma região, de maneira a fornecer informações sobre o arranjo estrutural da superfície em uma imagem (Haralick et al., 1973; Roberti de Siqueira et al., 2013; Matos, 2014). Dentre os sistemas para a classificação de texturas, está a Gray Level Co-occurrence Matrix (GLCM), a qual pode ser considerada um método robusto na classificação de texturas, por meio de uma matriz de co-ocorrência, a qual descreve a distribuição espacial de valores de cinza em uma determinada área (Hu et al., 2008, Matos, 2014). O método de Local Binary Patterns (LBP) refere-se à outra técnica de classificação de texturas, a qual pode ser utilizada como operador local de textura, pela descrição de texturas locais em escala de cinza, com base na análise de variações locais e na atribuição de valores para diferentes padrões na imagem (Ojala et al., 1996; Nanni et al., 2010). 1.4 Morfocinética embrionária Com a introdução do sistema time-lapse na rotina laboratorial, tornou-se possível o acompanhamento da cinética do desenvolvimento embrionário de forma contínua. A análise dos tempos das divisões celulares vêm sendo correlacionada com a viabilidade embrionária (Lundin et al., 2001; Mio e Maeda, 2008; Meseguer et al., 2011). 12 Os parâmetros morfocinéticos apresentam nomenclaturas definidas de acordo com o evento ocorrido em cada etapa do desenvolvimento embrionário (Tabela 1) e vêm sendo utilizados para auxiliar os embriologistas a identificarem os embriões de melhor qualidade. Embora a morfologia embrionária seja considerada o padrão ouro na avaliação embrionária até hoje, os parâmetros da morfocinética vêm demonstrando potencial para refinar a seleção embrionária (Storr et al., 2015; ESHRE Working group on Time-lapse technology, 2020). Tabela 1 Nomenclatura dada aos principais parâmetros derivados da morfocinética embrionária. Adaptado de: ESHRE Working group on Time-lapse technology, 2020. Terminologia Descrição do evento morfocinético tPB2 O segundo corpúsculo polar é completamente separado do oolema tPNa Aparecimento de pronúcleos individuais; tPN1a, tPN2a, tPN3a... tPNf Período de desaparecimento dos pronúcleos; tPN1f; tPN2f... tZ Último período antes do tPNf tn Primeiro frame em que um embrião atinge ”n” número de blastômeros (t2, t3, t4...) tTM Mitose tricotômica em diferentes estágios tSC Primeira evidência de compactação tM Tempo de conclusão do processo de compactação tSB Início da blastulação tB Blastocisto em que a blastocele atinge aproximadamente metade do volume do embrião tE ou tEB Início da expansão tHN Fim da fase de expansão e início do processo de eclosão tHD ou tHB Blastocisto totalmente eclodido Psyn Tempo desde o desaparecimento do pronúcleo até a primeira citocinese Não mencionado Tempo entre a quebra do envelope nuclear e a divisão subsequente em duas células s2 Tempo entre a divisão em três células e a 13 divisão subsequente em quatro células s3 Tempo entre a divisão em cinco células e a divisão subsequente em oito células ECCI Duração do primeiro ciclo celular (t2-tPB2) cc2 Ciclo celular do blastômero: Duração do segundo ciclo celular cc3 Ciclo celular do blastômero: Duração do terceiro ciclo celular ECC2 Ciclo celular do embrião: t4-t2 ECC3 Ciclo celular do embrião: t8-t4 Contração do blastocisto Diminuição do volume da blastocele tRE Tempo de início da reexpansão tCRE Tempo de conclusão da reexpansão Alguns dos trabalhos que utilizaram marcadores morfocinéticos, identificaram diferentes parâmetros como preditivos de implantação: t3, cc2 e t5 (Basile et al., 2015); tSB (Goodman et al., 2016); s2, cc3 e t5 (Barrie et al., 2017). Dessa forma, atualmente, não há um algoritmo proveniente de sistema time- lapse que origine um padrão morfocinético coeso e universalmente aceito (Kaser e Racowsky, 2014; Aparicio-Ruiz et al., 2018). 1.5 Pacientes É crescente a procura e demanda por tratamentos de reprodução assistida, em razão do aumento dos problemas relacionados à sub/infertilidade. Além disso, atualmente há a tendência, cada vez maior, da mulher postergar a maternidade, em razão de diversos fatores, como estratégias anticoncepcionais eficazes e a priorização dos objetivos de carreira profissional (Mills et al., 2011; Leridon, 2004; Zahmatkeshan et al., 2019; Leader et al., 2018). Nas últimas décadas, vem ocorrendo um aumento do número de mulheres que optam por uma gestação biologicamente mais tardia (igual ou acima de 35 anos). Assim, a crescente prevalência da infertilidade pode ser fortemente associada com o envelhecimento reprodutivo (Mills et al., 2011; 14 Schmidt et al., 2012; Leader et al., 2018; Kahveci et al., 2018; Klein e Sauer, 2001). Além da idade materna avançada, o índice de massa corporal (IMC) da paciente influencia o sucesso gestacional e tem impacto sob a morfocinética do desenvolvimento embrionário. A taxa de aborto foi considerada maior em mulheres abaixo do peso, comparadas com àquelas pacientes de peso normal. Já a obesidade materna foi relacionada a um desenvolvimento embrionário mais lento (Bartolacci et al., 2019). Durante o tratamento, mesmo após a estimulação ovariana, o número e a qualidade de oócitos disponíveis podem ser limitados, influenciando, também, o sucesso gestacional (Milachich et al., 2016). Em relação à quantidade ideal de oócitos, não há consenso na literatura: Timeva et al. (2006) consideraram entre 5 e 15 oócitos; entre 11 e 15 oócitos maduros para Steward et al. (2014) e 15 oócitos, de acordo com Sunkara et al. (2011). Além disso, há uma relação inversa entre o sucesso gestacional e a quantidade de tentativas anteriores malsucedidas de ciclos de tratamento, sendo que a primeira tentativa representa a maior chance de sucesso e após a quarta tentativa, a chance diminui drasticamente (Templeton et al., 1996; Nelson e Lawlor, 2011). 1.6 Inteligência artificial A utilização de sistemas baseados em IA constitui um dos avanços mais impactantes em diversos campos do conhecimento, incluindo a área médica. A IA refere-se a modelos preditivos capazes de identificar agrupamentos informativos dentro de um conjunto de dados. No aprendizado de máquina, por exemplo, um subcampo da IA, estes modelos tentam se aproximar da capacidade humana de reconhecer padrões, utilizando de forma objetiva, a ciência da computação (Greener et al., 2022). Dentre as técnicas que compõem a IA, duas específicas - redes neurais artificiais (RNAs) e algoritmos genéticos (AGs) - serão destacadas a seguir. 15 1.6.1 Redes neurais artificiais As RNAs são baseadas na conectividade e comportamento de neurônios existentes em um cérebro biológico. Elas são formadas por neurônios artificiais organizados em camadas, as quais formam redes, sendo que a saída de uma camada também se torna a entrada para a próxima. As conexões, baseadas nas sinapses que ocorrem dentro do cérebro, possibilitam que um sinal flua da camada de entrada (inputs) para a camada de saída (outputs), por meio de camadas ocultas ou intermediárias. Esta configuração é denominada de redes neurais multicamadas (Goethals et al., 2007; Haykin, 2001; Ruhoff et al., 2010; Greener et al., 2022). As RNAs são exemplos de técnicas que apresentam a capacidade de aprendizado de máquina, por meio do treinamento, ou seja, a aplicação de um algoritmo de aprendizado, com o intuito de obter uma resposta que represente a informação atribuída (Kriesel, 2005). O aprendizado pode ser denominado de supervisionado quando os dados do modelo são rotulados, isto é, mensurados experimentalmente ou atribuídos por seres humanos. Neste caso, o objetivo da RNA é encontrar uma associação entre a informação fornecida e o resultado rotulado. Já o aprendizado não supervisionado pode identificar padrões sem a necessidade de rotulá-los. Estas abordagens também podem ser combinadas de forma semi-supervisionada, quando conjuntos de dados rotulados são combinados com dados não rotulados (Greener et al., 2022). Geralmente, em um modelo de aprendizado supervisionado, um conjunto separado de validação é utilizado para monitorar o treinamento, sem influenciá- lo, com o objetivo de evitar um possível overfitting. Overfitting significa que o modelo está simplesmente memorizando as características dos dados de treinamento e perdendo a capacidade de generalização para novos dados. Os modelos que apresentam overfitting ou underfitting fornecerão predições errôneas a partir de dados que não fazem parte do treinamento, e por isso, devem ser evitados. Uma vez treinado, o modelo pode ser testado com dados não utilizados para o treinamento (Kragh e Karstoft, 2021; Greener et al., 2022). Entre os algoritmos de aprendizado supervisionado, está o backpropagation, utilizado para ajustar os parâmetros do treinamento. Este algoritmo pode ser dividido em uma etapa de propagação, na qual ocorre o 16 cálculo dos sinais propagados pelos neurônios. Quando o algoritmo atinge a última camada, é realizado o cálculo do erro, quando o valor obtido é comparado com o valor esperado de saída. Em seguida, na etapa de retropropagação, os valores dos sinais são reajustados a partir da camada de saída até atingir a camada de entrada. Este processo ocorre de maneira iterativa até alcançar o critério mínimo de acurácia estabelecido (Haykin, 2001; Greener et al., 2022). 1.6.2 Algoritmo genético Os AGs constituem técnicas computacionais de otimização capazes de resolver problemas por meio de uma estratégia evolutiva. O algoritmo simula indivíduos inicialmente aleatórios, que contém uma solução para um problema. Por meio de processos evolutivos, como crossing-over (produção de recombinação entre os indivíduos), mutação (agregação de modificações) e migração (uma parte dos indivíduos é trocada por indivíduos aleatórios), as melhores soluções são selecionadas para gerar seus sucessores e, da mesma forma, os melhores sucessores são escolhidos para se propagarem até que o limite de iterações determinado seja atingido por meio do critério de parada, o qual indica ao AG quando concluir as operações (Eiben e Smith, 2003; Carr, 2014). Estas variações evolutivas possibilitam que o AG possa selecionar os indivíduos mais bem sucedidos a cada iteração do algoritmo, isto é, as RNAs com as melhores acurácias (Eiben e Smith, 2003; Pozo et al., 2011). 1.7 Análises estatísticas Geralmente, na reprodução assistida, o número de resultados negativos pode exceder o número de resultados positivos. O desequilíbrio de classes não é necessariamente indesejado, uma vez que o objetivo do modelo desenvolvido éestimar a chance real de gestação. Dessa forma, o modelo deve ser aplicado em dados de embriões e pacientes semelhantes à realidade, isto é, aprender sobreuma probabilidade enviesada de gestação (Kragh e Karstoft, 2021). Neste caso, os conjuntos de dados não devem ser balanceados. Os conjuntos devem representar a distribuição realista do que ocorre em uma clínica, na qual o modelo se destina a ser usado (Kragh e Karstoft, 2021). 17 As métricas independentes de desequilíbrio de classe, como sensibilidade (taxa de verdadeiros positivos), especificidade (taxa de falsos positivos) e área abaixo da curva de característica de operação do receptor são técnicas estatísticas recomendadas para a interpretação do modelo (Kragh e Karstoft, 2021). Aspectos teóricos de cada técnica estatística utilizada para a interpretação dos dados obtidos serão demonstrados a seguir. 1.7.1 Análise de colinearidade A análise de colinearidade em variáveis utilizadas como entrada para RNAs é uma prática comum e recomendada (Walcza e Cerpa, 1999). Através desta análise é possível eliminar variáveis correlacionadas entre si, as quais apresentam o mesmo mérito preditivo para a constituição do programa e podem ser reduzidas para apenas uma delas (que seja representativa das demais) (Matos, 2014). 1.7.2 Simulação A simulação, ou blind test, pode ser definida como um teste de acurácia em que o modelo de predição, já treinado, passa a ser testado com novos dados (European Avm Alliance, 2012). Após a seleção das RNAs de melhores acurácias, elas foram testadas com dados que não foram utilizados anteriormente para o treinamento da RNA. Dessa forma, o resultado obtido pela RNA foi comparado às saídas desejadas. Este teste permite uma análise de acurácia significativa e demonstra a robustez do programa utilizado. 1.7.3 Matriz de confusão Uma forma de análise dos resultados obtidos por RNAs é por meio da Matriz de Confusão. Esta matriz permite observar o cruzamento entre os dados fornecidos pelas RNAs e o gabarito original, isto é, as observações reais (gestação ou não) com valores previstos (binários). Dessa maneira, é possível obter a acurácia geral do sistema, assim como a acurácia de cada classe 18 (Machart e Ralaivola, 2012). A acurácia corresponde a uma medida de desempenho mais intuitiva e é amplamente utilizada (Kragh e Karstoft, 2021). 1.7.4 Receiver Operating Characteristic (ROC) Curve e Area Under the Curve (AUC) Outra forma de análise é por meio de uma curva de Característica de Operação do Receptor ou curva ROC (do inglês Receiver Operating Characteristic). A curva ROC é obtida por meio de um gráfico com um diagrama de valores que representam a sensibilidade em função da especificidade. Ao contrário da acurácia, estas métricas são independentes da prevalência (Watson e Petrie, 2010; Kragh e Karstoft, 2021). A área abaixo da curva ROC ou AUC (do inglês Area Under the Curve, também denominada de AUROC) é utilizada para comparar a acurácia geral de diferentes testes para a mesma condição e opera em valores preditivos contínuos, agregando desempenho em todos os limites de predição possíveis (Watson e Petrie, 2010; Kragh e Karstoft, 2021). Uma AUC próxima de 1,0 seria a acurácia perfeita (100%), enquanto os valores de 0,5 indicariam um acerto ao acaso e de 0,0 o acerto 100% errado. 19 2 MATERIAIS E MÉTODOS Nesta seção, serão detalhadas as etapas metodológicas desenvolvidas durante o trabalho. Na seção Artigo, estas metodologias serão novamente apresentadas de maneira mais resumida. 2.1 Desenvolvimento do banco de dados Os dados utilizados neste trabalho foram fornecidos por meio de um convênio científico firmado entre os Profs. Drs. Marcelo F. G. Nogueira e José Celso Rocha (UNESP, Faculdade de Ciências e Letras, FCL, Assis/SP) e o Prof. Dr. Marcos Meseguer (Instituto Valenciano de Infertilidad, IVI-RMA, Valencia, Espanha). Os dados referem-se ao período de 2017 a 2019. Este trabalho foi realizado no Laboratório de Matemática Aplicada, localizado na FCL, UNESP, Câmpus de Assis, sob a responsabilidade do Prof. José Celso Rocha e conta com 30 computadores. O conjunto de dados está contido em uma planilha, a qual contém 369 dados relacionados aos embriões cultivados na clínica IVI e suas respectivas pacientes (sem identificação). Destes 369 dados, 354 imagens foram recebidas da clínica. Com base na planilha fornecida, há disponível a informação sobre a transferência embrionária, a qual pode ser descrita como transferência única de embrião (single embryo transfer - SET), transferência dupla de embriões (double embryo transfer - DET) ou ainda apresentar célula vazia na planilha (sem informações sobre SET ou DET). Considerando que pode ser duvidoso saber qual embrião resultou em gestação quando a transferência é dupla ou quando a informação não está disponível (célula vazia) e que esta informação é mandatória para o modelo desenvolvido neste trabalho, somente os dados correspondentes à SET foram considerados para as análises. Assim, dos 369 dados da planilha, foram utilizados 272 dados correspondentes à SET. Os vídeos dos embriões e seus respectivos tempos de desenvolvimento são provenientes de uma incubadora que utiliza tecnologia time-lapse, o equipamento EmbryoScope+®, da Vitrolife (Figura 1). Para fragmentar os vídeos em imagens, foi utilizado o software “Free Video to JPG Converter” (Figura 2), o 20 qual gerou aproximadamente entre 500 e 700 imagens de cada embrião, dependendo do tamanho de cada vídeo. Destas imagens fragmentadas, foram selecionadas aquelas em que o embrião se encontra em estágio de blastocisto ou o mais próximo possível deste estágio. Além disso, os vídeos foram recebidos em apenas um plano focal, por isso, a imagem selecionada de cada vídeo foi aquela considerada a de melhor foco (em que foi possível visualizar todas as partes do blastocisto), dentre as que estavam disponíveis. Figura 1 Incubadora EmbryoScope+® (Vitrolife) que utiliza tecnologia de time- lapse. 21 Figura 2 Software “Free Video to JPG Converter” utilizado para fragmentar os vídeos dos embriões obtidos por time-lapse. Os parâmetros utilizados foram: “10 quadros”; “1 segundo”, “500 quadros do vídeo” e “Todo quadro”. O software converte o vídeo em imagens no formato JPG. 2.2 Morfologia embrionária Para a morfologia embrionária, o estágio de blastocisto é mandatório para o modelo desenvolvido. O software de processamento de imagens inicialmente desenvolvido para a espécie murina (Matos et al., 2014) e bovina (Rocha et al., 2017b) foi adaptado para a espécie humana (Rocha et al., 2018; Zaninovic et al., 2018) considerando este estágio do desenvolvimento. Para a morfologia do blastocisto, dos 272 dados de SET, 259 correspondem às imagens recebidas. De acordo com os seguintes critérios de exclusão, 24 imagens foram excluídas devido à visualização incompleta de todo o blastocisto (n = 1), à luminosidade insuficiente para reconhecer regiões individuais (n = 1), ao blastocisto estar fora de foco (n = 11) e à exibição de um embrião fora do estágio de blastocisto (n = 11) (Figura 3). 22 (a) (b) (c) (d) Figura 3 Exemplos de imagens excluídas pelos seguintes critérios de exclusão: (a) visualização incompleta de todo o blastocisto; (b) luminosidade insuficiente para reconhecer regiões individuais; (c) blastocisto fora de foco e (d) exibição de um embrião fora do estágio de blastocisto. Após a exclusão destas 24 imagens, 235 imagens foram utilizadas para o processamento digital e extração automatizada de variáveis preditivas da morfologia do blastocisto. Todos os filtros e técnicas utilizadas para o processamento estão descritos detalhadamente no trabalho de Chéles et al. (2022). Todos os procedimentos foram realizados na plataforma MatLab®. As etapas relacionadas à segmentação da imagem foram: conversão da imagem para escala de cinza; detecção de borda utilizando o filtro de Canny; isolamento parcial do blastocisto por meio da Transformada de Hough; ajuste de histograma, para melhorar a resolução da imagem; extração do gradiente de magnitude por meio de detecção de bordas pelo método de Prewitt; conversão de uma imagem binária para o isolamento total do blastocisto (o isolamento total possibilita a obtenção de imagens do blastocisto isolado, trofectoderme (TE) isolada e massa celular interna (MCI) + blastocele isoladas); ajuste de limite por meio da intensificação dos tons de cinza e isolamento da MCI por meio do filtro de Gabor (Chéles et al., 2022). As etapas e a extração de variáveis associada a cada etapa podem ser visualizadas na Tabela 2 e um fluxograma ilustrando a 23 segmentação de blastocistos a partir de uma imagem fornecida pela incubadora EmbryoScope® pode ser observado na Figura 4. Tabela 2 Etapas da segmentação de imagens provenientes do equipamento EmbryoScope® e o tipo de variável extraída nestas etapas. Trofectoderme - TE; Massa Celular Interna - MCI; Local Binary Patterns - LBP; Gray Level Co-occurrence Matrix - GLCM. Adaptado de: Chéles et al. (2022). Ordem das etapas Etapas Extração de variáveis 1 Conversão da imagem de entrada para escala de cinza - 2 Detecção de borda utilizando o filtro de Canny - 3 Isolamento parcial do blastocisto - 4 Ajuste de histograma - 5 Método de Prewitt - 6 Conversão binária - 7 Isolamento total do blastocisto Medição da área e raio do blastocisto por equações usando o Matlab® Image Processing ToolboxTM 8 Isolamento da TE e MCI + blastocele Variáveis que descrevem a TE e a MCI + blastocele usando o Matlab® Image Processing ToolboxTM, algoritmos (GLCM e LBP) 9 Intensificação da escala de cinza - 10 Isolamento da MCI Variáveis que descrevem a MCI usando o Matlab® Image Processing ToolboxTM, algoritmos (GLCM e LBP) 24 Figura 4 Fluxograma de segmentação de blastocistos a partir de uma imagem fornecida pela incubadora EmbryoScope®. A primeira imagem (sem numeração) corresponde à imagem original da incubadora e a último imagem (sem numeração e formada por 6 imagens menores) apresenta cada parte do blastocisto segmentada pelo software. As imagens intermediárias são identificadas pelos respectivos números das etapas apresentadas na Tabela 2. Adaptado de: Chéles et al. (2022). As etapas do processamento digital de imagens resumidas na Tabela 2 e na Figura 4 geraram automaticamente um total de 33 variáveis, cada uma representando um aspecto diferente da expansão do blastocisto (EX) ou uma sub-região (TE, MCI + blastocele ou MCI). De acordo com Chéles et al. (2022), as definições de cada variável podem ser descritas de acordo com a propriedade que apresentam: textura, média de nível de cinza, desvio padrão do nível de cinza, valor modal (valor de pixel mais frequente), relações e nível de luz. Segue a descrição de cada uma delas: 25 Textura 1. Variação de textura na MCI e blastocele Representa as diferenças de nível de cinza de textura na MCI e na blastocele. Reflete a nitidez da imagem e a profundidade dos sulcos. Sulcos mais profundos estão relacionados a maior variação e nitidez. 2. Similaridades de textura na MCI e blastocele Representa a dependência linear dos níveis de cinza. 3. Uniformidade da distribuição de níveis de cinza na MCI e blastocele Representa a uniformidade da distribuição dos níveis de cinza através da soma dos elementos da GLCM ao quadrado. 4. Proximidade da escala de cinza com a diagonal da GLCM na MCI e blastocele Representa a distribuição dos elementos da GLCM de acordo com os valores de referência da sua diagonal. 5. Variação de textura na MCI; 6. Similaridades de textura na MCI; 7. Uniformidade da distribuição dos níveis de cinza na MCI; 8. Proximidade da escala de cinza com a diagonal da GLCM na MCI Estas variáveis correspondem às variáveis 1, 2, 3 e 4, respectivamente, embora sejam calculadas a partir da imagem segmentada da MCI. 9. Variação de textura na TE; 10. Similaridades de textura na TE; 11. Uniformidade da distribuição dos níveis de cinza na TE; 12. Proximidade da escala de cinza com a diagonal da GLCM na TE Estas variáveis correspondem às variáveis 1, 2, 3 e 4, respectivamente, embora sejam calculadas a partir da imagem segmentada da TE. 13. Descritor local de textura na EX Descritor de padrão de textura usado para descrever os padrões de textura local de uma imagem. O algoritmo extrai informações sobre a textura local 26 estabelecendo um limiar para “n” vizinhos em relação ao valor do pixel central. O resultado é um número binário entre 0 e 255. 14. Descritor local de textura na MCI; 15. Descritor local de textura na TE Estas variáveis correspondem à variável 13, embora sejam calculadas a partir de imagens segmentadas da MCI e TE, respectivamente. Média do nível de cinza 16. Média do nível de cinza na MCI e blastocele Representa a intensidade média do pixel (valor do nível de cinza) na imagem segmentada da MCI e blastocele. 17. Média do nível de cinza na TE Representa a intensidade média do pixel (valor do nível de cinza) na imagem segmentada da TE. 18. Média do nível de cinza no blastocisto Representa a intensidade média do pixel (valor do nível de cinza) para o blastocisto todo com a inclusão da zona pelúcida. Desvio padrão do nível de cinza 19. Desvio padrão do nível de cinza na MCI e blastocele Representa o desvio padrão da intensidade do pixel na imagem segmentada da MCI e blastocele. 20. Desvio padrão do nível de cinza na TE Representa o desvio padrão da intensidade do pixel na imagem segmentada da TE. Valor modal 21. Valor modal na MCI e blastocele 27 Representa o valor de intensidade de luz mais frequente na imagem segmentada da MCI e blastocele. 22. Valor modal na TE Representa o valor de intensidade de luz mais frequente na imagem segmentada da TE. Relações 23. Soma da imagem binária do blastocisto O limiar da imagem é dado pela soma da imagem binária dividida pela área do blastocisto isolado calculada a partir do raio. 24. Raio do blastocisto Representa o raio do blastocisto. 25. Área da MCI Área da imagem segmentada da MCI. 26. Área da blastocele Área da imagem segmentada da blastocele. 27. Relação entre MCI e blastocele Representa a expansão do blastocisto. Nível de luz 28. Luminosidade média na MCI e blastocele Todos os pixels com intensidade luminosa maior que 10 e menor que 10 da intensidade média são contados, e esse valor é então dividido pela área total do blastocisto. 29. Luminosidade média na TE 28 Esta variável corresponde à variável 28, embora calculada usando valores da imagem segmentada da TE. 30. Região mais clara na MCI e blastocele Área da região mais clara na imagem segmentada da MCI e blastocele. 31. Região mais clara na TE Área da região mais clara na imagem segmentada da TE. 32. Região mais escura na MCI e blastocele Área mais escura na imagem segmentada da MCI e blastocele. 33. Região mais escura na TE Área mais escura na imagem segmentada da TE. Após o processamento, em 20 imagens, o software não foi eficaz em segmentar corretamente a imagem (Figura 5), principalmente devido à baixa qualidade da imagem original. Dessa forma, 215 imagens foram efetivamente utilizadas para aplicação das técnicas de IA. As 33 variáveis automaticamente obtidas foram utilizadas como entradas para as RNAs para o conjunto de morfologia do blastocisto. Estas variáveis buscam representar numericamente para o software de IA todas as características biologicamente relevantes do blastocisto. 29 Figura 5 Exemplo de uma imagem excluída em que o software de processamento digital não gerou corretamente as seis versões (à direita) da imagem original (à esquerda). O software de processamento digital de imagens gerou automaticamente valores numéricos para imagens sem e com colinearidade na plataforma MatLab®. Após a análise de colinearidade, 20 variáveis foram mantidas (Item 7.1, Anexo 1), as quais também foram utilizadas como entradas para a morfologia embrionária para a aplicação das técnicas de IA. 2.3 Morfocinética embrionária As variáveis da morfocinética foram selecionadas com base na disponibilidade das mesmas na planilha recebida e por meio de um levantamento bibliográfico. Durante o desenvolvimento embrionário, os tempos de divisões das células, a sincronia em que estas ocorrem e os tempos dos ciclos celulares são relevantes biologicamente como variáveis relacionadas à morfocinética (Chawla et al., 2014). Dessa maneira, os tempos t2, t3, t4, t5, t6, t7 e t8 (tempos de clivagem para um embrião de duas, três, quatro, cinco, seis, sete e oito células, respectivamente) foram considerados como base para a escolha de outras variáveis derivadas da morfocinética. A sincronia das divisões pode ser determinada pela diferença entre a quarta e a terceira divisão celular, representada pela variável s2 (t4-t3) (Ciray et al., 2014). O ciclo celular pode ser mensurado pelas variáveis cc2 (diferença entre a terceira e a segunda divisão embrionária) e cc3 (diferença entre a quinta 30 e a terceira divisão embrionária). Além destas, a variável relcc2 ([(t3-t2)/(t5- t2)]*100), que descreve a regularidade em que as clivagens ocorrem e a variável score global (relação entre t2, cc2, cc3 e relcc2) também foram utilizadas (Desai et al., 2014; Fishel et al., 2017; Campbell, 2014). Variáveis relacionadas especificamente ao estágio de blastocisto foram selecionadas: tSB (tempo de início de blastulação), tB (tempo em que a blastocele atinge aproximadamente metade do volume do blastocisto) e as relações tSB-t8 (diferença entre o tempo de início de blastulação e a oitava divisão embrionária) e tB-tSB (diferença entre o tempo em que a blastocele atinge aproximadamente metade do volume do blastocisto e do início de blastulação). A totalidade de 16 variáveis (t2, t3, t4, t5, t6, t7, t8, s2, cc2, cc3, relcc2, score global, tSB, tB, tSB-t8 e tB-tSB) buscou representar de maneira fidedigna, embora aproximada, a cinética do desenvolvimento embrionário. Dos 272 dados de SET disponíveis, 49 dados foram excluídos devido à ausência de informações de tempo do desenvolvimento. Assim, um total de 223 dados foram utilizados para a aplicação das técnicas de IA. 2.4 Pacientes As variáveis relacionadas com a paciente foram selecionadas de acordo com a relevância para o sucesso do tratamento por reprodução assistida, isto é, por meio de um levantamento bibliográfico. As variáveis consideradas são relacionadas às características demográficas, físicas e clínicas das pacientes. Estas variáveis estão na planilha fornecida pela clínica: idade, IMC, número de oócitos e tentativas anteriores. Com o objetivo de avaliar tais variáveis e seu impacto no sucesso gestacional, foram elaboradas pontuações para cada uma delas. As RNAs receberam como entradas as pontuações elaboradas, na tentativa de otimizar o treinamento das mesmas, e consequentemente, facilitar o seu aprendizado. Os intervalos foram definidos da seguinte maneira: entre 1 e 10, sendo que, quanto mais próximo de 1 a pontuação, menos favorável a variável para a ocorrência de gestação e quanto mais próximo de 10 a pontuação, mais favorável para a gestação. 31 2.4.1 Idade O aumento da idade materna está diretamente associado ao declínio da fertilidade. Após os 30 anos, inicia-se um declínio considerável da fertilidade, mas após os 40 anos, há uma diminuição crítica na chance de gestação (Tan et al., 2014; Hu et al., 2018; Liao et al., 2019; Wolff et al., 2019; Delbaere et al., 2020). Dessa forma, a relação dos intervalos definidos e as respectivas pontuações para a variável idade podem ser visualizadas na Tabela 3. A pontuação diminui com o aumento da idade da paciente. Tabela 3 Pontuação atribuída à idade das pacientes. Idade (anos) Pontuação ≤ 30 10 31 – 36 8 37 - 42 6 > 42 2 2.4.2 Índice de massa corporal O IMC é uma medida amplamente utilizada para mensurar a altura e o peso dos indivíduos e categorizá-los em grupos (Nuttall, 2015). A Organização Mundial da Saúde divide a população em 4 grupos, com base no cálculo do IMC - peso (kg)/altura(m)²: indivíduos com IMC inferior a 18,5 kg/m², são considerados de baixo peso; indivíduos com IMC entre 18,5 e 25 kg/m², peso normal; indivíduos com IMC entre 25 e 30 kg/m², sobrepeso e indivíduos com IMC superior a 30 kg/m², obesos. (Frankenthal et al., 2019). Estudos apontam que a taxa de gestação em mulheres com baixo peso e com sobrepeso é consideravelmente menor em comparação com mulheres com peso normal (Na et al., 2018; D'Souza et al., 2019; Frankenthal et al., 2019; Purewal et al., 2019; Qiu et al., 2019; Zhou et al., 2020). Dessa forma, pacientes com IMC menor ou igual a 18,5 kg/m² e maior ou igual a 30 kg/m² receberam as pontuações mais baixas. Pacientes com IMC variando de 18,6 a 20 kg/m² e 25 a 29,9 kg/m² receberam pontuações intermediárias, e pacientes com IMC variando de 20,1 a 24,9 kg/m² receberam a pontuação mais alta (Tabela 4). 32 Tabela 4 Pontuação atribuída ao índice de massa corporal (IMC) das pacientes. IMC (kg/m²) Pontuação ≤ 18,5 1 18,6 - 20 7 20,1 – 24,9 10 25 – 29,9 7 ≥ 30 1 2.4.3 Número de oócitos O número ideal de oócitos para o tratamento de reprodução assistida varia entre os estudos, sendo 15 de acordo com o estudo de Milachich e Shterev (2016) e entre 9 e 16 para Liao et al. (2019). Um número reduzido de oócitos devido ao avanço da idade materna e/ou baixa resposta à estimulação ovariana resulta em menor taxa de gestação clínica. Além disso, quando há uma alta contagem de oócitos, muitos deles podem estar imaturos, podendo levar a uma menor taxa de fertilização (Milachich e Shterev, 2016; Hsu et al., 2016). Com base nestes estudos, ao intervalo entre 8 e 20 oócitos foi atribuída a maior pontuação, seguido pelo intervalo de 21 a 29; seguido pelo maior número de oócitos (maior ou igual a 30) e, por fim, os números menores que 8 receberam a menor pontuação (Tabela 5). Tabela 5 Pontuação atribuída ao número de oócitos das pacientes. Número de oócitos Pontuação 0-7 2 8-20 10 21-29 7 ≥ 30 5 2.4.4 Tentativas anteriores Esta variável representa a quantidade de ciclos de tratamento anteriores sem sucesso. Quanto maior o númerode tentativas anteriores, menor a chance de alcançar uma gestação (Vaegter etal., 2017; Supramanian et al., 2020). Com base nos estudos de Nelson e Lawlor (2011), Vaegter et al. (2017) e Supramanian et al. (2020), que demonstraram 33 que a chance de engravidar cai drasticamente após 4 tentativas anteriores sem sucesso, as pontuações foram elaborados conforme mostra a Tabela 6. Tabela 6 Pontuação atribuída ao número de tentativas anteriores da paciente. Tentativas anteriores Pontuação 0 10 1 – 4 8 ≥ 5 4 Com base nos 272 dados de SET, 3 deles foram excluídos por não apresentarem informação sobre os dados das pacientes. Por isso, foram efetivamente utilizados 269 dados para a aplicação das técnicas de IA. 2.5 Implementação das técnicas de Inteligência artificial Neste trabalho, foi utilizado o software de RNAs e AGs já desenvolvido na plataforma MatLab® para a espécie humana (Rocha et al., 2018; Zaninovic et al., 2018). As RNAs foram treinadas separadamente para cada conjunto de entrada (morfologia, morfocinética e paciente), em duplas (morfologia e morfocinética, morfologia e paciente, morfocinética e paciente) e em trio (morfologia, morfocinética e paciente). Considerando que as variáveis da morfologia podem ser sem ou com colinearidade, o número de variáveis de entrada variou para cada conjunto: • Morfologia: 33 (sem colinearidade) e 20 (com colinearidade) variáveis como entradas; • Morfocinética: 16 variáveis; • Paciente: 4 variáveis; • Morfologia e morfocinética: 49 (sem colinearidade) e 36 (com colinearidade) variáveis; 34 • Morfologia e paciente: 37 (sem colinearidade) e 24 variáveis (com colinearidade); • Morfocinética e paciente: 20 variáveis; • Morfologia, morfocinética e paciente: 53 (sem colinearidade) e 40 (com colinearidade) variáveis. O objetivo em realizar todas as combinações foi avaliar a performance das RNAs frente a diferentes fontes de variáveis de entrada para predizer o sucesso gestacional por detecção de batimento cardíaco fetal. Os resultados obtidos das melhores RNAs treinadas separadamente e em duplas para a predição de batimento cardíaco fetal encontram-se no item 7.2 do Anexo 1. No item Resultados da Seção Artigo, serão apresentados os resultados referentes à melhor RNA encontrada para os três conjuntos de variáveis de entrada (morfologia, morfocinética e paciente) para a predição de batimento cardíaco fetal (objetivo principal deste trabalho). Adicionalmente, para a predição de nascimento vivo, somente foram treinadas RNAs considerando os três conjuntos de variáveis juntos como entrada. Os resultados obtidos pela melhor RNA para a predição de nascimento vivo também se encontram na mesmo item. Os dados totais para cada conjunto de entrada foram divididos em dois grupos: um grupo de treinamento, para o aprendizado das RNAs (80% do total) e um grupo de simulação, para testar o desempenho do modelo após o treinamento (20% do total). Para auxiliar no treinamento das RNAs, foram definidos conjuntos de validação e teste do modelo. Para o aprendizado das RNAs, os dados de treinamento (80% do total) foram distribuídos de acordo com 70%, 15% e 15% para treinamento, validação e teste, respectivamente (Chakrabarty eDubey, 2015; Matos, 2014; Kalpana et al., 2015). Esta divisão pode ser considerada padrão na utilização de técnicas de IA (Nogueira et al., 2018; Kulp e Strauss, 2018; Shaik et al., 2020). Para a divisão do banco de dados em treinamento e simulação de cada conjunto isolado e juntos, foram seguidos critérios de inclusão/exclusão, filtrando a planilha com as informações presentes, de acordo com os dados disponíveis e ausentes. Os fluxogramas a seguir (Figuras 6 a 13) ilustram como foram realizadas as divisões para cada conjunto de entrada: 35 Treinamento n = 172 Batimento cardíaco fetal positivo n = 72 Dados utilizados Batimento cardíaco fetal negativo n = 100 Banco de dados n = 272 Banco de Imagens n = 259 n = 215 Dados excluídos n = 44 Simulação n = 43 Batimento cardíaco fetal positivo n = 18 Batimento cardíaco fetal negativo n = 25 • Morfologia Figura 6 Fluxograma da divisão do banco de dados para as variáveis da morfologia. Dos 272 dados de SET, 259 imagens foram recebidas pela clínica. Destes 259 dados, 44 foram excluídos de acordo com os critérios de exclusão (visualização incompleta de todo o blastocisto, luminosidade insuficiente para reconhecer regiões individuais, blastocisto fora de foco, exibição de um embrião fora do estágio de blastocisto e ineficácia do software em segmentar corretamente a imagem). Dos 215 dados utilizados, 80% foram utilizados para o treinamento (172 dados) e 20% para a simulação (43 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. 36 Batimento cardíaco fetal positivo Treinamento n = 178 n = 78 Dados utilizados n = 223 Batimento cardíaco fetal negativo n = 100 Banco de dados n = 272 Batimento cardíaco fetal positivo Dados excluídos n = 49 Simulação n = 45 n = 20 Batimento cardíaco fetal negativo n = 25 • Morfocinética Figura 7 Fluxograma da divisão do banco de dados para as variáveis da morfocinética. Dos 272 dados de SET, 49 foram excluídos por não apresentarem a informação sobre o tempo das divisões celulares. Dos 223 dados utilizados, 80% foram utilizados para o treinamento (178 dados) e 20% para a simulação (45 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. 37 Batimento cardíaco fetal positivo Treinamento n = 215 n = 88 Dados utilizados n = 269 Batimento cardíaco fetal negativo n = 127 Banco de dados n = 272 Batimento cardíaco fetal positivo Dados excluídos n = 3 Simulação n = 54 n = 21 Batimento cardíaco fetal negativo n = 33 • Paciente Figura 8 Fluxograma da divisão do banco de dados para as variáveis da paciente. Dos 272 dados de SET, 3 foram excluídos por não apresentarem informação sobre a paciente. Dos 269 dados utilizados, 80% foram utilizados para o treinamento (215 dados) e 20% para a simulação (54 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. 38 Morfologia n = 215 Banco de dados n = 272 Banco de imagens n = 259 Dados excluídos n = 30 Treinamento n = 148 Batimento cardíaco fetal positivo n = 64 Morfocinética n = 185 Batimento cardíaco fetal negativo n = 84 Simulação n = 37 Batimento cardíaco fetal positivo n = 16 Batimento cardíaco fetal negativo n = 21 • Morfologia e Morfocinética Figura 9 Fluxograma da divisão do banco de dados para as variáveis da morfologia e morfocinética. Dos 272 dados de SET, 259 imagens foram recebidas pela clínica e 215 dados foram utilizados para a morfologia. Destes 215 dados, 30 foram excluídos por não apresentarem informação sobre o tempo do desenvolvimento embrionário. Dos 185 dados utilizados, 80% foram utilizados para o treinamento (148 dados) e 20% para a simulação (37 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. 39 Morfologia n = 215 Banco de dados n = 272 Banco de imagens n = 259 Dados excluídos n = 2 Treinamento n = 170 Batimento cardíaco fetal positivo n = 70 Paciente n = 213 Batimento cardíaco fetal negativo n = 100 Simulação n = 43 Batimento cardíaco fetal positivo n = 18 Batimento cardíaco fetal negativo n = 25 • Morfologia e Paciente Figura 10 Fluxograma da divisão do banco de dados para as variáveis da morfologia e paciente. Dos 272 dados de SET, 259 imagens foram recebidas pela clínica e 215 dados foram utilizados para a morfologia. Dos 215 dados, 2 dados foram excluídos por não apresentarem informação sobre a paciente. Dos 213 dados utilizados, 80% foram utilizados para o treinamento (170 dados) e 20% para a simulação (43 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. 40 Morfocinética n = 223 Batimento cardíaco fetal positivo Banco de dados n = 272 Dados excluídos n = 3 Treinamento n = 176 n = 76 Paciente n = 220 Batimento cardíaco fetal negativo n = 100 Batimento cardíaco fetal positivo Simulação n = 44 n = 19 Batimento cardíaco fetal negativo n = 25 • Morfocinética e Paciente Figura 11 Fluxograma da divisão do banco de dados para as variáveis da morfocinética e paciente. Dos 272 dados de SET, 223 foram utilizados para a morfocinética. Destes 223, 3 foram excluídos por não apresentarem informação sobre a paciente. Dos 220 dados utilizados, 80% foram utilizados para o treinamento (176 dados) e 20% para a simulação (44 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. 41 Banco de dados n = 272 • Morfologia, Morfocinética e Paciente Figura 12 Fluxograma da divisão do banco de dados para as variáveis da morfologia, morfocinética e paciente. Dos 272 dados de SET, 259 imagens foram recebidas pela clínica e 215 dados foram utilizados para a morfologia. Destes 215 dados, 30 foram excluídos por não apresentarem informação sobre o tempo das divisões celulares. Dos 185 dados restantes, 2 foram excluídos por não apresentarem informação sobre a paciente. Dos 183 dados utilizados, 80% foram utilizados para o treinamento (146 dados) e 20% para a simulação (37 dados). A proporção aproximada 20% maior de batimentos cardíacos fetais negativos em relação aos positivos foi mantida para ambos os conjuntos. Morfologia n = 215 Dados excluídos n = 30 Banco de imagens n = 259 Morfocinética n = 185 Dados excluídos n = 2 Treinamento n = 146 Batimento cardíaco fetal positivo n = 63 Paciente n = 183 Batimento cardíaco fetal negativo n = 83 Simulação n = 37 Batimento cardíaco fetal positivo n = 15 Batimento cardíaco fetal negativo n = 22 42 Banco de dados n = 272 • Morfologia, Morfocinética e Paciente Figura 13 Fluxograma da divisão do banco de dados para as variáveis da morfologia, morfocinética e paciente. Dos 272 dados de SET, 259 imagens foram recebidas pela clínica e 215 dados foram utilizados para a morfologia. Destes 215 dados, 30 foram excluídos por não apresentarem informação sobre o tempo do desenvolvimento embrionário. Dos 185 dados restantes, 2 foram excluídos por não apresentarem informação sobre a paciente. Dos 183 dados utilizados, 80% foram utilizados para o treinamento (146 dados) e 20% para a simulação (37 dados). A proporção aproximada 30% maior de nascimentos vivos negativos em relação aos positivos foi mantida para ambos os conjuntos. Morfologia n = 215 Dados excluídos n = 30 Banco de imagens n = 259 Morfocinética n = 185 Dados excluídos n = 2 Treinamento n = 146 Nascimento vivo positivo n = 54 Paciente n = 183 Nascimento vivo negativo n = 92 Simulação n = 37 Nascimento vivo positivo n = 13 Nascimento vivo negativo n = 24 43 O treinamento e a simulação ocorreram separadamente para cada um dos 8 conjuntos de dados. O procedimento foi o mesmo para cada um dos conjuntos: os 30 computadores do Laboratório de Matemática Aplicada, UNESP - Assis, foram colocados para rodar o treinamento das RNAs no software já desenvolvido. Em cada computador, o AG selecionou as melhores RNAs encontradas a cada iteração do algoritmo. Este processo se repetiu ao longo de uma ou duas semanas para cada conjunto, até que um número considerável de melhores RNAs fossem armazenadas em cada computador, isto é, aquelas com o menor erro entre as saídas desejadas e as obtidas. Além disso, foram consideradas para a simulação, as RNAs do conjunto de melhores redes com acurácias iguais ou superiores a 80% para o treinamento. Estas RNAs foram salvas automaticamente em cada computador pelo próprio algoritmo. Após este processo, em apenas um computador, foi realizada a simulação das melhores RNAs obtidas. As melhores RNAs obtidas neste trabalho foram selecionadas quando as melhores redes (do treinamento) obtiveram acurácias iguais ou superiores a 65% na simulação. Após o treinamento, foram obtidas as matrizes de confusão, curvas ROC e AUCs do treinamento e da simulação para avaliar o desempenho das melhores RNAs obtidas. 44 2.6 Referências Bibliográficas Alegre, L.; Bori, L.; Valera, M. D. L. A.; Nogueira, M. F. G.; Ferreira, A. S.; Rocha, J. C.; Meseguer, M. First application of artificial neuronal networks for human live birth prediction on geri time-lapse monitoring system blastocyst images. Fertility & Sterility, v. 114, n. 3, p. e140, 2020. Aparicio-Ruiz, B.; Romany, L.; Meseguer, M. Selection of preimplantation embryos using time-lapse microscopy in in vitro fertilization: State of the technology and future directions. Birth Defects Research, v. 110, n. 8, p. 648– 653, 2018. Atherton, T.; Kerbyson, D. Size invariant circle detection. Image and Vision computing, v. 17, n. 11, p. 795–803, 1999. Balaban, B.; Brison, D.; Calderón, G.; Catt, J.; Conaghan, J.; Cowan, L.; Ebner, T.; Gardner, D.; Hardarson, T.; Lundin, K.; Magli, M. C.; Mortimer, D.; Mortimer, S.; Munné, S.; Royere, D.; Scott, L.; Smitz, J.; Thornhill, A.; Van Blerkom, J.; Van Den Abbeel, E. Istanbul consensus workshop on embryo assessment: proceedings of an expert meeting. Human Reproduction, v. 26, n. 6, p. I270– I283, 2011. Barrie, A.; Homburg, R.; Mcdowell, G.; Brown, J.; Kinglsland, C.; Troup, S. Examining the efficacy of six published time-lapse imaging embryo selection algorithms to predict for the development of specific, implantation to demonstrate the need in-house morphokinetic selection algorithms. Fertility and Sterility, v. 107, n. 3, p. 613–621, 2017. Bartolacci, A.; Buratini, J.; Moutier, C.; Guglielmo, M. C.; Novara, P. V.; Brambillasca, F.; Renzini, M. M.; Dal Canto, M. Maternal body mass index affects embryo morphokinetics: a time-lapse study. Journal of Assisted Reproduction and Genetics, v. 36, n. 6, p. 1109–1116, 2019. Basile, N.; Vime, P.; Florensa, M.; Aparicio-Ruiz, B.; García Velasco, J. A.; Remohi, J.; Meseguer, M. The use of morphokinetics as a predictor of implantation: a multicentric study to define and validate an algorithm for embryo selection. Human Reproduction, v. 30, n. 2, p. 276–283, 2015. 45 Campbell, A. Time-lapse & embryo aneuploidy – an indirect method to replace PGS? CARE Fertility, UK, 2014. Carr, J. An Introduction to Genetic Algorithms. Whitman College Mathematics Department, p. 1–40, 2014. Chakrabarty, A. D. A.; Dubey, R. An excursion towards multi-frequency- prediction based flexible asset allocation system. Global Journal of Flexible Systems Management, v. 16, n. 2, p.173–190, 2015. Chawla, M.; Fakih, M.; Shunnar, A.; Bayram, A.; Hellani, A.; Perumal, V.; Divakaran, J.; Budak, E. Morphokinetic analysis of cleavage stage embryos and its relationship to aneuploidy in a retrospective time-lapse imaging study. Journal of Assisted Reproduction and Genetics, v. 32, n. 1, p. 69–75, 2014. Chéles, D. S.; Ferreira, A. S.; Jesus, I. S.; Fernandez, E. I.; Pinheiro, G. M.; Molin, E. A. D.; Alves, W.; Souza, R. C. M.; Bori, L.; Meseguer, M.; Rocha, J. C.; Nogueira, M. F. G. An image processing protocol to extract variables predictive of human embryo fitness for assisted reproduction. MedRxiv [Preprint]. 2022. Disponível em: medrxiv.org/content/10.1101/2022.02.01.22270264v1 Ciray, H. N.; Campbell, A.; Agerholm, E. I.; Aguilar, J.; Chamayou, S.; Esbert, M.; Sayed, S. Proposed guidelines on the nomenclature and annotation of dynamic human embryo monitoring by a time-lapse user group. Human Reproduction, v. 29, n. 12, p. 2650–2660, 2014. Cruz, M.; Gadea, B.; Garrido, N.; Pedersen, K. S.; Martínez, M.; Pérez-Cano, I.; Muñoz, M.; Meseguer, M. Embryo quality, blastocyst and ongoing pregnancy rates in oocyte donation patients whose embryos were monitored by time-lapse imaging. Journal of Assisted Reproduction and Genetics, v. 28, n. 7, p. 569– 573, 2011. De Geyter, C.; Calhaz-Jorge, C.; Kupka, M. S.; Wyns, C.; Mocanu, E.; Motrenko, T.; Scaravelli, G.; Smeenk, J.; Vidakovic, S.; Goossens, V. ART in Europe, 2014: results generated from European registries by ESHRE. Human Reproduction, v. 33, n. 9, p. 1586–1601, 2018. 46 Delbaere, I.; Verbiest, S.; Tydén, T. Knowledge about the impact of age on fertility: a brief review. Upsala Journal of Medical Science, v. 125, n. 2, p. 167– 174, 2020. Desai, N.; Ploskonka, S.; Goodman, R. L.; Austin, C.; Goldber, J.; Falcone, T. Analysis of embryo morphokinetics, multinucleation and cleavage anomalies using continuous time-lapse monitoring in blastocyst transfer cycles. Reproductive Biology and Endocrinology, v. 12, n. 1, p. 1–10, 2014. D’Souza, R.; Horyn, I.; Pavalagantharajah, S.; Zaffar, N.; Jacob, C. E. Maternal body mass index and pregnancy outcomes: a systematic review and metaanalysis. American Journal of Obstetrics and Gynecology, v. 4, p. 100041, 2019. Eiben, A. E.; Smith, J. E. Introduction to Evolutionary Computing. Springer, 2003. European Avm Alliance. Glossary of Terms & Definitions. 2012. ESHRE Working group on Time-lapse technology, Apter, S.; Ebner, T.; Freour, T.; Guns, Y.; Kovacic, B.; Le Clef, N.; Marques, M.; Meseguer, M.; Montjean, D.; Sfontouris, I.; Sturmey, R.; Coticchio, G. Good practice recommendations for the use of time-lapse technology†. Human Reproduction Open, p. 1-26, 2020. Fishel, S.; Campbell, A.; Montgomery, S.; Smith, R.; Nice, L.; Duffy, S.; Jenner, L.; Berrisford, K.; Kellam, L.; Smith, R.; D’cruz, I.; Beccles, A. Live births after embryo selection using morphokinetics versus conventional morphology: a retrospective analysis. Reproductive BioMedicine Online, v. 35, n. 4, p. 407– 416, 2017. Frankenthal, D.; Hirsh-Yechezkel, G.; Boyko, V.; Orvieto, R.; Ron-el, R.; Lerner- Geva L.; Farh,i A. The effect of body mass index (BMI) and gestational weight gain on adverse obstetrical outcomes in pregnancies following assisted reproductive technology as compared to spontaneously conceived pregnancies. Obesity Research and Clinical Practice, v. 13, n. 2, p. 150-155, 2019. Gardner, D.; Schoolcraft, W. Culture and transfer of human blastocysts. Current Opinion in Obstetrics and Gynecology, v. 11, n. 3, p. 307-311, 1999. 47 Goethals, P. L. M.; Dedecker, A. P.; Gabriels, W.; Lek, S.; Pauw, N. D. Applications of artificial neural networks predicting macroinvertebrates in freshwaters. Aquatic Ecology, v. 41, n. 3, p. 491–508, 2007. Gonzalez, R. C.; Woods, R. E. Digital Image Processing. Pearson Prentice Hall, 2007. Goodman, L. R.; Goldberg, J.; Falcone, T.; Austin, C.; Desai, N. Does the addition of time-lapse morphokinetics in the selection of embryos for transfer improve pregnancy rates? A randomized controlled trial. Fertility and Sterility, v. 105, n. 2, p. 275–285.e10, 2016. Greener, J. G.; Kandathil, S. M.; Moffat, L.; Jones, D. T. A guide to machine learning for biologists. Nature Reviews Molecular Cell Biology, v. 23, n. 1, p. 40-55, 2022. Haralick, R. M.; Shanmugam, K.; Dinstein, I. Textural Features for Image Classification. IEEE Transactions on Systems, Man, and Cybernetics, v. 3, n. 6, p. 610–621, 1973. Haykin, S. Redes Neurais: princípios e prática. 2ª ed. Porto Alegre, RS, Bookman. 2001. Hsu, M. I.; Wang, C. W.; Chen, C. H.; Tzeng, C. R. Impact of the number of retrieved oocytes on pregnancy outcome in in vitro fertilization. Taiwanese Journal of Obstetrics and Gynecology, v. 55, n. 6, p. 821–825, 2016. Hu. L.; Du, J.; Lv, H.; Zhao, J.; Chen, M.; Wang, Y.; Wu, F.; Liu, F.; Chen, X.; Zhang, J.; Ma, H.; Jin, G.; Shen, H.; Chen, L.; Ling, X.; Hu, Z. Influencing factors of pregnancy loss and survival probability of clinical pregnancies conceived through assisted reproductive technology. Reproductive Biology Endocrinology, v. 16, n. 1, p. 1–12, 2018. Hu, Y.; Zhao, C.; Wang, H. Directional Analysis of Texture Images Using Gray Level Co-Occurrence Matrix. IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application, p. 277–281, 2008. 48 Kalpana, R.; Chitra, M.; Vijayalakshmi, K. Pattern classification of EEG signals on different states of cognition using linear and nonlinear classifiers. Research Journal of Applied Sciences, v. 11, n. 6, p. 623-629, 2015. Kaser, D. J.; Racowsky, C. Clinical outcomes following selection of human preimplantation embryos with time-lapse monitoring: a systematic review. Human Reproduction Update, v. 0, n. 0, p. 1–15, 2014. Kahveci, B.; Melekoglu, R.; Evruke, I. C.; Cetin, C. The effect of advanced maternal age on perinatal outcomes in nulliparous singleton pregnancies. BMC Pregnancy Childbirth, v. 18. n. 1, p. 1–7, 2018. Klein, J.; Sauer, M. V. Assessing fertility in women of advanced reproductive age. American Journal of Obstetrics & Gynecology, v. 185, p. 758–770, 2001. Kovacs, P. Embryo selection: the role of time-lapse monitoring. Reproductive Biology and Endocrinology, v. 12, n. 1, p. 124, 2014. Kragh, M. F.; Karstoft, H. Embryo selection with artificial intelligence: how to evaluate and compare methods? Journal of Assisted Reproduction and Genetics, v. 38, n. 7, p. 1675-1689, 2021. Kriesel, D. A Brief Introduction to Neural Networks. Retrieved August, p. 244, 2005. Kulp, S. A.; Strauss, B. H. CoastalDEM: A global coastal digital elevation model improved from SRTM using a neural network. Remote Sensing of Environment, v. 206, p. 231–239, 2018. Leader, J.; Bajwa, A.; Lanes, A.; Hua, X.; White, R. R.; Rybak, N.; Walker, M. The Effect of Very Advanced Maternal Age on Maternal and Neonatal Outcomes: A Systematic Review. Journal of Obstetrics and Gynaecology Canada, v. 40, n. 9, p. 1208-1218, 2018. Ledford, H. IVF at 40: revisiting the revolution in assisted reproduction. Nature, 2018. 49 Leridon, H. Can assisted reproduction technology compensate for the natural decline in fertility with age? A model assessment. Human Reproduction, v.19, n.7, p.1548-53, 2004. Liao, S.; Xiong, J.; Tu, H.; Hu, C.; Pan, W.; Geng, Y.; Pan, W.; Lu, T.; Jin, L. Prediction of in vitro fertilization outcome at different antral follicle count thresholds combined with female age, female cause of infertility, and ovarian response in a prospective cohort of 8269 women. Medicine, v. 98, n. 41, p. e17470, 2019. Lorenzon, A. R.; Jacobs, C.; Souza, R. C. M.; Nicolielo, M.; Erberelli, R.; Barros, B.; Marchi, P. L.; Alegretti, J. R.; Motta, E. L. A.; Nogueira, M. F. G.; Rocha, J. C. Non-invasive method for blastocyst ploidy prediction based on artificial intelligence, time-lapse images and patient parameters. Fertility & Sterility, v. 116, n. 3, p. e102, 2021. Lundin, K.; Bergh, C.; Hardarson, T. Early embryo cleavage is a strong indicator of embryo quality in human IVF. Human Reproduction, v. 16, n. 12, p. 2652– 2657, 2001. Machart, P.; Ralaivola, L. Confusion matrix stability bounds for multiclass classification. arXiv, n. Section 5, 2012. Matos, F. D. Software baseado em rede neural artificial desenvolvida por meio de algoritmo genético para a classificação morfológica de blastocistos bovinos. 2014. 129 f. Dissertação (Mestrado em Biociências). – Faculdade de Ciências e Letras, Universidade Estadual Paulista “Júlio de Mesquita Filho”, Assis, 2014. Matos, F. D.; Rocha, J. C.; Nogueira, M. F. G. A method using artificial neural networks to morphologically assess mouse blastocyst quality. Journal of Animal Science and Technology, v. 56, n. 1, p. 15, 2014. Meseguer, M.; Herrero, J.; Tejera, A.; Hilligsøe, K. M.; Ramsing, N. B.; Remohi, J. The use of morphokinetics as a predictor of embryo implantation. Human Reproduction, v. 26, n. 10, p. 2658–2671, 2011. https://pubmed.ncbi.nlm.nih.gov/?term=Hilligs%C3%B8e%2BKM&cauthor_id=21828117 50 Meseguer, M.; Rubio, I.; Cruz, M.; Basile, N.; Marcos, J.; Requena, A. Embryo incubation and selection in a time-lapse monitoring system improves pregnancy outcome compared with a standard incubator: a retrospective cohort study. Fertility and Sterility, v. 98, n. 6, 2012. Milachich, T.; Shterev, A. Are there optimal numbers of oocytes, spermatozoa and embryos in assisted reproduction? JBRA Assisted Reproduction, v. 20, n. 3, p. 142–149, 2016. Milewski, R.; Ajduk, A. Time-lapse imaging of cleavage divisions in embryo quality assessment. Reproduction, v. 154, n. 2, p. R37–R53, 2017. Mills, M.; Rindfuss, R.; Mcdonald, P.; Te Velde, E. ESHRE Reproduction and Society Task Force Why do people postpone parenthood? Reasons and social policy incentives. Human Reproduction, v.17, p.848-60, 2011. Minasi, M. G.; Greco, P.; Varricchio, M. T.; Barillari, P.; Greco, E. The clinical use of time-lapse in human-assisted reproduction. Therapeutic Advances in Reproductive Health, v. 14, n. 2633494120976921, 2020. Mio, Y.; Maeda, K. Time-lapse cinematography of dynamic changes occurring during in vitro development of human embryos. American Journal of Obstetrics and Gynecology, v. 199, p. 660.e1–660.e5, 2008. Na, L.; Chen, Y.; Zhai, H.; Liao, A.; Huang, D. Effects of maternal body mass index on pregnancy outcome after 8570 artificial insemination cycles with donor’s sperm. Gynecological Endocrinology, v. 34, n. 12, p. 1068–1072, 2018. Nanni, L.; Lumini, A.; Brahnam, S. Local binary patterns variants as texture descriptors for medical image analysis. Artificial Intelligence in Medicine, v. 49, n. 2, p. 117–125, 2010. Nasiri, N.; Eftekhari-Yazdi, P. An overview of the available methods for morphological scoring of pre-Implantation embryos in in vitro fertilization. Cell Journal, v. 16, n. 4, p. 392–405, 2015. 51 Nelson, S. M.; Lawlor, D. A. Predicting Live Birth, Preterm Delivery, and Low Birth Weight in Infants Born from In Vitro Fertilisation: A Prospective Study of 144,018 Treatment Cycles. Plos Medicine, v. 8, n. 1, p. 1-11, 2011. Nogueira, M. F. G.; Guilherme, B. V.; Pronunciate, M.; Dos Santos, P. H.; Da Silva, D. L. B.; Rocha, J. C. Artificial Intelligence-Based Grading Quality of Bovine Blastocyst Digital Images: Direct Capture with Juxtaposed Lenses of Smartphone Camera and Stereomicroscope Ocular Lens. Sensors, v. 18, n. 12, p. 4440, 2018. Nuttall, F. Q. Body mass index: Obesity, BMI, and health: A critical review. Nutrition Today, v. 50, n. 3, p. 117–128, 2015. Ojala, T.; Pietikäinen, M.; Harwood, D. A comparative study of texture measures with classification based on features distribution. Pattern Recognition, v. 29, n. 1, p. 51-59, 1996. Pinto, S.; Carrageta, D. F.; Alves, M. G.; Rocha, A.; Agarwal, A.; Barros, A.; Oliveira, P. F. Sperm selection strategies and their impact on assisted reproductive technology outcomes. Andrologia, v. 53, n. 2, p. e13725, 2021. Pozo, A.; Cavalheiro, A. D. F.; Ishida, C.; Spinosa, E.; Rodrigues, E. M. Computação Evolutiva, Departamento de Informática, Universidade Federal do Paraná, p. 61, 2011. Puga-Torres, T.; Blum-Rojas, X.; Blum-Narváez, M. Blastocyst classification systems used in Latin America: is a consensus possible? JBRA Assisted Reproduction, v. 21, n. 3, p. 222–229, 2017. Purewal, S.; Chapman, S. C. E.; van deen Akker, O. B. A. A systematic review and meta-analysis of lifestyle and body mass index predictors of successful assisted reproductive technologies. Journal of Psychosomatic Obstetrics and Gynecology, v. 40, n. 1, p. 2–18, 2019. Qiu, M.; Tao, Y.; Kuang, Y.; Wang, Y. Effect of body mass index on pregnancy outcomes with the freeze-all strategy in women with polycystic ovarian syndrome. Fertility and Sterility, v. 112, n. 6, p. 1172–1179, 2019. 52 Roberti de Siqueira, F.; Robson Shwartz, W.; Pedrini, H. Multi-scale gray level co-occurrence matrices for texture description. Neurocomputing, v. 120, p. 336– 345, 2013. Rocha, J. C.; Passalia, F. J.; Matos, F. D.; Maserati, J. M. P.; Alves, M. F.; Almeida, T. G.; Cardoso, B. L.; Basso, A. C.; Nogueira, M. F. G. Methods for assessing the quality of mammalian embryos: How far we are from the gold standard? JBRA Assisted Reproduction, v. 20, n. 3, p. 150–158, 2016. Rocha, J. C.; Passalia, F. J.; Matos, F. D.; Takahashi, M. B.; Ciniciato, D. D. S.; Maserati, M. P.; Alves, M. F.; De Almeida, T. G.; Cardoso, B. L.; Basso, A. C.; Nogueira, M. F. G. A Method Based on Artificial Intelligence To Fully Automatize The Evaluation of Bovine Blastocyst Images. Scientific Reports, v. 7, n. 1, p. 1– 10, 2017a. Rocha, J. C.; Passalia, F. J.; Matos, F. D.; Takahashi, M. B.; Maserati, M. P.; Alves, M. F.; De Almeida T. G.; Cardoso, B. L.; Basso, A. C.; Nogueira, M. F. G. Data Descriptor: Automatized image processing of bovine blastocysts produced in vitro for quantitative variable determination. Scientific Data, v. 4, p. 1–9, 2017b. Rocha, J. C.; Nogueira, M. F. G.; Zaninovic, N.; Hickman, C. Is AI assessment of morphokinetic data and digital image analysis from time-lapse culture predictive of implantation potential of human embryos? Fertility and Sterility, v. 110, n. 4, p. e373, 2018. Rubio, I.; Kuhlmann, R.; Agerholm, I.; Kirk, J.; Herrero, J.; Escribá, M. J.; Bellver, J.; Meseguer, M. Limited implantation success of direct-cleaved human zygotes: a time-lapse study. Fertility and Sterility, v. 98, n. 6, p. 1458–1463, 2012. Ruhoff, A.; Fantin-Cruz, I.; Collischonn, W., Modelos de simulação dinâmica do desmatamento na Amazônia. Caminhos de Geografia, v. 11, n. 36, p. 258-268, 2010. Schmidt, L.; Sobotka, T.; Bentzen, J.G.; Nyboe A. ESHRE Reproduction and Society Task Force Demographic and medical consequences of the postponement of parenthood. Human Reproduction, v.18, p.29-43, 2012. 53 Sciorio, R.; Thong, K. J.; Pickering, S. J. Spontaneous blastocyst collapse as an embryo marker of low pregnancy outcome: A Time-lapse study. JBRA Assisted Reproduction, v. 0, n. 0, p. 1–7, 2019. Shaik, N. B.; Pedapati, S. R.; Ammar Taqvi, S. A.; Othman, A. R.; Abd Dzubir, F. A. A feed-forward back propagation neural network approach to predict the life condition of crude oil pipeline. Processes, v. 8, n. 6, p. 661, 2020. Steptoe, P. C.; Edwards, R. G. Birth after the reimplantation of a human embryo. Lancet, v. 11, p. 366, 1978. Steward, R. G.; Lan, L.; Shah, A. A.; Yeh, J. S.; Price, T. M.; Goldfarb, J. M.; Muasher, S. J. Oocyte number as a predictor for ovarian hyperstimulation syndrome and live birth: an analysis of 256,381 in vitro fertilization cycles. Fertility and Sterility, v. 101, n. 4, p. 967–973, 2014. Storr, A.; Venetis, C. A.; Cooke, S.; Susetio, D.; Kilani, S.; Ledger, W. Morphokinetic parameters using time-lapse technology and day 5 embryo quality: a prospective cohort study. Journal of Assisted Reproduction and Genetics, v. 32, p. 1151-1160, 2015. Sundvall, L.; Ingerslev, H. J.; Breth Knudsen, U.; Kirkegaard, K. Inter- and intra- observer variability of time-lapse annotations. Human Reproduction, v. 28, n. 12, p. 3215–3221, 2013. Sunkara, S. K.; Rittenberg, V.; Raine-Fenning, N.; Bhattacharya, S.; Zamora, J.; Coomarasamy, A. Association between the number of eggs and live birth in IVF treatment: an analysis of 400 135 treatment cycles. Human Reproduction, v. 26, n. 7, p. 1768–1774, 2011. Supramanian, P. R.; Granne, I.; Ohuma, E. O.; Lim, L. N.; Mcveigh, E.; Venkatakrishnan, R.; Becker, C. M.; MittalI, M. ICSI does not improve reproductive outcomes in autologous ovarian response cycles with non-male factor subfertility. Human Reproduction, v. 35, n. 3, p. 583–594, 2020. Tan, T. Y.; Lau, M. S. K.; Loh, S. F.; Tan, H. H. Female ageing and reproductive outcome in assisted reproduction cycles. Singapore Medical Journal, v. 55, n. 6, p. 305–309, 2014. 54 Tejera, A.; Castelló, D.; De Los Santos, J. M.; Pellicer, A.; Remohí, J.; Meseguer, M. Combination of metabolism measurement and a time-lapse system provides an embryo selection method based on oxygen uptake and chronology of cytokinesis timing. Fertility and Sterility, v. 106, n. 1, p. 119–126, 2016. Templeton, A.; Morris, J. K.; Parslow, W. Factors that affect outcome of in-vitro fertilisation treatment. Lancet, v. 348, n. 9039, p. 1402–1406, 1996. Timeva, T.; Milachich, T.; Antonova, I.; Arabaji, T.; Shterev, A.; Omar, H. A. Correlation Between Number of Retrieved Oocytes and Pregnancy Rate After In Vitro Fertilization/Intracytoplasmic Sperm Infection. Scientific World Journal, v. 26, n. 6, p. 686–690, 2006. Vaegter, K. K.; Lakic, T. G.; Olovsson, M.; Berglund, L.; Brodin, T.; Holte, J. Which factors are most predictive for live birth after in vitro fertilization and intracytoplasmic sperm injection (IVF/ICSI) treatments? Analysis of 100 prospectively recorded variables in 8,400 IVF/ICSI single-embryo transfers. Fertility and Sterility, v. 107, n. 3, p. 641- 648, 2017. Valera, M. D. L. A.; Rocha, J. C.; Bori, L.; Alegre, L.; Nogueira, M. F. G.; Chéles, D. S.; Meseguer, M. Novel artificial intelligence algorithm for improving embryo selection combining morphokinetics and non-invasive measurement of oxidative stress. Fertility & Sterility, v. 114, n. 3, p. e140-e141, 2020. Van Den Abbeel, E.; Balaban, B.; Ziebe, S.; Lundin, K.; Cuesta, M. J. G.; Klein, B. M.; Helmgaard, L.; Arce, J. C. Association between blastocyst morphology and outcome of single-blastocyst transfer. Reproductive BioMedicine Online, v. 27, n. 4, p. 353–361, 2013. Vogiatzi, P.; Pouliakis, A.; Siristatidis, C. An artificial neural network for the prediction of assisted reproduction outcome. Journal of Assisted Reproduction and Genetics, v. 36, n. 7, p. 1441-1448, 2019. Walczak, S.; Cerpa, N. Heuristic principles for the design of artificial neural networks. Information and Software Technology, v. 41, n. 2, p. 107–117, 1999. Watson, P. F.; Petrie, A. Method agreement analysis: A review of correct methodology. Theriogenology, v. 73, n. 9, p. 1167–1179, 2010. 55 Weitzman, V. N.; Schnee-Riesz, J.; Benadiva, C.; Nulsen, J.; Siano, L.; Maier, D. Predictive value of embryo grading for embryos with known outcomes. Fertility and Sterility, v. 93, n. 2, p. 658–662, 2010. Wolff, M. V.; Schwartz, A. K.; Bitterlich, N.; Stute, P.; Fäh, M. Only women’s age and the duration of infertility are the prognostic factors for the success rate of natural cycle IVF. Archives of Gynecology and Obstetrics, v. 299, n. 3, p. 883- 889, 2019. Wong, C. C.; Loewke, K. E.; Bossert, N. L.; Behr, B.; Jonge, C. J. De; Baer, T. M.; Pera, R. A. R. Articles Non-invasive imaging of human embryos before embryonic genome activation predicts development to the blastocyst stage. Nature Biotechnology, v. 28, n. 10, p. 1115–1121, 2010. Zahmatkeshan, M.; Naghdi, M.; Farjam, M.; Mokhtaran, M.; Yazdani, A.; Mahmoudvand, Z.; Safdari, R. ART Registries – Characteristics and experiences: A comparative study. Journal of Family Medicine and Primary Care, v. 8, n. 2, p. 449–454, 2019. Zaninovic, N.; Rocha, J. C.; Zhan, Q.; Toschi, M.; Malmsten, J.; Nogueira, M. F. G.; Meseguer, M.; Rosenwaks, Z.; Hickman, C. Application of artificial intelligence technology to increase the efficacy of embryo selection and prediction of live birth using human blastocysts cultured in a time-lapse incubator. Fertility and Sterility, v. 110, n. 4, p. e372-e373, 2018. Zhou, H.; Zhang, D.; Luo, Z.; Yang, A.; Cui, N.; Hao, G.; Wang, W. Association between Body Mass Index and Reproductive Outcome in Women with Polycystic Ovary Syndrome Receiving IVF/ICSI-ET. BioMed Research International, v. 6434080, p. 1-7, 2020. 56 3 ARTIGO Nesta seção, é apresentada uma proposta de artigo científico a ser submetido ao periódico Human Reproduction, com fator de impacto (6,918) e Online ISSN 1460-2350. As normas de publicação da revista podem ser encontradas no Anexo 2, sendo que o manuscrito difere destas normas por utilizar língua portuguesa. Aplicação de inteligência artificial, de variáveis da morfologia do blastocisto, morfocinética embrionária e variáveis relacionadas com a paciente para melhorar a seleção embrionária na reprodução assistida Título corrido Inteligência artificial usada na predição reprodutiva Dóris Spinosa Chéles1,2,5, Eleonora Inácio Fernandez2, André Satoshi Ferreira2, Lorena Bori3, Marcos Meseguer3,4, José Celso Rocha1,2, Marcelo Fábio Gouveia Nogueira1,5* 1Programa de Pós-Graduação em Farmacologia e Biotecnologia, Instituto de Biociências, Universidade Estadual Paulista (UNESP), Botucatu, Brasil. 2Laboratório de Matemática Aplicada, Departamento de Ciências Biológicas, Universidade Estadual Paulista (UNESP), Assis, Brasil. 3Laboratório de FIV, IVI Valencia, Valencia, Espanha. 4Instituto de Pesquisa em Saúde la Fe, Valencia, Espanha. 5Laboratório de Micromanipulação Embrionária, Departamento de Ciências Biológicas, Universidade Estadual Paulista (UNESP), Assis, Brasil. *Autor correspondente. 57 Resumo Pergunta do estudo Variáveis morfológicas preditivas da qualidade do blastocisto, da morfocinética embrionária e relacionadas com a paciente podem ser preditivas de batimento cardíaco fetal e nascimento vivo quando utilizadas em conjunto como entradas para um software baseado em inteligência artificial (IA)? Resposta resumida Foram encontradas redes neurais artificiais (RNAs) com acurácia geral superior a 90% no treinamento e a 70% na simulação para a predição de batimento cardíaco fetal e nascimento vivo, considerando os três conjuntos de variáveis juntos como entradas. O que já é conhecido Apesar da disponibilidade do sistema time-lapse, o qual permite análises morfológicas e morfocinéticas detalhadas, a avaliação embrionária ainda é subjetiva. Técnicas computacionais, como processamento de imagens e a IA, têm sido aplicados para extrair aspectos quantitativos dos dados produzidos em clínicas, com o objetivo de melhorar os resultados obtidos na reprodução assistida. Desenho do estudo, tamanho, duração Um conjunto de dados inicial incluindo 369 dados contidos em uma planilha foi adquirido por meio de uma parceria científica com a clínica IVI-RMA (Valencia, Espanha) entre 2017 e 2019. Deste total, 215 dados para a morfologia do blastocisto, 223 dados para a morfocinética embrionária e 269 dados para as características relacionadas com a paciente foram utilizados neste estudo. Participantes/Materiais, Contexto, Métodos Para a morfologia do blastocisto, foram excluídas imagens com visualização incompleta de todo o blastocisto, luz insuficiente para reconhecer regiões individuais, blastocisto fora de foco e exibição de um embrião fora do estágio de blastocisto. Em seguida, foi realizado o processamento digital de imagens para 58 a extração automatizada de 33 variáveis preditivas da morfologia do blastocisto. Para a morfocinética embrionária, foram utilizados 16 parâmetros relacionados aos tempos de desenvolvimento e disponíveis na planilha. Para as pacientes, foram utilizadas 4 variáveis e, para cada uma delas, foram atribuídas pontuações com base na literatura da reprodução assistida relacionada à paciente. As RNAs foram treinadas e simuladas com as 53 variáveis dos três conjuntos de entrada juntos para predizer o batimento cardíaco fetal e o nascimento vivo utilizando a plataforma MatLab®. Principais resultados e o papel do acaso Para a predição de batimento cardíaco fetal, as acurácias gerais da melhor RNA encontrada para o treinamento e a simulação foram 95,2% e 78,4%, respectivamente. Já a melhor RNA encontrada para a predição de nascimento vivo obteve acurácias gerais para o treinamento e para a simulação de 98,0% e 81,1%, respectivamente. Limitações, Razões para Cuidado A proposta de um método de análise que não é totalmente automatizado para a seleção de imagens primárias obtidas por meio de sistema time-lapse, o baixo número de variáveis relacionadas com a paciente, os dados utilizados de apenas uma clínica e a ausência de variáveis relacionadas ao homem em tratamento de reprodução assistida podem ser consideradas limitações deste estudo. Implicações mais amplas das descobertas Este estudo fornece parâmetros objetivos relacionados à morfologia, morfocinética e pacientes para avaliar a viabilidade embrionária e as características das pacientes, por meio das quais foi possível obter RNAs com poder preditivo do sucesso gestacional e nascimento vivo. Dessa forma, a aplicação da IA apresenta potencial para auxiliar, de forma objetiva, os embriologistas durante a escolha do embrião mais apto para a transferência, e assim, se tornar parte da rotina clínica na reprodução assistida. 59 Financiamento do Estudo/Conflito de Interesse Este estudo é apoiado pelas bolsas nº 2017/19323-5 e nº 2020/07634-9 da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP). Este estudo foi financiado em parte pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código Financeiro 001. Os autores não relatam conflitos de interesse. Palavras-chave embrião / pacientes / redes neurais artificiais / gestação / nascimento vivo. 3.1 Introdução As tecnologias de reprodução assistida, do inglês assisted reproductive technology (ART) vêm sendo cada vez mais utilizadas e aprimoradas nas últimas décadas, a fim de auxiliar indivíduos inférteis a alcançar uma gestação bem- sucedida (Xiong et al., 2020; Sciorio et al., 2020). As gestações múltiplas têm sido uma preocupação relacionada à ART devido aos maiores riscos maternos e neonatais associados em comparação com as gestações únicas (Devine et al., 2015). Assim, a transferência de um único embrião, do inglês, single embryo transfer (SET) é recomendada para atingir o objetivo fundamental da ART, o nascimento de um bebê saudável. Portanto, novas abordagens para predizer os resultados da gestação após SET são essenciais para atingir tal objetivo (Tiitinen, 2019; Xiong et al., 2020). Um dos avanços mais impactantes na área médica envolve o uso de sistemas de predição baseados na aplicação de inteligência artificial (IA), como redes neurais artificiais (RNAs) e algoritmos genéticos (AGs) (Rocha et al., 2016). Uma RNA pode ser descrita da seguinte forma: uma camada de entrada, responsável por receber informações de dados (inputs); camada(s) intermediária(s) ou oculta(s), que realizam o processamento dos dados e uma camada de saída, fornecendo os resultados finais obtidos (outputs preditivos) (Haykin, 2001). As RNAs podem aprender por meio de treinamento, ou seja, a aplicação de um algoritmo de aprendizado com o objetivo de obter uma resposta que represente as entradas fornecidas (Kriesel, 2005; Silva et al., 2010; Greener 60 et al., 2022). Os AGs referem-se a algoritmos de otimização, utilizados para facilitar a seleção das melhores RNAs obtidas a cada iteração do algoritmo (Eiben e Smith, 2003; Mitchell, 1996). No campo da medicina reprodutiva, estes sistemas buscam melhorar a seleção embrionária, avaliando fatores que podem melhorar o resultado clínico após a ART, como a morfologia, a morfocinética e características relacionadas às mulheres em tratamento de reprodução assistida (Milewski et al., 2017; Zaninovic et al., 2019; VerMilyea et al., 2020). Além disso, a IA também vem sendo aplicada considerando fatores relacionados aos homens, a fim de predizer a qualidade do sêmen, por exemplo, com base em fatores ambientais e hábitos de vida (Girela et al., 2013; Candemir,