UNIVERSIDADE ESTADUAL PAULISTA UNESP - Campus de São João da Boa Vista PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA (MESTRADO) RÔMULO APARECIDO DE PAULA JUNIOR Otimização de moduladores Mach-Zehnder integrados em fotônica de siĺıcio utilizando redes neurais artificiais São João da Boa Vista 2022 RÔMULO APARECIDO DE PAULA JUNIOR Otimização de moduladores Mach-Zehnder integrados em fotônica de siĺıcio utilizando redes neurais artificiais Versão original Dissertação apresentada ao Conselho de Curso do Programa de Pós-Graduação em Engenharia Elétrica (Mestrado) do Campus de São João da Boa Vista, Universidade Estatual Paulista, como parte dos requisitos para obtenção do diploma de mestrado em Engenharia Elétrica. Área de concentração: Fotônica Integrada e Aprendizagem de Máquinas Orientador: Prof. Dr. Ivan Aritz Aldaya Garde Coorientadora: Dra. Yesica Raquel Rumaldo Bustamante São João da Boa Vista 2022 P324o Paula Junior, Rômulo Aparecido de Otimização de moduladores Mach-Zehnder integrados em fotônica de silício utilizando redes neurais artificiais / Rômulo Aparecido de Paula Junior. -- São João da Boa Vista, 2022 150 p. : il., tabs. Dissertação (mestrado) - Universidade Estadual Paulista (Unesp), Faculdade de Engenharia, São João da Boa Vista Orientador: Ivan Aritz Aldaya Garde Coorientadora: Yesica Raquel Rumaldo Bustamante 1. Aprendizado do computador. 2. Moduladores (Eletrônica). 3. Interferência (Luz). 4. Comunicações ópticas. 5. Otimização combinatória. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Biblioteca da Faculdade de Engenharia, São João da Boa Vista. Dados fornecidos pelo autor(a). Essa ficha não pode ser modificada. Dedico esta dissertação à minha famı́lia e, em especial, à minha mãe, por todo incentivo e ajuda dados durante a realização do trabalho. Dedico também aos meus orientadores e aos meus colegas da UNESP e da CPQD por todo o conhecimento que foi compartilhado. Resumo Uma das principais vantagens da integração fotônica baseada na plataforma de siĺıcio sobre isolante (silicon-on-insulator, SOI) é a sua compatibilidade com o processo de manufatura de metal óxido-semicondutor complementar, possibilitando a produção em massa e reduzindo drasticamente o custo dos dispositivos. Além do mais, o alto contraste de ı́ndice de refração nesta plataforma resulta em um forte confinamento da luz no meio guiado, o que permite a construção de dispositivos compactos. Estas propriedades tornam a plataforma de siĺıcio sobre isolante atraente no projeto de sistemas coerentes ópticos, tais quais vêm ganhando atenção para enlaces cada vez mais curtos, como é o caso interconexões de alta velocidade em data-centers. Entretanto, o projeto de moduladores de banda larga e de baixo consumo de potência ainda é um desafio nesta plataforma. Dentre as arquiteturas existentes, o modulador de Mach-Zehnder (Mach-Zehnder Modulator, MZM) se mostra um candidato atraente devido ao seu potencial de apresentar larga banda eletro-óptica, baixo consumo de potência e alta estabilidade térmica. Estas qualidades se destacam, em especial, em MZMs com deslocadores de fase baseados no efeito de dispersão de plasma, operando em polarização reversa de tensão. Entretanto, a partir de uma revisão bibliográfica a respeito de MZMs constrúıdos em siĺıcio, podemos perceber que o desempenho dos mesmos está atingindo um platô. Por outro lado, até onde sabemos, a otimização de MZMs por algoritmos de inteligência artificial ainda não tem sido explorada na literatura. Modelos de simulação eletromagnéticas apresentam um alto custo de tempo, enquanto que algoritmos de otimização como os evolutivos requerem numerosas inferências, ainda mais ao otimizar um dispositivo com múltiplos parâmetros de projeto, como é o caso do MZM. A partir de simulações realizadas em um entorno que integra os softwares CST, Lumerical (Mode e Device) e uma linguagem de alto ńıvel, como o Python, simularam-se 10.000 configurações de MZM com parâmetros aleatórios. Os dados obtidos mediante estas simulações foram utilizadas para treinar uma rede neural que pode substituir o modelo eletromagnético de alta complexidade no cômputo da função de custo, de forma a acelerar algoritmos de otimização heuŕıstica. A simulação e a rede neural consideraram oito parâmetros de design no modelo, incluindo a largura do guia de onda, a largura das regiões dopadas, o comprimento do modulador e a tensão de polarização. No caso dos parâmetros de desempenho do modulador temos a banda eletro-óptica, a tensão de meia-onda e as perdas de inserção ópticas. Os resultados mostraram que a rede neural foi capaz de emular o modelo de simulação, mostrando uma acurácia satisfatória na predição dos três parâmetros de desempenho do MZM. Ao utilizarmos a rede neural como forma de computar a figura de mérito dos MZMs, o custo de tempo é reduzido por um fator de 107 em relação ao modelo de simulação. Com esta demanda menor por recursos computacionais, é posśıvel executarmos otimizações que consideram um elevado número de iterações e indiv́ıduos nas populações. Além do mais, diferentes figuras de mérito podem ser utilizadas para dar ênfase na otimização de parâmetros de métrica distintos. Conclúımos que esta configuração de otimização conjunta possibilita achar os limites da arquitetura em termos das métricas consideradas. Palavras-chaves: Fotônica em Siĺıcio, Modulador de Mach-Zehnder, Otimização de Design, Aprendizado Profundo, Evolução Diferencial. Abstract One of the main advantages of silicon on insulator based integration is its compatibility with the complementary metal-oxide-semiconductor (CMOS) manufacturing process, which enables mass production and drastically reduces device costs. Furthermore, the high refractive index contrast inherent to this platform allows a high confinement of light in the guided medium, enabling the design of compact devices. These silicon-on-insulator (SOI) properties have attracted particular attention for the design of optical coherent systems, which have been getting more popular for shorter and shorter links, as the case of high-speed data-centers interconnections. However, the design of broadband and power-efficient modulators in this platform still poses a challenge. Amongst the existing architectures, the Mach-Zehnder Modulator (MZM) emerges as an attractive candidate, due to its potential for wide electro-optic bandwidth, low power consumption and high thermal stability. Such benefits stand out, in special, when it comes to Mach-Zehnder modulators composed of phase shifters based on the plasma dispersion effect, operating via reverse voltage polarization. However, from a literature review concerning MZMs made of silicon, we observed that the modulators performance is plateauing. On the other hand, to the best of our knowledge, MZM optimization via artificial intelligence algorithms is still unexplored in the literature. Electromagnetic simulation models present a high computational complexity, while opti- mization algorithms such as genetic algorithm require several inferences, even more when a multi-parameter device such as the MZM is being optimized. The simulations were carried out in an wrapper comprising CST and Lumerical (Mode and Device) softwares, and the high-level programming language Python. From this wrapper, we obtained 10,000 MZM configurations of random parameters. The dataset was used to train an artificial neural network model that can replace the high complexity simulation model in the computation of the cost function, accelerating the convergence of heuristic optimization algorithms. The simulation and the neural network consider eight design parameters, including the waveguide width, the doped regions width, the modulator length and the bias voltage. For the modulator performance metrics we considered the electro-optic bandwidth, the half-wave voltage and the optics insertion loss. The obtained results demonstrated that the network is able to emulate the simulation model with satisfactory accuracy for the three considered performance parameters. By utilizing the neural network for the MZMs evaluation phase of the heuristic algorithm, the time efficiency is increased by 107 times. By alleviating the burden on the hardware resources, it is possible to execute the optimization for high numbers of iterations and MZM samples. Furthermore, different figures of merit can be utilized to emphasize distinct performance parameters in the optimization. We concluded that this joint optimization configuration made it possible for us to explore the limits of the MZM architecture in terms of the considered metrics. Keywords: Silicon Photonics, Mach-Zehnder Modulator, Design Optimization, Deep Learn- ing, Differential Evolution. Lista de figuras Figura 1 – Constelações representando os seguintes formatos de modulação digital: (a) OOK, (b) PAM-4, (c) BPSK, (d) 4-QAM, (e) 16-QAM e (f) 64-QAM. 27 Figura 2 – Representação do transceptor integrado coerente por diagrama de blocos. No bloco superior temos a seção do transmissor e no bloco inferior temos a seção de recepção. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Figura 3 – Diagrama esquemático ilustrando moduladores integrados baseados na plataforma de siĺıcio. (a) Modulador de eletro-absorção. (b) Moduladores de micro-anel. (c) Moduladores de Michelson. (d) Moduladores de Mach- Zehnder. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Figura 4 – Estrutura de um MZM-IQ. . . . . . . . . . . . . . . . . . . . . . . . . . 42 Figura 5 – Esquemático de um interferômetro de Mach-Zehnder. . . . . . . . . . . 46 Figura 6 – Sáıda normalizada em relação à entrada, tanto para a intensidade quanto para a amplitude complexa do campo elétrico, e defasagem do campo elétrico complexo de sáıda em termos da diferença de fase. . . . . . . . 48 Figura 7 – (a) Função transferência de um MZI em relação ao comprimento de onda. Os braços possuem um desbalanço de 100 µm em relação ao comprimento f́ısico destes. (b) FSR, em relação ao comprimento de onda, do MZI considerado. . . . . . . . . . . . . . . . . . . . . . . . . . 50 Figura 8 – Configurações de alimentação. (a) Single drive (b) dual drive e (c) series push-pull. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Figura 9 – Diferentes estruturas de diodos. (a) Estrutura de junção interdigital. (b) Junção PN lateral convencional e (c) junção PN lateral com regiões de dopagens intermediárias. (d) Estrutura PIPIN. (e) Estrutura PIN. . . . 58 Figura 10 – Variação de (a) ı́ndice de refração e (b) atenuação em relação às variações de elétrons e de lacunas. . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Figura 11 – Circuito elétrico equivalente, considerando pequenos sinais, de um (a) diodo polarizado diretamente e (b) diodo polarizado reversamente. . . . 61 Figura 12 – Seção transversal de um guia do tipo rib com três ńıveis de dopagem. No centro do guia óptico há a formação de uma junção PN. A figura também mostra uma simplificação de um circuito elétrico equivalente à junção. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Figura 13 – (a) Variação do ı́ndice efetivo e das perdas ao aplicarmos uma tensão reversamente polarizada e (b) variação da fase do sinal para os mesmos valores de tensão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Figura 14 – Seção transversal de uma linha CPS simétrico com única camada de substrato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Figura 15 – Perspectiva isométrica e seção transversal da conexão do TWE com os guias de ondas do MZM. . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Figura 16 – Circuito equivalente RC paralelo da linha de transmissão com a junção PN como terminação. A janela superior mostra os elementos da junção PN antes de tomarmos o circuito RC paralelo equivalente. Figura adaptada de (POZAR, 2005). . . . . . . . . . . . . . . . . . . . . . . . 71 Figura 17 – Comparação entre três modelos de regressão, em que um deles apresenta underfitting, o outro apresenta overfitting, e o último demonstra um mapeamento adequado. (a) Conjunto de dados, de teste e de treinamento, e as curvas de mapeamento obtidas pelos modelos de regressão. (b) Erro do conjunto de treinamento e de validação em relação às iterações de treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Figura 18 – (a) Uma distribuição gaussiana com média 10 e desvio padrão de 4 e (b) a mesma distribuição após a estandardização. . . . . . . . . . . . . 83 Figura 19 – Função de ativação unidade linear retificada (ReLu). . . . . . . . . . . 83 Figura 20 – Uma ANN totalmente conectada composta de Lc camadas com quanti- dades arbitrárias de unidades neurais. Tem-se n neurônios de entrada K neurônios de sáıda. . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 Figura 21 – Diagrama de blocos do algoritmo de DE. . . . . . . . . . . . . . . . . . 97 Figura 22 – Diagrama de blocos do nosso esquema de otimização conjunta de ANNs com algoritmos de otimização. . . . . . . . . . . . . . . . . . . . . . . . 98 Figura 23 – Ilustração do MZM a ser implementado. A parte superior representa uma seção do modulador e dos guias de transmissão, enquanto a parte do meio representa a seção transversal do modulador completo e abaixo temos a seção transversal de um dos braços do modulador. Figura adaptada de (MOTTA et al., 2017). . . . . . . . . . . . . . . . . . . . . 101 Figura 24 – Diagrama de blocos da geração de dados a partir do modelo de simulação. Os blocos com contornos em preto indicam a utilização da linguagem de programação de alto ńıvel, enquanto que os blocos com contornos vermelhos e azuis indicam, respectivamente, simulações ópticas e elétricas.102 Figura 25 – Design de um CPS com extensões em formato de T (MOTTA et al., 2017). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Figura 26 – Ilustração da ANN utilizada no trabalho. As entradas são os parâmetros de design e a sáıda são os parâmetros de métricas referentes ao MZM. (a) ANN arbitrária aplicada ao nosso problema e (b) ANN utilizada na otimização aqui presente. . . . . . . . . . . . . . . . . . . . . . . . . . 107 Figura 27 – Curva de aprendizado para o caso da ANN que demonstra 4 camadas escondidas. A figura compara a otimização da ANN ao utilizar BN, DO, RES, todas combinações de 2 destes e o modelo completo. As curvas de aprendizado são em relação ao (a) conjunto de treinamento e (b) conjunto de testes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Figura 28 – Curvas de aprendizado comparando as ANNs de 3 a 6 camadas escon- didas, tanto para o caso da ANN base quanto para a ANN completa. Curvas de aprendizado em relação ao (a) conjunto de treinamento e (b) conjunto de testes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Figura 29 – Decaimento da taxa de aprendizado em relação às épocas do treinamento da ANN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Figura 30 – Sobreposição de um subconjunto dos valores de teste simulados e pre- vistos pelo modelo baseado em ANN para (a) BWEO, (b) IL e (c) Vπ. Relação entre os valores simulados e previstos, considerando todo o conjunto de testes para (d) BWEO, (e) IL e (f) Vπ. A linha tracejada indica os valores ideais. . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Figura 31 – Métricas de desempenho do MZM do conjunto de treinamento da ANN e as métricas obtidas por 100 execuções do algoritmo DE. Os eixos são dados pela BWEO e pelo Vπ, e a intensidade de cor representa os valores de IL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Figura 32 – FOM do melhor indiv́ıduo da geração considerando 100 inicializações aleatórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Figura 33 – Otimização por DE de apenas duas métricas de desempenho do MZM, enquanto o outro é limitado para determinado valor de limiar. (a) Métricas obtidas ao limitar o BWEO, (b) métricas obtidas ao limitar o IL e (c) métricas obtidas ao limitar o Vπ. . . . . . . . . . . . . . . . . 118 Figura 34 – Sobreposição de um subconjunto dos valores de métricas relativas aos MZMs otimizados pelos algoritmos heuŕısticos, previstos pela ANN e pelo modelo de simulação eletromagnética, para (a) BWEO, (b) IL e (c) Vπ. Relação entre os valores simulados e previstos, considerando os 400 MZM otimizados, para (d) BWEO, (e) IL e (f) Vπ. A linha tracejada indica a relação ideal. . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Figura 35 – Seção infinitesimal de uma linha de transmissão, com a tensão e a corrente propagante em função do tempo e os parâmetros distribúıdos ilustrados. Figura adaptada de (POZAR, 2005). . . . . . . . . . . . . . 137 Figura 36 – Linha de transmissão representada como uma rede de duas portas. . . 139 Figura 37 – Diagrama de fluxo do algoritmo genético. A caixa em azul se refere ao algoritmo de evolução diferencial. . . . . . . . . . . . . . . . . . . . . . 142 Figura 38 – Esquemático do cruzamento entre dois cromossomos. . . . . . . . . . . 143 Figura 39 – Diagrama de fluxo do algoritmo de otimização por enxames de part́ıculas.145 Figura 40 – Diagrama de fluxo do algoritmo de DA. . . . . . . . . . . . . . . . . . 146 Figura 41 – Curva de convergência da otimização pelos algoritmos heuŕısticos, con- siderando 100 inicializações aleatórias para cada um destes. . . . . . . 148 Figura 42 – Métricas de desempenho dos MZMs obtidos pela otimização via algo- ritmos heuŕısticos para 100 inicializações aleatórias. (a) Conjunto de dados do treinamento da ANN e os MZMs otimizados pelo GA, PSO e DA. (b) Resultados da otimização por GA, por (b) PSO e por (d) DA. 150 Lista de tabelas Tabela 1 – Comparativo entre MZMs em siĺıcio reportados em diversos trabalhos, em ordem cronológica de publicação. A tabela inclui a BWEO, a Vπ, a IL, figura de mérito definida e a modulação utilizada. . . . . . . . . . . 43 Tabela 2 – Resultados de simulação obtidos para diferentes estruturas de diodos. Tais resultados incluem as métricas BWEO, IL e Vπ obtidos em (PEREZ- GALACHO et al., 2015) . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Tabela 3 – Parâmetros variáveis do MZM no modelo de simulação, com seus res- pectivos alcances de valores. . . . . . . . . . . . . . . . . . . . . . . . . 101 Tabela 4 – Número de camadas escondidas por configuração de ANN, número de neurônios pertencentes a cada camada e configurações utilizadas. . . . 108 Tabela 5 – FOMs utilizados durante a otimização. A tabela inclui os FOMs que foram utilizados ao limitar alguma das métricas, de forma que seu valor não seja ultrapassado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Tabela 6 – Valores de MSE, MAE e rp para as métricas BWEO, IL e Vπ e para as amostras em que Vπ<10 V. Não calculamos o rp para o caso em que Vπ<10 V pois a correlação de Pearson para conjunto de dados com diferentes amostras pode não ser muito precisa. . . . . . . . . . . . . . 115 Tabela 7 – Avaliação das métricas obtidas pelos 400 MZMs otimizados pelos algo- ritmos heuŕısticos. A tabela inclui o MAE, MSE e rp ao relacionar as métricas obtidas pelos diferentes métodos. A tabela também inclui a média das métricas para cada método, assim como o erro percentual entre estas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Tabela 8 – Média, desvio padrão e valor máximo para a FOM obtida pelos algo- ritmos heuŕısticos, considerando 100 inicializações aleatórias. A tabela também mostra os valores mı́nimos e máximos obtidos para cada um dos parâmetros de métrica do MZM. . . . . . . . . . . . . . . . . . . . 149 Lista de abreviaturas e siglas ADAM Adaptive Moment Estimation - Estimativa Adaptativa de Momento ADC Analog to Digital Converter - Conversor Analógico para Digital ANN Artificial Neural Network - Rede Neural Artificial BN Batch Normalization - Normalização de Batch BPSK Binary Phase Shift Keying - Chaveamento Binário de Fase BP Backward Propagation - Retropropagação CMOS Complementary Metal Oxide Semiconductor - Metal Óxido-Semicondutor Complementar CPS Coplanar Stripline- Guia de Onda de Tira Coplanar CPU Central Processing Unit - Unidade Central de Processamento CPW Coplanar Waveguide - Guia de Onda Coplanar CSA Classical Simulated Annealing - Recozimento Clássico CW Continuous Wave - Onda Cont́ınua DA Dual Annealing - Recozimento Duplo DE Differential Evolution - Evolução Diferencial DL Deep Learning - Aprendizado Profundo DO Dropout DSP Digital Signal Processing - Processamento de Sinais Digitais DV Distribuição de Visitação FCA Free Carrier Absorption - Absorção de Portadores Livres FC Fully Connected - Totalmente Conectada FEEM Finite Element Eigenmode - Automodo de Elemento Finito FOM Figure of Merit - Figura de Mérito FP Feedforward Propagation - Propagação Avante FSA Fast Simulated Annealing - Recozimento Rápido GA Genetic Algorithm - Algoŕıtmo Genético GD Gradient Descent - Gradiente Descendente GSA Generalized Simulated Annealing - Recozimento Generalizado GaAs Gallium Arsenide - Arsenieto de Gálio IA Inteligência Artificial IF Intermediate Frequency - Frequência Intermediária IoT Internet of Things - Internet das Coisas IP Internet Protocol - Protocólo de Internet IM-DD Intensity Modulation - Direct Detection - Modulação de Intensidade e Detecção Direta ISI Intersymbol Interference - Interferência Intersimbólica InP Indium Phosphide - Fosfeto de Índio LD Laser Diode - Diodo Laser LO Local Oscilator - Oscilador Local LiNbO3 Lithium Niobate - Niobato de Ĺıtio MAE Mean Absolute Error - Erro Absoluto Médio ML Machine Learning - Aprendizado de Máquinas MLP Multilayer Perceptron - Percéptron Multi-camadas MMI Multimode Interferometer - Interferômetro Multi-Modo MSE Mean Squared Error - Erro Quadrático Médio MZI Mach-Zehnder Interferometer - Interferômetro de Mach-Zehnder MZM Mach-Zehnder Modulator - Modulador de Mach-Zehnder OIF Optical Internetworking Forum - Fórum de Interconexão Óptica OOK On-Off Keying - Chaveamento Liga Desliga OPLL Optical Phase-Locked Loop - Laço de Sincronismo de Fase Óptica PAM Pulse Amplitude Modulation - Modulação de Pulso em Amplitude PDE Plasma Dispersion Effect - Efeito de Dispersão de Plasma PSK Phase Shift Keying - Chaveamento por Deslocamento de Fase PSO Particle Swarm Optimization - Otimização por Enxame de Part́ıculas PSR Polarization Splitter and Rotator - Divisor e Rotor de Polarização PS Power Splitter - Divisor de Potência QAM Quadrature Amplitude Modulation - Modulação de Amplitude em Qua- dratura QCSE Quantum-Confined Stark Effect - Efeito Stark Confinado por Quantum QPSK Quadrature Phase Shift Keying - Chaveamento por Deslocamento de Fase em Quadratura RAM Random Access Memory - Memória de Acesso Aleatória RES Residual Connections - Conexões Residuais ReLu Rectified Linear Unit - Unidade Linear Retificada SGD Stochastic Gradient Descent - Gradiente Descendente Estocástico SOI Silicon-on-Insulator - Siĺıcio em Isolante SSP Series Push-Pull Si Silicon - Siĺıcio TEM Transverse Electromagnetic - Transversal Electromagnético TE Transverse Electric - Transversal Elétrico TIA Transimpedance Amplifiers - Amplificadores de Transimpedância TM Transverse Magnetic - Transversal Magnético TW Traveling Wave - Onda Viajante TWE Traveling Wave Electrode - Eletrodo de Onda Viajante WDM Wavelength Division Multiplexing - Multiplexação por Divisão de Com- primento de Onda Z-score Standard Score - Escore Padronizado Lista de śımbolos Eout Amplitude do campo elétrico na sáıda do combinador do interferômetro de Mach-Zehnder Eoi Amplitude do campo elétrico na sáıda do braço i do interferômetro de Mach-Zehnder Ei Amplitude do campo elétrico no braço i do interferômetro de Mach- Zehnder Ein Amplitude do campo elétrico na entrada do divisor de potência do interferômetro de Mach-Zehnder ak Ativação do k-ésimo neurônio artificial Vj Barreira de potencial da junção PN E Campo elétrico ET Campo elétrico transversal H Campo magnético HT Campo magnético transversal Cj Capacitância da junção PN cd Capacitância de difusão C Capacitância distribúıda da linha de transmissão Ctpn Capacitância equivalente da linha de transmissão carregada q Carga elementar κ Coeficiente de absorção α Coeficiente de atenuação αRF Coeficiente de atenuação de RF αi Coeficiente de atenuação do i-ésimo braço do interferômetro de Mach- Zehnder rp Coeficiente de correlação de Pearson Γ Coeficiente de reflexão ΓS Coeficiente de reflexão na fonte ΓT Coeficiente de reflexão na terminação β(1) e β(2) Coeficientes de primeiro e de segundo momento no otimizador ADAM λ Comprimento de onda λRF Comprimento de onda de RF Lps Comprimento do deslocador de fase Li Comprimento do i-ésimo braço do interferômetro de Mach-Zehnder ni Concentração intŕınseca de portadores Gd Condutância da junção PN G Condutância distribúıda da linha de transmissão S Conjunto de dados para treinamento da rede neural KB Constante de Boltzmann βi Constante de fase do i-ésimo braço do interferômetro de Mach-Zehnder i Corrente elétrica ∆φ Defasamento entre os braços do interferômetro de Mach-Zehnder ∆N Densidade em excesso de elétrons ∆N++ Densidade em excesso de elétrons na região com dopagem forte ∆N+ Densidade em excesso de elétrons na região com dopagem intermediária ∆P Densidade em excesso de lacunas ∆P++ Densidade em excesso de lacunas na região com dopagem forte ∆P+ Densidade em excesso de lacunas na região com dopagem intermediária ∆T Diferença de temperatura σBN Desvio padrão considerando as amostras de um mini-batch gstrip Espaçamento entre as tiras do guia de onda de tira coplanar ge Espaçamento efetivo t Espaçamento entre eletrodos g Espaçamento entre extensões T do eletrodo tRIB Espessura do guia de onda RIB FSR Free Spectral Range - Faixa Espectral Livre φi Fase acumulada pelo i-ésimo braço do interferômetro de Mach-Zehnder εADAM Fator de correção do otimizador Adam Q Fator de qualidade ki Fração da potência sendo guiada para o i-ésimo braço do interferômetro de Mach-Zehnder ω Frequência angular h Função de ativação da rede neural J Função de custo Tm Função de transferência do Mach-Zehnder T (f) m Função de transferência do Mach-Zehnder em relação ao campo elétrico complexo δ Gradiente local Z Impedância Z0 Impedância caracteŕıstica da linha de transmissão Z0−cps Impedância caracteŕıstica do guia de ondas CPS Zs Impedância da fonte Zt Impedância do terminal da linha de transmissão ng−eff Índice de grupo efetivo n Índice de refração n Índice de refração complexo nc Índice de refração do núcleo neff Índice de refração efetivo neff−mw Índice de refração efetivo de RF neff,int Índice de refração efetivo intŕınseco L Indutância distribúıda da linha de transmissão IL Insertion loss - Perdas por Inserção Iout Intensidade na sáıda do interferômetro de Mach-Zehnder Iin Intensidade óptica da onda de entrada do interferômetro de Mach- Zehnder Wi Largura da camada de dopagem do i-ésimo bloco r Largura da conexão entre o eletrodo e sua extensão T Wd Largura da região de depleção W Largura das extensões T do eletrodo BWEO Largura de banda eletro-óptica We Largura de strip efetiva H(l) Mapeamento realizado pela l-ésima camada de uma rede neural artificial µBN Média em relação às amostras de um mini-batch ninputs Número de entradas numa unidade neural OMA Optical Amplitude Modulation - Amplitude de Modulação Óptica λreg Parâmetro de regularização γBN Parâmetro do BN que escalona a distribuição de amostras βBN Parâmetro do BN que desloca a distribuição de amostras S Parâmetros S (Matriz) αmod Perdas de modulação µ Permeabilidade magnética do meio ε Permissividade do meio ε0 Permissividade do vácuo εs Permissividade elétrica relativa do siĺıcio εSiO2 Permissividade elétrica relativa da śılica εr Permissividade relativa Psd Potência dissipada utilizando um único driver em um Modulador de Mach-Zehnder Pdd Potência dissipada utilizando dois drivers em um Modulador de Mach- Zehnder u Potencial de ativação da unidade neural Φ Potencial eletrostático escalar Pdyn Potência dissipada do modulador de Mach-Zehnder operando de forma dinâmica PH Potência do maior śımbolo de modulação PL Potência do menor śımbolo de modulação mt e vt Primeiro e segundo momentos de gradiente n Quantidade de atributos de entrada de uma amostra k Quantidade de atributos de sáıda de uma amostra Lc Quantidade de camadas escondidas na rede neural artificial sl Quantidade de unidades neurais da l-ésima camada ER Extinction Ratio - Razão de Extinção ke Razão de aspecto efetiva entre espaçamento e largura dos substratos k(1) Razão de aspecto entre espaçamento e largura dos substratos RS Resistência da fonte Rj Resistência da junção PN Rsi Resistência de folha do i-ésimo bloco RT Resistência de terminação R Resistência distribúıda da linha de transmissão Rtpn Resistência equivalente da linha de transmissão carregada rb Resistências da junção PN T Temperatura Vbias Tensão DC aplicada no modulador de Mach-Zehnder Vπ Tensão de meia-onda V Tensão externa aplicada Vavg Tensão média entre eletrodos b Termo de bias da rede neural L2 Termo de custo de regularização r Termo de probabilidade de DO TPP Transmission Power Penalty - Penalidade de Potência de Transmissão ∆n Variação de ı́ndice de refração ∆neff Variação de ı́ndice de refração efetivo ∆α Variação de coeficiente de atenuação c Velocidade da luz no vácuo w Vetor de pesos de uma camada da rede neural v Vetor doador u Vetor tentativa Sumário 1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.1 Fotônica Integrada para Sistemas de Comunicações Ópticas . . . . . . 29 1.2 Moduladores Ópticos Integrados . . . . . . . . . . . . . . . . . . . . . 34 1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 1.4 Contribuições do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . 44 1.5 Organização do Documento . . . . . . . . . . . . . . . . . . . . . . . . 45 2 Fundamentos de Moduladores de Mach-Zehnder . . . . . . . . 46 2.1 Interferômetros de Mach-Zehnder . . . . . . . . . . . . . . . . . . . . 46 2.2 Moduladores de Mach-Zehnder . . . . . . . . . . . . . . . . . . . . . . 50 2.2.1 Configurações de Alimentação . . . . . . . . . . . . . . . . . . . . . 52 2.2.2 Figuras de Mérito de um MZM . . . . . . . . . . . . . . . . . . . . 54 2.3 Deslocadores de Fase . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.3.1 Estruturas de Diodos . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.3.2 Efeito de Dispersão de Plasma . . . . . . . . . . . . . . . . . . . . . 59 2.3.3 Polarização Direta e Reversa da Junção PN . . . . . . . . . . . . . 61 2.3.4 Resposta Óptica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 2.4 Eletrodos de Ondas Viajantes . . . . . . . . . . . . . . . . . . . . . . 66 2.4.1 Guia de Ondas de Tiras Coplanares sem Carga . . . . . . . . . . . 67 2.4.2 Linha de Transmissão com Carga . . . . . . . . . . . . . . . . . . . 70 2.4.3 Banda Eletro-Óptica Considerando os Parâmetros da Linha de Transmissão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3 Fundamentos de Inteligência Artificial . . . . . . . . . . . . . . 77 3.1 Prinćıpios de Aprendizagem de Máquinas e Aprendizagem Profunda . 77 3.1.1 Aprendizagem de Máquinas . . . . . . . . . . . . . . . . . . . . . . 78 3.1.2 Funcionamento de Redes Neurais Artificiais . . . . . . . . . . . . . 82 3.1.3 Aprimoramento de Redes Neurais Artificiais . . . . . . . . . . . . . 88 3.1.4 Métricas Do Mapeamento da ANN . . . . . . . . . . . . . . . . . . 94 3.2 Evolução Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 3.3 Otimização Integrando Algoritmos Heuŕısticos e Redes Neurais Artificiais 97 4 Método de Otimização . . . . . . . . . . . . . . . . . . . . . . . . 100 4.1 Geração de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.1.1 Simulação da Seção Elétrica . . . . . . . . . . . . . . . . . . . . . . 102 4.1.2 Simulação da Seção Óptica . . . . . . . . . . . . . . . . . . . . . . 104 4.2 Otimização do Modulador . . . . . . . . . . . . . . . . . . . . . . . . 106 4.2.1 Mapeamento por Rede Neural . . . . . . . . . . . . . . . . . . . . . 106 4.2.2 Otimização por Evolução Diferencial . . . . . . . . . . . . . . . . . 109 4.2.3 Métricas de Otimização . . . . . . . . . . . . . . . . . . . . . . . . 109 5 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.1 Resultados da Rede Neural Artificial . . . . . . . . . . . . . . . . . . . 111 5.1.1 Curvas de Aprendizado . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.1.2 Desempenho da Rede Neural Artificial . . . . . . . . . . . . . . . . 113 5.2 Resultados de Otimização Utilizando Evolução Diferencial . . . . . . . 115 5.3 Validação dos Moduladores Otimizados com o Modelo de Simulação . 119 6 Conclusões e Trabalho Futuro . . . . . . . . . . . . . . . . . . . 121 Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 APÊNDICES 136 Apêndice A – Análise de Parâmetros Distribúıdos . . . . . . . 137 A.1 Parâmetros S e de Transmissão . . . . . . . . . . . . . . . . . . . . . 139 Apêndice B – Outros Algoritmos Heuŕısticos . . . . . . . . . . 142 B.1 Funcionamento dos Algoritmos Heuŕısticos . . . . . . . . . . . . . . . 142 B.1.1 Algoritmo Genético . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 B.1.2 Otimização por Enxame de Part́ıculas . . . . . . . . . . . . . . . . 144 B.1.3 Dual Annealing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 B.2 Metodologia dos Algoritmos Heuŕısticos . . . . . . . . . . . . . . . . . 148 B.3 Resultados dos Algoritmos Heuŕısticos . . . . . . . . . . . . . . . . . . 148 25 1 Introdução A exigência por sistemas de telecomunicações cada vez com capacidades superiores de transmissão se mostra crescente, principalmente quando se trata de sistemas ópticos, amplamente utilizados devido à disposição de uma larga banda (ZHOU; LIU; URATA, 2017). Tais sistemas devem dispor de capacidade suficiente para atender as demandas impostas por serviços como os de streaming, computação em nuvem e computação dis- tribúıda (THRASKIAS et al., 2018). De acordo com a Cisco Systems, há previsões de que o número de dispositivos conectados por protocolo de Internet (Internet Protocol, IP) será de 29,3 bilhões em 2023, em relação aos 18,4 bilhões em 2018, o que representa um aumento de quase 60% em apenas 5 anos (CISCO, 2022). Também é de se esperar que as taxas médias de Internet fixa aumentem de 45,9 Mbps para 110,4 Mbps. Outra pesquisa indica que, em 2010, haviam menos de 2 bilhões de usuários de Internet ao redor do mundo (DATA, 2022). Este número mais do que dobrou até 2018, em que 4,2 bilhões de pessoas possúıam acesso à Internet e, em 2021, o número de usuários subiu para 5,1. Já no caso do Brasil temos que em 2008 haviam 67 milhões de usuários de Internet e, em 2019, o páıs apresentou 149 milhões de usuários. Outra fonte mais recente mostra que em 2021 Brasil apresentou quase 162 milhões de usuários de Internet, o que representa 76% da população do páıs (STATISTA, 2022). Outro campo que se espera que cause um significativo aumento da capacidade que os operadores devem oferecer é a Internet das coisas (Internet of Things, IoT). A tecnologia de IoT se encontra em um alto grau de amadurecimento, e esta tem como proposta a interconexão de diversos objetos cotidianos por meio da rede. IoT abrange comunicações de máquina para máquina, de humanos para máquinas e de humanos para humanos. De acordo com (IOT-ANALYTICS, 2022), em 2021 o números de dispositivos conectados em IoT eram de 12.2 bilhões, e até 2025 haverão 27 bilhões de dispositivos. As previsões são que, em 2025, 152.000 dispositivos de IoT serão conectados, por minuto, na Internet (DATAPROT, 2022). É de se esperar que este excessivo número de dispositivos conectados resulta num acréscimo do congestionamento da rede de transferência de dados em centros de processamento de dados (data-centers). Para o atendimento de tais demandas, os data- centers apresentam um aumento tanto em relação à taxa de dados de seus enlaces, quanto 26 na distância que estes dados devem percorrer, o que se dá devido à ampliação f́ısica de tais centros (BENNER, 2012). A transferência de dados em um data-center pode ocorrer de um computador para outro, de uma unidade de processamento central (Central Processing Unit, CPU) para outra CPU ou para uma memória, de uma memória para uma CPU e também devemos levar em consideração a entrada e a sáıda de dados do centro para a rede Internet. Deve-se dar atenção especial ao projeto de telecomunicações em data-centers, pois se este apresentar um desempenho sub-ótimo, resultará em um gargalo na funcionalidade dos servidores. Não obstante, um trabalho de 2012 indica que a transferência de dados entre chips apresenta um custo de energia até 200 vezes maior do que o custo para processamento desses dados (BENNER, 2012). Estes fatos justificam o estudo de transferência de dados cada vez mais eficiente em termos de desempenho e consumo de energia em centros de processamentos. Em um data-center, a transferência de dados pode se dar por meios guiados ou por ar livre. Meios sem fio são convenientes por possúırem dispositivos mais simples e compactos. Apesar de haver estudos intensivos em novos métodos e novas frequências de operação (VARDHAN et al., 2010), estes ainda apresentam limitações em largura de banda e distância e podem apresentar interferência entre canais (crosstalk) na ausência de esquemas eficientes de acesso múltiplo ao meio. Meios sem fio são adequados em enlaces de relativamente curto alcance, e também que requeiram baixa largura de banda. Por outro lado, interconexões guiadas podem ser implementadas a partir de guias elétricos ou guias ópticos, cada qual com suas respectivas caracteŕısticas. Canais ópticos se destacam em relação a canais elétricos devido ao maior produto entre largura de banda e comprimento dispońıvel para transmissão de informação, mesmo sem utilizar multiplexação por compri- mento de onda (Wavelength Division Multiplexing, WDM) (STUCCHI et al., 2013). Além disso, enlaces ópticos possuem menores perdas e são mais resilientes à interferência entre canais, o que possibilita uma maior densidade de interconexões (MILLER, 2009). Levando em consideração que, geralmente, os dados são gerados e processados no domı́nio elétrico, a implementação de interconexões ópticas impõe duas etapas adicionais: a conversão do domı́nio elétrico para domı́nio óptico e do domı́nio óptico para o domı́nio elétrico. Estas etapas adicionais elevam o custo total do sistema, por isto canais elétricos ainda são prefeŕıveis em casos de curta distância e em enlaces que não requerem requisitos rigorosos 27 de largura de banda. O desenvolvimento de conversores eletro-opticos de baixo custo pode mudar este cenário. Para o atingimento de taxas na ordem de Tbps, sistemas coerentes ópticos têm sido introduzidos. Além da já tradicionalmente utilizada modulação por intensidade com detecção direta (Intensity Modulation Direct Detection, IM-DD), como o chaveamento liga-desliga (On-Off Keying, OOK), os sistemas coerentes ópticos permitem a codificação de informação digital por modulação de amplitude, fase e também multiplexação de estados de polarização ortogonais (AGRAWAL, 2014). Alguns dos formatos de modulação que sistemas coerentes suportam são o chaveamento por deslocamento de fase (Phase Shift Keying, PSK), chaveamento por deslocamento de fase em quadratura (Quadrature Phase Shift Keying, QPSK) e modulação de amplitude em quadratura (Quadrature Amplitude Modulation, QAM). Estes formatos avançados de modulação, tais quais apresentando os diagramas de constelação ilustrados pela Figura 1, são capazes de codificar informação tanto na amplitude quanto na fase da onda portadora. A Figura 1(a) ilustra o caso do OOK, em que há apenas dois ńıveis de intensidade e a fase não é relevante para a informação. A Figura 1(b) ilustra a modulação de pulso em amplitude (Pulse Amplitude Modulation, PAM) com quatro ńıveis (PAM-4). Neste tipo de modulação, a informação é codificada I Q I Q I Q I Q I Q I Q (a) (b) (c) (d) (e) (f) Figura 1 – Constelações representando os seguintes formatos de modulação digital: (a) OOK, (b) PAM-4, (c) BPSK, (d) 4-QAM, (e) 16-QAM e (f) 64-QAM. 28 apenas na amplitude, porém há múltiplos ńıveis, permitindo uma maior eficiência espectral. A Figura 1(c) esquematiza a modulação por chaveamento binário de fase (Binary Phase Shift Keying, BPSK), em que há dois śımbolos de informação, sendo a diferença na representação destes um defasamento de 180°. Já as Figuras 1(d-f) ilustram o diagrama de constelação para o formato de modulação QAM com, respectivamente, 4, 16 e 64 ńıveis. No formato de modulação QAM, a informação é codificada tanto na amplitude quanto na fase da portadora, por isto este apresenta a maior eficiência espectral entre os formatos discutidos anteriormente. Devemos nos atentar ao fato de que quanto mais śımbolos representados por um formato de modulação, menor vai ser a distância entre estes no espaço do diagrama de constelação (considerando a mesma potência máxima de modulação). Isto significa que o sistema é mais senśıvel a rúıdo e distorções, podendo ocasionar uma detecção errônea do ńıvel de amplitude ou da fase. Tais esquemas de que combinam modulação de fase e de amplitude já eram presentes em sistemas coerentes de rádio frequência e de micro-ondas desde os anos 60 (CAMPOPIANO; GLAZER, 1962). Apesar de já terem sido alvo de estudos em sistemas ópticos nos anos 80 (KAZOVSKY, 1989), foi apenas a partir de 2000, com o avanço do processamento digital de sinais (Digital Signal Processing, DSP), que se fez posśıvel sua aplicação comercialmente (LI, 2009). Na seção do transmissor do sistema coerente, a modulação é realizada codificando informação no campo elétrico, com a liberdade de modular sua fase além de sua intensidade, de forma independente. Em configurações QAM, por exemplo, são combinados sinais modulados em amplitude, tanto para o eixo em fase quanto para o eixo em quadratura (tais eixos são defasados em 90°). Como consequência da modulação de fase, a transformada de Fourier do campo modulado não apresenta simetria hermitiana em torno a sua frequência central. Já na seção de recepção do sistema coerente, o receptor deve ser capaz de decodificar as amplitudes nos eixos em fase e em quadratura. Para este fim, emprega-se uma rede h́ıbrida 2x4 de 90◦ e um oscilador local (Local Oscilator, LO), ou seja, um laser de onda cont́ınua (Continuous Wave, CW). Com a combinação da rede h́ıbrida com o LO, discrimina-se os componentes ortogonais e recupera-se a informação em amplitude e em fase (KIKUCHI, 2016). Maiores detalhes sobre esse processo serão discutidos na Seção 1.1. Podemos classificar a detecção do sinal como sendo de três tipos, sendo elas a homódina, heteródina e intradina. A maior limitação da detecção homódina é a necessi- dade de sincronia de frequência e fase do LO com o sinal. Para isto, é necessária uma malha de captura de fase óptica (Optical Phase-Locked Loop, OPLL), o que aumenta 29 significativamente a complexidade do sistema (NORIMATSU; IWASHITA; SATO, 1990). Já no caso da detecção heteródina, requere-se que a diferença entre a frequência central do sinal e do LO seja maior do que a banda que o sinal ocupa. Essa diferença de frequências, denominada frequência intermediária (Intermediate Frequency, IF), apresenta o fato de que requer de uma banda de detecção excessivamente alta (KIKUCHI, 2016). De fato, a detecção heteródina requer uma banda de até 5 vezes maior largura do que a banda requerida pela detecção homódina, de acordo com (KAZOVSKY, 1985), o que impõe um desafio tanto na foto-detecção quanto no processamento dos dados. No caso de detecção intradina, devido a implementação mais simples, esta representa uma solução viável para receptores em sistemas coerentes ópticos. Neste tipo de detecção, o LO não precisa estar completamente em sincronia com o sinal. Diferenças de frequência e fase são compensadas via algoritmos de DSP (DERR, 1991). A diversidade de amplitude e fase resulta em uma melhoria na eficiência espectral dos canais de transmissão, permitindo um aumento significativo na capacidade total do sistema. Sistemas coerentes digitais devem fazer uso de um DSP competente, o qual deve ser capaz de compensar efeitos lineares e não lineares (LI, 2009). Sendo assim, a compatibilidade com transmissão e recepção coerente é fundamental para um transceptor competitivo atual de alto desempenho. A integração de tais sistemas ópticos de alto desempenho se faz conveniente devido sua compacidade e seu custo reduzido, sobretudo quando a manufatura é realizada em larga escala. Na próxima seção iremos discutir o conceito de fotônica integrada, e daremos um exemplo de implementação de um transceptor coerente digital em chip. 1.1 Fotônica Integrada para Sistemas de Comunicações Ópticas Fotônica integrada se refere à dispositivos e circuitos ópticos integrados em um chip, em que estes componentes apresentam funções que permitem a manipulação de ondas de luz (radiação eletromagnética nas faixas de comprimentos de ondas de 500 nm até 2000 nm) (COLDREN; CORZINE; MASANOVIC, 2012; SIEW et al., 2021a). Na área de telecomunicações, há diversas plataformas para a implementação de fotônica integrada, sendo algumas das plataformas mais comuns o niobato de ĺıtio (LiNbO3), o fosfeto de ı́ndio (InP), o arsenieto de gálio (GaAs) e o siĺıcio (Si) (SIEW et al., 2021b). Como é de se 30 esperar, cada uma destas plataformas apresentam vantagens e desvantagens únicas. No desenvolvimento de projetos de fotônica integrada deve-se levar em consideração tanto o desempenho que a plataforma de fabricação oferece para uma função de interesse, quanto a disponibilidade de manufatura da foundry ou do laboratório. A escolha da plataforma de siĺıcio para o projeto de dispositivos fotônicos é jus- tificada, principalmente, devido a compatibilidade desta plataforma com o processo de manufatura de metal óxido-semicondutor complementar (Complementary Metal-Oxide Semiconductor, CMOS) (SIEW et al., 2021a). Sendo um processo amadurecido, CMOS já vem sendo utilizado há décadas para produção de dispositivos eletrônicos, estes operando na faixa de frequências de RF e de micro-ondas (CHROSTOWSKI; HOCHBERG, 2015). Fotônica integrada em siĺıcio é alvo de estudo desde 1985, com a premissa de produzir guias de ondas em siĺıcio sobre isolante (Silicon-On-Insulator, SOI) (REED; HEADLEY; PNG, 2005). A caracteŕıstica do SOI é que, neste caso, a junção do siĺıcio é constrúıdo acima de um isolante elétrico. Sistemas fabricados em SOI encontram aplicações em microeletrônica devido à algumas propriedades elétricas desta plataforma como, por exemplo, a redução da capacitância parasita nos dispositivos (CELLER; CRISTOLOVEANU, 2003). No caso de aplicações em fotônica integrada, o guia de onda é composto de siĺıcio e envolvido por dióxido de siĺıcio (śılica). Devido ao alto contraste de ı́ndice de refração entre o siĺıcio (́ındice de refração de n = 3, 47, em 1550 nm) e a śılica (n = 1, 444 em 1550 nm), há um alto grau de confinamento dos modos propagantes no guia, o qual permite a implementação de dispositivos compactos. Apesar de seus benef́ıcios, a plataforma SOI ainda apresenta alguns desafios princi- palmente na fabricação de alguns dispositivos ativos como fontes de luz, fotodetectores e moduladores (THOMSON et al., 2016). A emissão de luz em componentes de transmissão óptica se dá a partir de um bombeio elétrico, o qual é responsável por elevar o estado de energia dos átomos do material semicondutor. A excitação de um átomo causa uma elevação dos elétrons pertencentes à banda de valência para a banda de condução, gerando lacunas na banda de valência. Quando um elétron que se encontra na banda de condução se recombina com uma lacuna pertencente à banda de valência, no caso de recombinação radiativa, emite-se um ou vários fóton tal que a energia total é proporcional à diferença de energia entre ambas as bandas (AGRAWAL, 2014). O material composto de siĺıcio é demasiadamente ineficiente para emitir luz devido à sua caracteŕıstica de band gap indireto. Ou seja, em siĺıcio, o mı́nimo de energia pertencente à banda de condução se encontra em 31 diferentes ńıveis de momento de cristal em relação ao máximo de energia que a banda de valência possui. A solução mais tradicional para implementação de lasers em SOI é por fontes externas, apesar de haver soluções mais eficientes em estudo como, por exemplo, a integração monoĺıtica de um material com um ganho óptico elevado, como germânio ou algum material semi-condutor composto de III-V (CHROSTOWSKI; HOCHBERG, 2015). No caso de fotodetectores, tem-se o fato de que siĺıcio é praticamente transparente para faixas de comprimento de onda maiores que 1100 nm, o que implica uma baixa eficiência ao operar nas bandas utilizadas para telecomunicações (THOMSON et al., 2016). Há algumas técnicas para aumentar a absorção de fótons em siĺıcio, como implantação iônica, porém esta ainda não apresenta grande eficiência, dado que ainda é requerida altas tensões reversas de operação (DOYLEND; JESSOP; KNIGHTS, 2010). Outra solução é integração h́ıbrida com materiais III-V (CHANG et al., 2010), o que resulta em dispositivos eficientes porém de alta complexidade de fabricação. O método que mais se destaca é o de crescimento epitaxial de germânio, que resulta em uma alta eficiência e permite integração monoĺıtica com a tecnologia CMOS. A estrutura de moduladores em SOI será descrita em detalhes na Seção 1.2. Podemos classificar a integração de dispositivos fotônicos em duas categorias. Por um lado, a integração monoĺıtica se refere ao caso em que todos componentes de um circuito fotônico são integrados em um mesmo substrato. Já a integração h́ıbrida é o tipo em que diferentes componentes são fabricados em diferentes substratos, e então combinados de forma mecânica. Apesar da integração h́ıbrida apresentar funcionalidades inéditas, sua integração é suscept́ıvel à falhas devido às conexões entre os diferentes elementos, apresentando sensibilidade ao desalinhamento por expansões térmicas e vibrações (HUNS- PERGER, 2009). Com integração monoĺıtica em CMOS é posśıvel sua produção em massa, o que reduz significativamente o preço da fabricação de dispositivos. Podemos citar um exemplo de circuito fotônico, o transceptor, tal qual faz utilização de diversos dispositivos integrados, tanto por integração monoĺıtica como por integração h́ıbrida. Transceptores são componentes que combinam a capacidade de inserir (transmissão) e extrair (recepção) informação em um ou diversos canais. Um transceptor óptico coerente é composto por diversos subsistemas mais simples, os quais são responsáveis pela geração e detecção do sinal. A Figura 2 representa o diagrama de blocos de um transceptor integrado coerente. O transceptor ilustrado possui diversidade de fase e de polarização, ou seja, além de ser capaz de codificar e decodificar informação em fase e em quadratura, o mesmo 32 é capaz de utilizar ambas polarizações ortogonais para transmissão de informações em paralelo. Tal técnica é denominada multiplexação de polarização (IVANOVICH et al., 2018). Em fotônica integrada, geralmente, ambas as polarizações a serem manipuladas pelo sistema são denominadas modos transversal elétrico (Transverse Electric, TE) fundamental e transversal magnético (Transverse Magnetic, TM ) fundamental. O modo TE consiste do campo elétrico estar oscilando na direção paralela ao plano do substrato, e utilizamos a notação que o estado de polarização está em X. O modo TM, por sua vez, oscila na direção ortogonal ao plano do substrato, então referimos que o estado de polarização deste está em Y. É válido observar que, devido ao fato do guia de ondas ser formado por dielétricos, e nao por metal, não há modos puramente TE ou TM (WENG; LIN; WU, 2021). Entretanto, por simplicidade, iremos nos referir aos modos quasi-TE e quasi-TM como modos TE e TM. Na seção do transmissor, o bloco de DSP é encarregado da geração de uma certa sequência binária, o seu mapeamento para o formato de modulação desejado, a formatação do pulso e pré-compensação de impedimentos de transmissão. Os pulsos elétricos gerados são então transmitidos para os drivers, tais quais possibilitam o controle dos ńıveis de tensão requeridos para uma modulação eficiente. Do ponto de vista do domı́nio óptico, gera-se uma onda de luz de onda cont́ınua a partir do diodo laser (Laser Diode, LD). Para o caso do transmissor com diversidade de fase e polarização, a onda luminosa tem sua potência dividida em quatro ramos, idealmente com potências idênticas, a partir de duas sequências de divisores de potência (Power Splitter, PS), o que totaliza 3 unidades de PSs. Destes quatro pares, cada um dos ramos é inserido individualmente em um modulador de amplitude. Este tipo de modulador é capaz de modular tanto a intensidade quanto a fase do sinal. Quatro moduladores são utilizados para a modulação do sinal óptico, sendo um para representação da amplitude em fase e outro para amplitude em quadratura, este padrão se repete tanto para o estado de polarização na direção horizontal (em X ) quanto para o estado de polarização vertical (em Y ). Os defasadores de 90° são integrados na sáıda de apenas um modulador de cada par, com a finalidade de associar os śımbolos no eixo de quadratura. Após a defasagem, as componentes em fase e em quadratura são combinadas por meio de um PS. Ambos os sinais modulados em quadratura apresentam um estado de polarização TE. Estes sinais são então processados por um divisor e rotor de polarização (Polarization Splitter and Rotator, PSR). O PSR primeiramente rotaciona o estado de polarização de um dos sinais, de forma a manter o primeiro em TE fundamental 33 e convertendo o segundo para TM fundamental. O PSR então combina os feixes de ambas polarizações para gerar o sinal multiplexado em polarização para ser transmitido. Na seção de receptor ilustrado na Figura 2, as duas polarizações da onda incidente são demultiplexadas, e posteriormente a TM é convertida a TE através de um PSR. O crossing é um dispositivo comum em roteamento de sinais ópticos, pois este permite o cruzamento de dois guias de ondas evitando interferências. Um crossing é utilizado para rotear os sinais para as entradas das portas h́ıbridas de 90º. A porta h́ıbrida de 90°, por sua vez, mistura o sinal de entrada com o sinal do oscilador local em quatro componentes. Destas componentes, duas são relacionadas ao eixo em fase, defasadas em π, e as outras duas relacionadas ao eixo em quadratura, também com um defasamento de π entre estas (GUAN et al., 2017). A porta h́ıbrida resulta em quatro sinais de luz que serão inseridos em dois pares de fotodiodos. Após a fotodetecção, os amplificadores diferenciais são responsáveis por combinar as amplitudes de valores positivos e negativos (defasadas em 180°), tanto para os eixos em fase quanto em quadratura. O banco de amplificadores de transimpedância (Transimpedance Amplifiers, TIAs) possibilita a conversão de corrente elétrica para tensão elétrica enquanto amplifica o sinal. O sinal elétrico é amostrado por um conversor analógico para digital (Analog to Digital Converter, ADC) antes de ser processado pelo bloco de DSP do receptor. Efeitos lineares e não lineares, que apresentam impedimentos na detecção do sinal, são compensados pelo bloco de DSP. Este último bloco também recupera a informação transmitida. Como é percept́ıvel pela Figura 2, um transceptor óptico coerente é composto de diversos dispositivos. O funcionamento conjunto destes dispositivos irá definir as carac- teŕısticas do transceptor, como o tamanho, desempenho e consumo de energia. Um dos grupos de fabricantes que desenvolve estas especificações é a OIF (Optical Internetworking Forum) (OIF, 2021). Estas especificações incluem requisitos elétricos e eletro-ópticos, requi- sitos mecânicos e caracteŕısticas operacionais do transceptor e dos dispositivos individuais que o compõe. O projeto de moduladores, dispositivo fundamental para transceptores, ainda apresenta alguns desafios, principalmente se tratando de usa integração na plata- forma de siĺıcio, a qual está sujeita a certas limitações. Na Seção 1.2 discutiremos algumas das principais arquiteturas e plataformas de moduladores ópticos integrados. 34 1.2 Moduladores Ópticos Integrados Como mencionado, moduladores eletro-ópticos são responsáveis pelo mapeamento da informação contida na onda de micro-ondas para a onda de luz. O método pioneiro e mais simples de modulação da onda óptica é denominado modulação direta. Desta maneira, a fonte de luz é simplesmente ligada (maior ńıvel de intensidade) e desligada (menor ńıvel de intensidade), o que limita a quantidade de bits para apenas dois por cada śımbolo transmitido. A configuração de modulação direta é, simultaneamente, mais compacta e menos custosa. Entretanto, além das limitações em relação à baixa eficiência espectral obtida, IM-DD introduz gorjeio (chirp) no sinal, o que ocasiona distorções durante a Figura 2 – Representação do transceptor integrado coerente por diagrama de blocos. No bloco superior temos a seção do transmissor e no bloco inferior temos a seção de recepção. 35 transmissão pela fibra (AGRAWAL, 2014). Em sistemas de alto desempenho é necessária a implementação de modulação externa, assim como ilustrada na Figura 2. Além do mais, por modulação externa, somos capazes de anular o gorjeio ou até mesmo ajustar o seu valor para a reversão de algumas distorções como a dispersão cromática (FIGUEIREDO; SOUZA; CHIUCHIARELLI, 2017). Atualmente os principais desafios na modulação óptica, especialmente na plataforma de siĺıcio, se encontram no desenvolvimento de moduladores que apresentam baixo gorjeio, alta eficiência de modulação, larga banda eletro-óptica (Electro-Optic Bandwidth, BWEO) e baixas perdas (RAHIM et al., 2021). Em siĺıcio, a modulação (externa) é realizada por meio de mudanças no ı́ndice de refração complexo (n) do material, tal qual é dado pela seguinte equação: n = n+ j · κ, (1) em que n é a componente real do ı́ndice de refração e κ é o coeficiente de absorção. A atenuação α pode ser obtida a partir do coeficiente de absorção, e esta relação é dada por: α = 4πκ λ , (2) em que λ é o comprimento de onda de operação no meio. Uma forma de realizar variações do ı́ndice de refração é a partir do efeito termo- óptico, que modula o ı́ndice de refração por meio de variações na temperatura do material. A diferença de temperatura é induzida por aquecedores térmicos controlados, geralmente por uma corrente externa aplicada. Entretanto, principalmente na plataforma de siĺıcio, este efeito apresenta uma dinâmica lenta, o que limita a utilização de tal efeito apenas para chaveamentos, comutações e também para sintonização de moduladores (COCORULLO; RENDINA, 1992). No caso de moduladores em siĺıcio de alto desempenho a variação do ı́ndice de refração é resultante da aplicação de um campo elétrico externo (efeito eletro-óptico). Mudanças na componente real de n resulta em mudanças na velocidade de propagação da onda óptica (eletro-refração), assim como mudanças na componente imaginária de n resulta em mudanças na absorção do material (eletro-absorção) (REED et al., 2010). Alguns dos efeitos eletro-ópticos mais comumente explorados são os efeito Pockels, efeito Kerr e os efeito de eletro-absorção Franz-Keldysh e o Efeito Stark de confinamento quântico (Quantum-Confined Stark Effect, QCSE) (REED et al., 2010). O efeito Poc- 36 kels ocasiona uma variação no ı́ndice de refração de forma linearmente proporcional ao módulo do campo elétrico externo aplicado (AGRAWAL, 2014). Entretanto, em um cristal centrossimétrico como o siĺıcio, o efeito Pockels apresenta uma eficiência relativamente baixa (REED et al., 2010). Há algumas técnicas de dopagem que quebram a simetria do siĺıcio com a introdução de materiais como titanato de bário (OLIVARES et al., 2019) ou nitrato de siĺıcio (CHMIELAK et al., 2011), o que permite um maior aproveitamento do efeito Pockels. Entretanto, tais técnicas aumentam significativamente a complexidade de fabricação, impedindo a integração com o processo CMOS. O efeito Kerr, por sua vez, é similar ao efeito Pockels, porém a variação do ı́ndice de refração é proporcional ao quadrado do módulo do campo elétrico aplicado (efeito não linear) (AGRAWAL, 2014). No siĺıcio, o efeito Kerr pode ser excitado, porém não de forma intensa o suficiente para sua aplicação em moduladores de alta velocidade (SOREF; BENNETT, 1987). Por outro lado, o efeito de Franz-Keldysh é resultante de uma perturbação nas bandas de energia causada pela aplicação de um campo elétrico externo no meio. Tal perturbação resulta em um tune- lamento quântico entre as bandas de valência e de condução (SOREF; BENNETT, 1987). Apesar deste efeito, em siĺıcio, apresentar tanto eletro-absorção quanto eletro-refração, a variação de ı́ndice de refração e de absorção não é intensa o suficiente para a obtenção de ı́ndices de modulação satisfatórias. Para fins de comparação, em (SOREF; BENNETT, 1987) mediu-se experimentalmente as variações de ı́ndice de refração sob efeito de um campo elétrico externo com amplitude de 1 · 105 V/cm. Com o efeito Kerr, obteve-se uma variação de ı́ndice de ‖∆n‖ = 1 · 10−6 em um comprimento de onda de λ = 1, 3 µm. Com o efeito Franz-Keldysh, obteve-se um ‖∆n‖ = 1, 3 · 10−6 em um comprimento de onda de λ = 1, 07 µm (ponto em que ocorre o máximo de variação de ı́ndice de refração). Quando se trata de siĺıcio, o método mais eficiente para variação do ı́ndice de refração é a partir da utilização do efeito de dispersão de plasma (Plasma Dispersion Effect, PDE). O PDE se baseia no fato de que o ı́ndice de refração de um material depende da densidade de portadores livres no mesmo. Desta forma, pode-se variar o ı́ndice de refração ao injetar ou ao extrair portadores do material. Tais variações de portadores também causam uma variação na absorção por portadores livres (Free Carriers Absorption, FCA) (SOREF; BENNETT, 1987). Ambos os efeitos PDE e FCA, podem ser quantificados aproximadamente pelo modelo de Drude (TAKENAKA; TAKAGI, 2012). Este modelo nos diz que a variação de ı́ndice de refração e de absorção não dependem apenas da quantidade de portadores livres, mas são também dependentes da variação da frequência de plasma no 37 meio. A variação do ı́ndice de refração é inversamente proporcional às massas efetivas de condução dos elétrons e das lacunas. A variação da absorção, além de ser dependente do inverso das massas efetivas de condução dos elétrons e das lacunas, também é inversamente proporcional às mobilidades de elétrons e de lacunas. No presente trabalho, utilizaremos o modelo emṕırico de Soref e Bennett (SOREF; BENNETT, 1987) para modelar o PDE, e mais detalhes sobre este serão discutidos na Subseção 2.3.2. Enquanto os efeitos Pockels e Kerr produzem variações de ı́ndice de refração na ordem de 1 · 10−6, com o PDE é posśıvel obtermos um ‖∆n‖ = 1, 5 · 10−3 com uma injeção ou depleção de portadores de 1018 portadores/cm3 (SOREF; BENNETT, 1987). Este fato mostra o motivo do PDE ser o método mais utilizado para moduladores de alto desempenho em siĺıcio, e isto justifica sua utilização no desenvolvimento do modulador no presente trabalho. Podemos prever o funcionamento do modulador a partir de alguns parâmetros de desempenho do mesmo, os quais serão discutidos, em sua maioria, no Caṕıtulo 2. Em relação à presente seção, limitaremos-nos em definir apenas três das mais importantes, sendo elas a BWEO, a tensão de meia-onda (Vπ) e as perdas de inserção (Insertion Loss, IL). Definimos a BWEO como sendo o valor de frequência em que o espectro de transmissão do modulador, do ponto de vista da resposta óptica resultante de uma entrada elétrica, decai pela metade (-3 dB), considerando uma análise de pequenos sinais. A Vπ é definida como a tensão necessária que se deve aplicar no modulador para causar uma mudança de fase de 180° (π) na portadora óptica. A IL contabiliza a atenuação óptica causada pela inserção do dispositivo no sistema fotônico, levando em consideração absorção, reflexão, espalhamento, entre outras (FENG et al., 2012). O equacionamento destes parâmetros, assim como uma explicação mais aprofundada, será discutido no Caṕıtulo 2. Diversas estruturas têm sido propostas e analisadas para a modulação do sinal óptico, tais quais baseadas nos efeitos de eletro-absorção e eletro-refração descritos acima. Podemos classificar os tipos mais comuns de moduladores de acordo com seu funcionamento, sendo estes baseados em eletro-absorção, em ressonância e em interferometria. Nos próximos parágrafos será realizada uma discussão a respeito das diferenças mais relevantes entre estes dispositivos. É válido ressaltar que as caracteŕısticas destacadas se referem a moduladores fabricados na plataforma de siĺıcio, pois estes que serão tratados no presente trabalho. Moduladores baseados em eletro-absorção são, como o próprio nome alega, modula- dores de intensidade que operam ao variar a absorção do meio propagante. Dois dos efeitos 38 mais utilizados em moduladores de eletro-absorção são o efeito de Franz-Keldysh e QCSE.O QCSE apresenta uma variação mais abrupta na absorção em relação ao Franz-Keldysh, o que significa uma maior eficiência de modulação (MILLER, 2009). Entretanto, além de ser necessária a integração de um segundo material em conjunto com o siĺıcio para excitação do QCSE, ainda a fabricação de moduladores baseados neste efeito é demasiadamente complexa. Moduladores de eletro-absorção são capazes de atingir altos valores de BWEO e de eficiência de modulação, porém possuem a desvantagem de causar alta IL e introduzir gorjeio significativo no sinal. Um estudo dimensionou e fabricou um modulador baseado em eletro-absorção formado por siĺıcio integrado com germânio em heteroestrutura, assim como ilustrado na Figura 3(a). Tal modulador utiliza o efeito de Franz-Keldysh como base para sua operação. Os resultados obtidos foram de 56 GHz de BWEO, 4 V de Vπ 1 e 10, 6 dB de perdas (MASTRONARDI et al., 2018). Apesar de apresentarem uma larga BWEO e alta eficiência de modulação, verifica-se que este tipo de moduladores introduz altas perdas ópticas. Além do mais, tal estrutura não permite a modulação de fase do sinal, apenas da intensidade, e sua dificuldade de fabricação na plataforma de siĺıcio limita sua integração. Moduladores baseados em ressonância geralmente são constrúıdos a partir de miro- anéis ressonantes, como ilustrado na Figura 3(b). Micro-anéis são estruturas fechadas, geralmente circulares, que são dispostas ao lado do guia de onda. Devido à proximidade 1 Neste caso, a Vπ refere-se à tensão necessária para excursionarmos entre o mı́nimo e o máximo de intensidade do sinal modulado. Figura 3 – Diagrama esquemático ilustrando moduladores integrados baseados na pla- taforma de siĺıcio. (a) Modulador de eletro-absorção. (b) Moduladores de micro-anel. (c) Moduladores de Michelson. (d) Moduladores de Mach-Zehnder. 39 com o guia, ocorre acoplamento da luz para a estrutura em anel, tal qual é capaz de confinar luz, dado que as condições de ressonância sejam obedecidas. De forma geral, dentro das condições de ressonância, toda a energia óptica, idealmente, é confinada dentro do anel, devido a interferências construtivas de sucessivas voltas dadas pela luz. Fora das condições de ressonância, a luz dentro do anel sofre interferência destrutiva a cada volta dada, fazendo com que a luz não seja armazenada na estrutura. Como resultado disto, um ressoador em anel possui alta seletividade em comprimento de onda, funcionando como um filtro óptico de banda estreita (FENG et al., 2012). Operando próximo do comprimento de onda de ressonância, há uma alta sensibilidade à fase da portadora na transmissão do micro-anel. Explorando esse efeito, é posśıvel a fabricação de moduladores eficientes a partir da exploração do efeito de dispersão de plasma no guia que compõe o anel (CHROSTOWSKI; HOCHBERG, 2015). É válido observar que, apesar do funcionamento destes dispositivos ser também baseado em interferência, por conveniência, os classificamos como moduladores ressonantes, pois estes são compostos de cavidades ressonantes. Na fabricação de moduladores de micro-anel utiliza-se uma junção PN, de forma que a região de depleção se sobrepõe ao modo óptico no interior do micro-anel. Alterações na tensão aplicada à junção PN causam variações do ı́ndice de refração, resultando em um deslocamento do espectro de transmissão do modulador (FENG et al., 2012). A Figura 3(b) ilustra o esquemático de um modulador de micro-anel do tipo add-drop, ou seja, há um guia de onda adicional que serve para extrair luz do anel. Em um trabalho recente, em que a otimização da junção PN é realizada, o modulador baseado em micro-anel foi capaz de obter resultados que apresentam uma BWEO de mais de 67 GHz, porém com uma Vπ estimada superior a 100 V (ZHANG et al., 2020). Um outro estudo obteve uma BWEO de 30 GHz, uma Vπ de apenas 2 V e uma perda de inserção de 7 dB (XUAN et al., 2014). As maiores vantagens dos moduladores baseados em micro-anel ressonantes em relação aos moduladores de Mach-Zehnder são: o tamanho compacto, menor consumo de energia e, geralmente, uma melhor eficiência de modulação. Entretanto, os moduladores em micro-anel possuem algumas caracteŕısticas negativas que evitam a sua adoção ao considerar aplicações em sistemas de baixo custo e alto desempenho, sendo estas uma maior complexidade de fabricação, um compromisso entre BWEO e eficiência de modulação geralmente menor, uma alta sensibilidade térmica e uma introdução significativa de gorjeio no sinal (FENG et al., 2012; CHROSTOWSKI; HOCHBERG, 2015). 40 Para entendimento dos moduladores baseados em interferometria, devemos pri- meiramente introduzir o dispositivo passivo que serve como base para o design de tais moduladores. Um interferômetro de Mach-Zehnder (Mach-Zehnder Interferometer, MZI) consiste de um dispositivo que faz proveito do fenômeno de interferência entre ondas eletromagnéticas. Primeiramente, a onda provinda de um guia tem sua potência dividida entre dois ramos, os quais são denominados braços do MZI. A divisão de potência pode ser realizada por qualquer PS, como um acoplador direcional, Y-branch ou um interferômetro multi-modo (Multimode Interferometer, MMI). Após a propagação pelo dispositivo, as ondas provindas de ambos os braços são recombinadas (CHROSTOWSKI; HOCHBERG, 2015). Considerando uma condição ideal, em que o PS tem uma razão de divisão perfeita- mente balanceada e em que não há perdas na propagação através do MZI, a intensidade da onda de sáıda será dependente apenas do desfasamento causado nos braços. Quando ambas ondas estão em fase, haverá interferência construtiva e a potência de sáıda será a mesma da entrada. Quando há uma defasagem de π entre as ondas, haverá interferência destrutiva, o que anulará a onda de luz. Moduladores de Michelson são estruturas que têm sua operação baseada no efeito de interferência do MZI. A particularidade destes se dá no fato de que a modulação é explorada com o dobro de eficiência para um dado comprimento. Isto ocorre pois um espelho é posicionado na extremidade de cada braço. Como ilustrado na Figura 3(c), o feixe de luz introduzido no dispositivo é ramificado em dois braços e então recombinados. A variação de fase realizada em ambos os braços será convertida em modulação de amplitude como consequência do efeito de interferência. Após a propagação pelos braços, o sinal é então recombinado e extráıdo do dispositivo. O comprimento de cada braço modulante pode ser reduzido pela metade, em relação ao MZM, enquanto a eficiência é mantida a mesma, apresentando então um tamanho mais compacto. Apesar desta qualidade ser conveniente para o nosso objetivo, moduladores de Michelson, em geral, possuem maiores perdas ópticas e menores bandas eletro-ópticas comparados com MZMs. Podemos citar o desempenho obtido por alguns trabalhos. Em (PATEL et al., 2014), a Vπ atingida foi de 4 V, porém a banda de 23,5 GHz e as perdas de 8,8 dB não são capazes de atender certas demandas. Em outro trabalho, em que se obteve uma eficiência de modulação ainda superior, foi obtido uma Vπ de 3 V, porém apenas 12 GHz de banda foram mensurados, contabilizando com uma perda de 8 dB (Li et al., 2013). 41 Um modulador de Mach-Zehnder (Mach-Zehnder Modulator, MZM), ilustrado pela Figura 3(d), opera a partir da variação do ı́ndice de refração de um ou de ambos os braços do MZI. A possibilidade de modificar a velocidade da luz nos braços do MZM nos permite manipular a condição de interferência, ou seja, MZM converte modulações de fase em modulações de amplitude. Os maiores inconvenientes apresentados por MZMs é que estes são menos compactos em relação aos outros tipos de moduladores, e estes também possuem um elevado consumo de energia. Porém, a utilização de MZMs no presente trabalho é justificada por algumas caracteŕısticas relevantes que estes apresentam. Uma das maiores vantagens ao utilizar MZMs é a larga BWEO que este é capaz de alcançar. Além disso, MZMs são de relativamente simples fabricação, e também apresentam uma alta tolerância às eventuais variações de temperatura, dispensando a utilização de reguladores térmicos. O Caṕıtulo 2 é dedicado a discutir, detalhadamente, a respeito de MZMs fabricados na plataforma de siĺıcio. Uma grande vantagem de moduladores baseados em interferometria é que estes nos permite modular tanto a amplitude quanto a fase do sinal, propriedade importante para implementação de formatos de modulação multi-ńıveis de amplitude e de fase, como o QAM. Os moduladores que integram o transceptor com diversidade em fase e em polarização representado na Figura 2 devem ser capazes de modular a fase do sinal simultaneamente com sua amplitude. Na Seção 2.2 mostramos como um MZM é capaz de agir como um modulador tanto de amplitude como de fase. A Figura 4 ilustra o diagrama de um MZM de estrutura IQ. Podemos interpretar tal estrutura como sendo um MZM composto de mais dois MZMs internos, sendo estes dispostos um em cada braço do MZM externo. Como exemplo de seu funcionamento, o formato de modulação 4-QAM ilustrado na Figura 1(d) pode ser facilmente gerado pela estrutura IQ. Primeiramente, definimos a resposta de cada modulador como sendo de −1 e 1. E então, considerando um deslocamento de fase de π no braço inferior da Figura 4, temos que as quatro posśıveis combinações na sáıda do MZM composto formam um diagrama de constelação com os valores ±(1± j)/ √ 2. O mesmo conceito pode se estender para os formatos de modulação mais complexos, como os da Figura 1(e-f), ao considerar mais ńıveis de amplitude em cada modulador interno. Ao se tratar do desenvolvimento de moduladores eletro-ópticos de alto desempenho, em espećıfico o MZM, é válido também destacarmos os atributos negativos e positivos apresentados por cada plataforma. MZMs desenvolvidos nas plataformas de LiNbO3 e InP 42 MZM-I MZM-Q p n p n p n p n π/2 OUTIN Figura 4 – Estrutura de um MZM-IQ. possuem algumas figuras de mérito superiores que os constrúıdos em siĺıcio. Comercialmente, MZMs baseados em LiNbO3 e InP apresentam uma Vπ entre 1,5 V e 4 V, IL entre 3 dB e 5 dB e BWEO superiores a 35 GHz (JACQUES et al., 2018). MZMs comerciais constrúıdos na plataforma de siĺıcio apresentam uma Vπ de 5 V a 6 V, IL superiores a 6 dB e larguras de banda entre 30 GHz e 35 GHz (JACQUES et al., 2018). Alguns dos atributos positivos ao fabricar moduladores na plataforma de siĺıcio, além do processo de fabricação ser mais amadurecido, é o fato deste possuir uma menor sensibilidade a variações térmicas em relação à plataforma de InP, e de também oferecer dispositivos mais compactos em geral (WENG; LIN; WU, 2021). Uma desvantagem de moduladores em siĺıcio e também em InP em relação a moduladores baseados em LiNbO3 é o comportamento não linear da variação do ı́ndice de refração em relação à variação de tensão aplicada no material. Tal não linearidade acrescenta gorjeio no sinal, o que limita a faixa de operação do modulador. Esta não linearidade pode ser parcialmente compensada por algoritmos de DSP (GUTIERREZ et al., 2013). Por outro lado, no caso de LiNbO3, drivers de alta potência são requeridos (WANG et al., 2018). Uma outra plataforma que já foi também explorada para fabricação de moduladores integrados é a baseada em GaAs (GRIFFIN et al., 2003; STAMPOULIDIS et al., 2013), atingindo uma banda de 22,5 GHz e uma Vπ de 3V em alguns experimentos (STAMPOULIDIS et al., 2013). O ponto que apresenta maior justifica da escolha do SOI como plataforma para construção do MZM é sua compatibilidade com o processo de manufatura CMOS. A Tabela 1.2 compila diversos trabalhos que foram realizados entre 2008 e 2021 com o intuito de otimizar MZMs na plataforma de siĺıcio. Em outras palavras, tais trabalhos representam o estado da arte em MZMs alcançados em sequência cronológica de ano de publicação. Os trabalhos citados, em sua maioria, otimizaram parâmetros f́ısicos de forma a superar eventuais limitações. Os parâmetros a serem comparados na Tabela 1.2 são a BWEO, a Vπ e a IL. Percebe-se que a BWEO apresenta grandes melhorias conforme a data de publicação é mais recente. Como o siĺıcio é uma plataforma com efeitos eletro-ópticos 43 limitados, o maior desafio é manter uma Vπ baixa enquanto se estende a banda. Também podemos observar que há um compromisso entre a banda e a Vπ. Ao variarmos alguns parâmetros de forma a ampliarmos a BWEO do MZM, podemos observar também um aumento na Vπ. Como podemos perceber, o trabalho (LIU et al., 2008), por exemplo, apresenta uma banda relativamente alta para época em que foi publicado, porém possui uma Vπ proibitivamente alta na prática. Como indicado na Tabela 1.2, o MZM apresentado em (JACQUES et al., 2020b) foi desenvolvido para operar na banda O, enquanto que os demais operam na banda C. Em nosso trabalho, demos preferência para operação na banda C, pois esta é a mais utilizada em telecomunicações hoje em dia, apresentando a menor perda de propagação em fibras entre as diferentes bandas (TAMURA et al., 2017). Na Tabela 1.2, o termo Lps se refere ao comprimento f́ısico do MZM. Tabela 1 – Comparativo entre MZMs em siĺıcio reportados em diversos trabalhos, em ordem cronológica de publicação. A tabela inclui a BWEO, a Vπ, a IL, figura de mérito definida e a modulação utilizada. Referência BWEO [GHz] Vπ [V] IL [dB] Modulação (LIU et al., 2008) 20 13,33 6,4 OOK (PARK et al., 2009) 7 12 6,6 OOK (WATTS et al., 2010) 8 5 3,6 OOK (CHEN; PETERS; BOWERS, 2011) 27 4,8 3 OOK (BAEHR-JONES et al., 2012) 10 6 8,7 OOK (STRESHINSKY et al., 2013) 18,5 1,5 5,5 OOK (XU et al., 2014) 35 5,3 3,3 OOK (PATEL et al., 2015) 41 11 3,8 PAM-4 (ZHOU et al., 2016) 33 4,95 9,5 BPSK (PANTOUVAKI et al., 2017) 27 2,5 2,2 OOK (ZHENG et al., 2018) 30 2,5 2 PAM-4 (SEPEHRIAN et al., 2019) 36 7,3 6,8 16-QAM (SAMANI et al., 2019) 40 7,4 6,3 PAM-4 (JAFARI et al., 2019) 40 1,5 V·cm (Lps = 56 µm) 1 OOK (DENIEL et al., 2019) 18 4 5 PAM-4 (HINAKURA; ARAI; BABA, 2019) 30 5,2 6 OOK (ZHOU et al., 2019) 54 [6 dB] & 37 [3 dB] 7,3 6,3 16/64-QAM (JACQUES et al., 2020b) (Banda O) 47 5,4 5,7 PAM-8 (ZHOU et al., 2020) 50 [6 dB] 6,3 5,6 16/64-QAM (JACQUES et al., 2020a) 45 10 3,4 PAM-8 (ZHANG et al., 2021) 40 ≈14 (2,1 V ·cm, Lps = 1,5 mm) 6,125 SSB PAM-4 (MOSHAEV; LEIBIN; MALKA, 2021) 34,11 1,63 1,45 PAM-4 (JAFARI; SHI; LAROCHELLE, 2021) 17,6 2,33 17 OOK 1.3 Justificativa Como citado anteriormente, a plataforma de siĺıcio apresenta a maior integrabilidade de MZMs em sistemas fotônicos práticos. Entretanto, como podemos perceber pelos trabalhos atuais, o desempenho dos moduladores nesta plataforma estão atingindo um platô. Por um lado, MZMs possuem diversos parâmetros geométricos e de operação que 44 influenciam no desempenho final do dispositivo, o que dificulta a otimização conjunta de todos estes fatores. Por outro lado, simulações eletromagnéticas possuem uma complexidade computacional elevada, o que dificulta ainda mais o design do modulador. E além disso, o compromisso entre eficiência de modulação, BWEO e IL impõe um desafio adicional na otimização. Algoritmos heuŕısticos são eficientes na busca de uma solução para o problema de otimização de design de dispositivos como o MZM. Porém, levando em conta que estes ainda requerem uma alta quantidade de iterações e que modelos de simulação eletromagnéticas apresentam um alto custo computacional, a otimização de diversos parâmetros pode ser dif́ıcil. Após uma pesquisa bibliográfica, não encontramos nenhum trabalho que otimizou um MZM na plataforma de SOI utilizando algoritmos heuŕısticos. No melhor do nosso conhecimento, esta é a primeira vez que se otimiza um MZM utilizando ANNs. 1.4 Contribuições do Trabalho Neste trabalho apresentamos um método de otimização de um MZM integrado em fotônica de siĺıcio. Este método é baseado em redes neurais e otimização heuŕıstica, e tem como finalidade encontrar o limite posśıvel de desempenho destes dispositivos. Primeiramente, desenvolvemos uma rede neural artificial (Artificial Neural Network, ANN) profunda de forma a modelar o mapeamento realizado pelo simulador eletromagnético. Consideramos oito parâmetros de design, sendo seis destes relacionados às dimensões transversais da junção PN, um deles é o comprimento do modulador e o último é a tensão de polarização aplicada. Já em relação aos parâmetros de desempenho, consideramos a BWEO, a IL e a Vπ. O modelo treinado nos permitirá inferir as métricas de desempenho do modulador a partir dos parâmetros de design muito mais rapidamente que o modelo de simulação. Em outras palavras, idealmente, a ANN tem a mesma função que o simulador eletromagnético, porém com a possibilidade de obtenção de resultados com um intervalo de tempo reduzido em diversas ordens de magnitude. O único custo adicional é o da obtenção do conjunto de dados de treinamento, entretanto este representa um custo de uma única vez. A otimização, que foi realizada a partir de um algoritmo heuŕıstico, utiliza a ANN como forma de avaliar os MZMs candidatos. O algoritmo heuŕıstico a ser utilizado aqui é a evolução diferencial (Diferential Evolution, DE). Com esta configuração foi posśıvel 45 obter MZMs de alto desempenho, e também nos permitiu analisar o compromisso entre os diferentes parâmetros de desempenho do MZM. Moduladores com BWEO maior do que 40 GHz foram obtidos pela otimização por DE, enquanto estes apresentaram valores de Vπ inferiores a 6,5 V e valores de IL inferiores a 4 dB, como apresentaremos na Seção 5.2. 1.5 Organização do Documento O restante do documento é organizado da seguinte maneira: no Caṕıtulo 2 discutimos a teoria e modelagem relacionas ao MZM, no Caṕıtulo 3 discutimos os algoritmos de otimização que serão utilizados no trabalho, no Caṕıtulo 4 discutiremos a metodologia desenvolvida, no Caṕıtulo 5 discutiremos os resultados obtidos e, por fim, no Caṕıtulo 6 discutiremos nossas conclusões. 46 2 Fundamentos de Moduladores de Mach-Zehnder No presente caṕıtulo apresentamos os MZMs integrados na plataforma de siĺıcio. Na Seção 2.1 apresentamos o MZI, dispositivo passivo que serve como estrutura base para implementação de MZMs. Na Seção 2.2 discutimos sobre os MZMs, assim como suas configurações de alimentação e figuras de mérito. A Seção 2.3 aborda o método de deslocamento de fase geralmente utilizado em MZMs na plataforma de SOI. Por fim, na Seção 2.4, iremos apresentar como é realizada a alimentação da onda de RF no modulador. 2.1 Interferômetros de Mach-Zehnder Para a interferometria ser realizada em um MZI, primeiramente um feixe de luz é dividido entre dois guias de ondas. Estes guias de onda são denominados braços do MZI. As ondas propagadas através destes são recombinadas para gerar uma onda de sáıda. O resultado da combinação (interferência) dos feixes tem seu comportamento dependente da diferença de fase das ondas na sáıda dos dois braços, assim como da intensidade das mesmas. A Figura 5 ilustra o esquemático de um MZI. A intensidade da onda de entrada, considerando propagação monomodo, é dada por Iin, e possui um campo elétrico de amplitude Ein, dado que Ein = √ Iin. O braço superior e inferior terão, considerando um divisor de potência de 3 dB ideal (divide a potência uniformemente e sem perdas), uma amplitude de Ein1 = Ein2 = Ein/ √ 2 como entrada (CHROSTOWSKI; HOCHBERG, 2015). Na sáıda dos guias de onda, temos os campos com amplitudes Eout1 e Eout2, que podem ser dadas por: Eouti = Ein√ 2 exp ( −jβiLi − αi 2 Li ) , (3) EIn EOut Divisor de potência Ein1 Ein2 Eout1 Eout2 Combinador de potência Braços do MZI Figura 5 – Esquemático de um interferômetro de Mach-Zehnder. 47 em que i = 1 se refere ao braço superior e i = 2 ao braço inferior, βi = 2πni/λ é a constante de fase, αi é o coeficiente de atenuação, Li o comprimento e ni o indice de refração, considerando o i-ésimo braço do MZI. Definimos a atenuação como α/2 pois a Equação 3 se trata do campo elétrico, e não da intensidade. Na sáıda do MZI um combinador de potência é utilizado. Assumimos também que o combinador é ideal, apresentando uma combinação perfeita e sem perdas ópticas. A amplitude complexa do campo obtido na sáıda deste combinador, assumindo que os campos interferentes apresentam o mesmo estado de polarização, é dada por: Eout = Ein 2 [ exp (−jβ1L1 − α1 2 L1) + exp (−jβ2L2 − α2 2 L2) ] . (4) Esta equação mostra como um MZI afeta tanto a fase quanto a amplitude da luz que se propaga no dispositivo (AGRAWAL, 2014). Para obtermos a intensidade, basta elevarmos a magnitude do campo complexo de sáıda do MZI ao quadrado, o que resulta em: Iout = E2 in 4 | exp (−jβ1L1 − α1 2 L1) + exp (−jβ2L2 − α2 2 L2)|2, (5) A partir de manipulações trigonométricas e, desconsiderando as perdas para sim- plificar o resultado, podemos re-escrever a equação que descreve a intensidade de sáıda como: Iout = Iin 2 [1 + cos (β1L1 − β2L2)]. (6) Da Equação 6, a função de transferência pode ser simplesmente descrita por: Tm = Iout Iin = 1 2 [1 + cos (β1L1 − β2L2)] = 1 2 [1 + cos (φ1 − φ2)], (7) em que φ1(φ2) é a fase acumulada pelo braço 1(2). A Equação 7 nos mostra que a função de transferência do MZI depende do comprimento elétrico dos braços que, por sua vez, dependem do comprimento f́ısico, do comprimento de onda e do ı́ndice de refração. A Figura 6 ilustra a sáıda do MZI em relação à entrada, tanto para amplitude quanto para intensidade, desconsiderando perdas e em escala linear. Ao considerarmos apenas o desfasamento entre os braços como dado na Equação 7, em que ∆φ = |φ1 − φ2|, podemos analisar o efeito de interferometria de forma mais simplificada. Percebemos que quando não há desfasamento ou quando este é múltiplo de 2π, as ondas provenientes de 48 ambos os braços se combinam de forma construtiva, gerando uma intensidade igual a da onda de entrada do MZI, denominados pontos de pico. Porém, quando o desfasamento é múltiplo ı́mpar de π, há uma interferência destrutiva, tal que as ondas se anulam, denomina-se estes como pontos de nulo. Tem-se ainda as defasagens que são múltiplas ı́mpares de π/2, indicando que a intensidade de sáıda do MZI será equivalente à metade da intensidade máxima posśıvel, denominados pontos de quadratura. Podemos perceber também como a amplitude normalizada do campo elétrico complexo de sáıda contém informação sobre a fase, nos permitindo explorar valores tanto positivos quanto negativos. A Figura 6 ilustra também a defasagem do campo elétrico complexo de sáıda. Como podemos observar, há uma defasagem de π radianos no campo elétrico complexo de sáıda, quando a diferença de fase entre os braços é múltiplo ı́mpar de π. Figura 6 – Sáıda normalizada em relação à entrada, tanto para a intensidade quanto para a amplitude complexa do campo elétrico, e defasagem do campo elétrico complexo de sáıda em termos da diferença de fase. A Figura 7(a) ilustra a função de transferência, em decibéis, de um MZI desba- lanceado, ou seja, com diferentes comprimentos f́ısicos entre os braços (GARDES et al., 2008). Um dos braços considerados possui um comprimento de 500 µm, enquanto o outro possui um comprimento de 600 µm. Consideramos os braços do MZI como sendo guias de onda do tipo strip propagando o modo fundamental TE. Os valores do ı́ndice efetivo em relação aos comprimentos de onda foram calculados utilizando o software Lumerical Mode. No caso em que os comprimentos f́ısicos sejam iguais, esta configuração é denominada MZI balanceado. Por outro lado, quando os comprimentos ópticos são iguais, podemos 49 classificar o MZI como sendo simétrico, enquanto o termo assimétrico se refere àqueles MZIs com comprimentos ópticos distintos entre os braços. Tal assimetria pode ser gerada por um desbalanço nos comprimentos, mas também por um ı́ndice de refração diferente para cado braço. Quando adicionamos um certo desbalanceamento no MZI, haverá um grau de diferença na fase óptica dependente do comprimento de onda, o que ocasionará uma função de transferência aproximadamente periódica no domı́nio da frequência. Entretanto, nos cálculos da função de transferência mostrada na Equação 7, consideramos o ı́ndice efetivo do modo, tal qual é dependente do comprimento de onda em um meio dispersivo (tal como o siĺıcio). Esta dependência mostra que a função não é estritamente periódica quando consideramos a dispersão cromática do modo propagante. Para uma faixa de comprimento de ondas suficientemente estreito, porém, podemos considerar o comportamento como periódico. Neste caso, o peŕıodo na função de transferência é denominado faixa espectral livre (Free Spectral Range, FSR) (AGRAWAL, 2014), e é dado por: FSR[m] = λ2 ng∆Lps , (8) em termos do comprimento de onda, ou podemos escrever como: FSR[Hz] = c ng∆Lps , (9) em termos da frequência, em que ng é o ı́ndice de grupo. Na prática utilizamos os ı́ndices efetivos, ou seja, o ı́ndice de refração que é percebido pelo modo de propagação. A variável ng é o ı́ndice de grupo, e esta é dada a partir do ı́ndice de refração efetivo neff por: ng = neff (λ)− λdneff dλ . (10) Podemos perceber pela Equação 8 que o FSR não é periódico, pois este depende do quadrado do comprimento de onda e do ı́ndice de grupo. O ı́ndice de grupo, por sua vez, também é dependente do comprimento de onda, entretanto este é constante para meios não dispersivos. No caso do FSR em relação à frequência, como dado pela Equação 9, temos um padrão periódico em meios não dispersivos. A Figura 7(b) ilustra o FSR, calculado a partir da Equação 8, para o caso do MZI considerado na Figura 7(a). O ı́ndice de grupo foi obtido também utilizando o software Lumerical Mode. Pela Figura 7(b), fica clara a dependência do FSR em relação 50 ao comprimento de onda. Na próxima seção iremos discutir os MZMs, tais quais são dispositivos ativos e apresentam seu funcionamento baseado no MZI. Figura 7 – (a) Função transferência de um MZI em relação ao comprimento de onda. Os braços possuem um desbalanço de 100 µm em relação ao comprimento f́ısico destes. (b) FSR, em relação ao comprimento de onda, do MZI considerado. 2.2 Moduladores de Mach-Zehnder Como mencionado na Seção 1.2, um MZM é baseado no MZI e opera a partir do efeito de interferometria. Entretanto, para podermos manipular a amplitude ou a fase do sinal de sáıda, é necessário variar a diferença da fase acumulada entre os braços. Na Seção 1.2 apresentamos os efeitos que podem ser explorados para esta variação, e conclúımos que o PDE é o efeito mais eficiente na plataforma de SOI. A variação de cargas do PDE é realizada através de uma junção PN, como pode ser visualizado na 51 Subfigura 3(c). Maiores detalhes sobre a implementação destes deslocadores de fase serão dados na Seção 2.3. Na presente seção iremos tratar do funcionamento de MZMs de maneira geral. Variando o ı́ndice de refração de um ou de ambos os braços do MZI, por meio do PDE, podemos controlar o comprimento óptico e, consequentemente, a relação de fase entre as duas ondas interferentes. Este controle do ı́ndice de refração de cada braço nos permite sintonizar as caracteŕısticas de amplitude e de fase da onda de sáıda. Considerando a estrutura de MZM representada pela Figura 3(c), podemos definir a fase acumulada em um braço modulado em função da Vπ (AGRAWAL, 2014): φj = π vj(t) Vπ , (11) em que vj(t) é a tensão aplicada no j-ésimo braço. Tomando a Equação 4 e desconsiderando novamente as perdas de propagação, por simplicidade do resultado, e após algumas manipulações trigonométricas, podemos calcular a transmitância de campo complexo, T (f) m , como: T (f) m = Eout Ein = cos [ 1 2 (φ1 − φ2) ] exp ( j φ1 + φ2 2 ) . (12) O primeiro termo da Equação 12 corresponde à modulação de amplitude, enquanto o segundo termo corresponde à modulação de fase. Podemos observar que é posśıvel operar o MZM como um modulador puramente de amplitude. Podemos realizar esta configuração implementando uma tensão v2(t) = −v1(t), de forma que o segundo termo da Equação 12 é anulado e se tem o controle apenas da amplitude. Por outro lado, se considerarmos o caso em que v2(t) = −v1(t) + Vbias, como no modo de operação Series Push-Pull (SPP) (HENI et al., 2015), a partir da Equação 11 temos que a soma entre as fases acumuladas será de: φ1 + φ2 = π Vbias Vπ , (13) tal qual é dada por uma constante, nos permitindo controlar apenas o primeiro termo da Equação 12. Considerando este caso, a função de transferência terá a seguinte forma: Tm (v1(t)) = cos2 ( π 2Vπ [2v1(t)− Vbias] ) . (14) 52 O termo de tensão constante Vbias tem a função de ajustar o ponto de operação do modulador. Enquanto que a tensão aplicada v1(t) poderá realizar uma excursão em torno do ponto de operação definido por Vbias. De forma análoga, podemos aplicar a relação de tensões dada por: v2(t) = v1(t). Quando a tensão aplicada em ambos braços é equivalente, podemos provar que uma modulação puramente de fase ocorre. Neste caso, temos que a Equação 12 se resume a: T (f) m (v1(t)) = exp ( jπ v1(t) Vπ ) . (15) Até então, na presente seção, definimos como a tensão aplicada em cada braço do MZM pode modificar tanto a amplitude quanto a fase do sinal. Esta caracteŕıstica é útil para sistemas coerentes devido a possibilidade de modulação bipolar de amplitude, como no formato de modulação PAM (MELIKYAN et al., 2020). Com uma estrutura como a demonstrada na Figura 4, podemos então combinar dois sinais modulados em PAM para gerar formatos mais complexos como QAM. Na seguinte subseção iremos citar algumas configurações de como a tensão pode ser aplicada no MZM. 2.2.1 Configurações de Alimentação Existem variadas configurações de alimentação de tensão nos MZMs. Estas diferem entre si na forma como cada braço é alimentado. A presente subseção apresentará, em uma discussão breve, duas das configurações mais amplamente utilizadas para alimentação dos deslocadores de fase nos braços de um MZM. Estas configurações são denominadas dual drive e series push-pull. Em contrapartida, há também uma configuração de operação menos eficiente quando comparada às configurações citadas acima. Esta última é denominada single drive, e é caracterizada pela alimentação de apenas um dos braços do MZM. A Figura 8 ilustra, de forma simplificada, as três configurações de alimentação de MZMs mencionadas. A Figura 8(a) mostra a configuração single drive de alimentação. Nesta configuração, a