MÉTODOS LINEARES E NÃO-LINEARES DE ANÁLISE DE SÉRIES TEMPORAIS E SUA APLICAÇÃO NO ESTUDO DA VARIABILIDADE DA FREQUÊNCIA CARDÍACA DE JOVENS SAUDÁVEIS Maria Teodora Ferreira Dissertação apresentada ao Instituto de Biociências de Botucatu - IBB/UNESP - para a obtenção do t́ıtulo de Mestre em Biometria. BOTUCATU São Paulo - Brasil Fevereiro - 2010 MÉTODOS LINEARES E NÃO-LINEARES DE ANÁLISE DE SÉRIES TEMPORAIS E SUA APLICAÇÃO NO ESTUDO DA VARIABILIDADE DA FREQUÊNCIA CARDÍACA DE JOVENS SAUDÁVEIS Maria Teodora Ferreira Orientador: Prof. Dr. Marcelo Messias Dissertação apresentada ao Instituto de Biociências de Botucatu - IBB/UNESP - para a obtenção do t́ıtulo de Mestre em Biometria. BOTUCATU São Paulo - Brasil Fevereiro - 2010 Dedicatória À minha famı́lia, em especial a minha mãe Maria de Lourdes Bazzo Fer- reira e ao meu pai Bernardino Ferreira por me proporcionarem a vida; por toda a paciência que tiveram comigo, por entenderem a minha ausência em suas vidas, pelo incentivo aos estudos e por todo tipo de apoio recebido. Aos professores que passaram por minha vida. Aos meus colegas de estudos. Aos meus companheiros do Laboratório Isaac Newton da Faculdade de Ciências e Tecnologia - FCT/UNESP. Finalmente, a todas aquelas pessoas que, desde o primeiro dia que me tornei estudante, acreditaram no meu potencial e no meu amor pelos estudos e direta ou indiretamente me ajudaram a conquistar meus objetivos e a seguir meus sonhos. Agradecimentos A Deus por todos os objetivos que já alcancei em minha vida e por todos que ainda alcançarei; pelos sonhos realizados; por me conceder o dom da sabedoria e por me dar a inteligência necessária para prosseguir meus estudos; por me abençoar e caminhar ao meu lado todos os dias da minha vida. À minha famı́lia, em especial aos meus pais por entenderem a minha ausência em suas vidas. Ao meu orientador Prof. Dr. Marcelo Messias, pela paciência, pela mo- tivação e acima de tudo por acreditar no meu potencial cient́ıfico. Aos professores doutores Luiz Carlos Marques Vanderlei, Carlos Marcelo Pastre e Moacir F. de Godoy, por terem fornecido os dados aqui estudados. Ao Prof. Dr. Luiz Carlos Marques Vanderlei pelas discussões bastante produtivas sobre o sistema card́ıaco e a variabilidade da frequência card́ıaca e pela importante contribuição na análise dos dados. A amiga Andriana S. L. O. Campanharo pelo apoio dado nas discussões e no uso de softwares. Aos professores de graduação e mestrado por todo conhecimento cient́ıfico compartilhado. Aos meus colegas de graduação e de mestrado. A minha professora Suraya Elias Caram e ao meu amigo Celso Francisco pelo apoio financeiro. Ao Instituto de Biociências de Botucatu - IBB/UNESP, pela oportu- nidade dada para prosseguir à meus estudos e por todos os recursos concedidos para a realização desta pesquisa. iv Ao Departamento de Matemática, Estat́ıstica e Computação - DMEC da Faculdade de Ciências e Tecnologia - FCT/UNESP, pelo apoio dado no ano de 2009. À Fundação de Aperfeiçoamento de Pessoal de Ńıvel Superior - CAPES, pela bolsa de estudo fornecida. À banca de qualificação, constitúıda pelos professores Dr. Messias Meneguette Junior e Dr. Paulo Fernando de Arruda Mancera, pelas sugestões, cŕıticas e correções feitas, a qual permitiu o aperfeiçoamento deste trabalho de mestrado. A todos aqueles que me ajudaram direta ou indiretamente, financeira ou psicologicamente, com seu tempo f́ısico ou conhecimento cient́ıfico, com suas cŕıticas ou sugestões, com suas discussões filosóficas ou preces religiosas, para que este trabalho de pesquisa de mestrado fosse realizado e conclúıdo com êxito. Sumário Página LISTA DE FIGURAS vii LISTA DE TABELAS x RESUMO xiii SUMMARY xvi 1 INTRODUÇÃO 1 2 SISTEMAS CAÓTICOS 9 2.1 Comportamento Caótico em Sistemas Dinâmicos . . . . . . . . . . . . . 9 2.2 Atratores Estranhos e Estrutura Fractal . . . . . . . . . . . . . . . . . . 12 3 CASUÍSTICA E METODOLOGIA DE COLETA DE DADOS 16 3.1 Introdução ao Sistema Cardiovascular . . . . . . . . . . . . . . . . . . . . 16 3.2 Análise da Variabilidade da Frequência Card́ıaca (VFC) . . . . . . . . . 20 3.3 População Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.4 Critérios adotados para a análise da VFC . . . . . . . . . . . . . . . . . 23 4 MÉTODOS DE ANÁLISE DE SÉRIES TEMPORAIS EXPERI- MENTAIS 27 4.1 Métodos Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.2 Métodos Não-Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.2.1 Função de Autocorrelação - FA . . . . . . . . . . . . . . . . . . . . . . 29 vi 4.2.2 Gráfico de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.2.3 Detrended Fluctuation Analysis - DFA . . . . . . . . . . . . . . . . . . 33 4.2.4 Reconstrução do Espaço de Fase - REF . . . . . . . . . . . . . . . . . . 36 4.2.5 Plot de Recorrência - PR . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2.6 Dimensão de Correlação - DC . . . . . . . . . . . . . . . . . . . . . . . 48 4.2.7 Expoente de Lyapunov - EL . . . . . . . . . . . . . . . . . . . . . . . . 51 4.2.8 Conjectura de Kaplan-Yorke - Conj. KY . . . . . . . . . . . . . . . . . 57 4.2.9 Entropia Aproximada - ApEn . . . . . . . . . . . . . . . . . . . . . . . 58 4.2.10 Entropia da Amostra - SampEn . . . . . . . . . . . . . . . . . . . . . . 59 4.2.11 Entropia de Shannon - ES . . . . . . . . . . . . . . . . . . . . . . . . . 60 5 RESULTADOS E DISCUSSÃO 62 5.1 Jovens Saudáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.2 Feminino versus Masculino . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.3 Idade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.4 Ńıvel de atividade f́ısica - IPAQ . . . . . . . . . . . . . . . . . . . . . . . 73 5.5 Jovens Saudáveis versus Doentes . . . . . . . . . . . . . . . . . . . . . . 75 5.6 Expoente de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.7 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 6 CONCLUSÃO 89 ANEXOS 91 REFERÊNCIAS BIBLIOGRÁFICAS 97 APÊNDICES 107 Lista de Figuras Página 1 Atratores estranhos: no item (a) o atrator estranho encontrado no modelo de Lorenz (figura extráıda de (Campanharo, 2006)) que é um sistema dinâmico cont́ınuo e, no item (b) o atrator estranho encontrado no mapa de Hénon (figura extráıda de (Mullin, 1993)), que é um sistema dinâmico discreto. . . . 14 2 Intervalo RR utilizado para o estudo da Variabilidade da Frequência Card́ıaca (VFC). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3 (a) Série temporal da frequência card́ıaca de um jovem saudável, (b) série temporal da frequência card́ıaca de um doente com insuficiência renal crônica e (c) série temporal da frequência card́ıaca de um doente com diabetes mellitus. Nestes gráficos, no eixo x está representado o tempo (em unidades) e no eixo y o valor de cada intervalo RR; estas séries temporais são compostas de 1000 pontos (ou 1000 valores de intervalos RR consecutivos). . . . . . . . . . . . . 19 4 Função de autocorrelação obtida da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos; no item (a) de um jovem saudável e no item (b) de um doente, tomados como exemplo dentre os 88 vol- untários que compõem a amostra populacional total estudada. Nestes gráficos calculamos 500 coeficientes de autocorrelação. . . . . . . . . . . . . . . . . . 30 5 Gráfico de Poincaré obtido da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos; no item (a) de um jovem saudável e no item (b) de um doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. No eixo x temos o intervalo RRn e no eixo y o intervalo RRn+1. . . . . . . . . . . . . . 32 viii 6 Gráfico DFA obtido da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um jovem saudável tomado como exemplo dentre os 86 jovens saudáveis que compõem a amostra populacional estudada. No eixo x temos log(n) e no eixo y temos log(F (n)) expressos em batimentos card́ıacos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 7 Informação Mútua Média obtida da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. No eixo x temos o tempo de atraso p (em unidades) e no eixo y temos a Informação Mútua Média dada por I(p) (em bits). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 8 Falsos Vizinhos obtidos da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra pop- ulacional total estudada. No eixo x temos a dimensão de imersão m (em unidades) e no eixo y temos o número de falsos vizinhos. . . . . . . . . . . . 45 9 Plot de recorrência obtido da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. . . . . . . . . . . . . . . . . . . . . . 47 10 Dimensão de correlação obtida da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. No eixo x temos a dimensão de imersão e no eixo y a dimensão de correlação. . . . . . . . . . . . . . . . . . . . . . 51 11 Ilustração do método descrito por Wolf utilizado para o cálculo do expoente de Lyapunov. Figura retirada de (Ferrara & Prado, 1994). . . . . . . . . . . 53 12 Caracterização da Função de Autocorrelação das séries temporais da frequência card́ıaca compostas de 1000 pontos dos 86 jovens saudáveis estudados. . . . . 64 ix 13 Atrator caracteŕıstico, reconstrúıdo no espaço de fase de dimensão 3, relativo às séries temporais da frequência card́ıaca compostas de 1000 pontos dos 86 jovens saudáveis estudados. . . . . . . . . . . . . . . . . . . . . . . . . . . 65 14 Caracterização do gráfico de Poincaré relativo às séries temporais da frequência card́ıaca compostas de 1000 pontos dos 86 jovens saudáveis estudados. . . . . 66 15 Função de Autocorrelação obtida da série temporal experimental da frequência card́ıaca composta de 1000 pontos: (a) padrão para jovens saudáveis; (b) doente1; e (c) doente2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 16 Reconstrução do espaço de fase obtido da série temporal experimental da frequência card́ıaca composta de 1000 pontos: (a) padrão para jovens saudáveis; (b) doente1; e (c) doente2. . . . . . . . . . . . . . . . . . . . . . 78 17 Gráfico de Poincaré obtido da série temporal experimental da frequência card́ıaca composta de 1000 pontos: (a) padrão para jovens saudáveis; (b) doente1; e (c) doente2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 18 Tela do software VRA e as opções para a construção do plot de recorrência. . 114 19 Tela inicial do software Minitab. . . . . . . . . . . . . . . . . . . . . . . . . 115 20 Menu Stat do software Minitab. . . . . . . . . . . . . . . . . . . . . . . . . 116 21 Caminho a ser seguido no software Minitab para o cálculo do teste de normal- idade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 22 Caixa de diálogo do software Minitab para o cálculo do teste de normalidade. 118 23 Resultado exibido pelo software Minitab para o cálculo do teste de normalidade do ı́ndice linear LF de uma amostra. . . . . . . . . . . . . . . . . . . . . . . 119 Lista de Tabelas Página 1 Classificação para os valores do coeficiente α obtidos pelo método DFA. . . . 35 2 Média seguida do respectivo desvio padrão da idade (em anos), massa (em kg), altura (em cm) e da frequência card́ıaca (em bpm) dos 86 jovens saudáveis que compõem a amostra populacional estudada nesta pesquisa. . . . . . . . . . . 63 3 Índices lineares e não-lineares obtidos por meio da análise das séries temporais experimentais da frequência card́ıaca, compostas por 1000 pontos, dos 86 jovens saudáveis que compõem a amostra populacional total estudada. . . . . . . . . 67 4 Valores médios, seguidos dos respectivos desvios padrões, da idade (em anos), massa (em kg), altura (em cm) e frequência card́ıaca (em bpm) dos 86 jovens saudáveis que compõem a amostra populacional total estudada nesta pesquisa, quando agrupados de acordo com o sexo. . . . . . . . . . . . . . . . . . . . 68 5 Valores médios, seguidos dos respectivos desvios padrões, e valores de p dos ı́ndices lineares e não-lineares obtidos por meio da análise das séries temporais experimentais da frequência card́ıaca, compostas por 1000 pontos, dos 86 jovens saudáveis agrupados por sexo. ∗ Diferença estat́ıstica significativa entre os sexos. 69 6 Valores médios, seguidos dos respectivos desvios padrões, da idade (em anos), massa (em kg), altura (em cm) e frequência card́ıaca (em bpm) dos 86 jovens saudáveis, agrupados por faixas etárias. . . . . . . . . . . . . . . . . . . . . 71 7 Valores médios, seguidos dos respectivos desvios padrões, e valores de p dos ı́ndices lineares e não-lineares obtidos por meio da análise das séries temporais experimentais da frequência card́ıaca, compostas por 1000 pontos, dos 86 jovens saudáveis agrupados de acordo com os grupos de faixa etária. . . . . . . . . . 72 xi 8 Valores médios, seguidos dos respectivos desvios padrões, da idade (em anos), massa (em kg), altura (em cm) e frequência card́ıaca (em bpm) dos 86 jovens saudáveis, agrupados de acordo com o ńıvel de atividade f́ısica obtido com o IPAQ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 9 Valores médios, seguidos dos respectivos desvios padrões, e valores de p dos ı́ndices lineares e não-lineares obtidos por meio da análise das séries temporais experimentais da frequência card́ıaca, compostas por 1000 pontos, dos 86 jovens saudáveis agrupados de acordo com o ńıvel de atividade f́ısica obtido com o IPAQ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 10 Idade (em anos), massa (em kg), altura (em cm) e frequência card́ıaca (em bpm) dos dois doentes que compõem a amostra populacional estudada nesta pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 11 Índices lineares e não-lineares obtidos por meio da análise das séries temporais experimentais da frequência card́ıaca, compostas de 1000 pontos, dos 86 jovens saudáveis que compõem a amostra populacional total estudada nesta pesquisa juntamente com o valor obtido dos ı́ndices lineares e não-lineares calculados das duas doentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 12 Médias e respectivos desvios padrões dos ı́ndices lineares e não-lineares calcula- dos para os 18 jovens saudáveis que apresentam séries temporais experimentais compostas por 1000 pontos, para as quais obtivemos expoentes de Lyapunov positivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 13 Médias e respectivos desvios padrões dos ı́ndices lineares e não-lineares calcula- dos para os 57 jovens saudáveis que apresentam séries temporais experimentais compostas por 2000, para as quais obtivemos expoentes de Lyapunov positivos. 85 14 Médias e respectivos desvios padrões, dos ı́ndices lineares e não-lineares calcula- dos para os 14 jovens saudáveis que apresentam séries temporais experimentais compostas por 1000 e 2000 pontos, com expoente de Lyapunov positivo. . . . 86 15 Índices não-lineares que foram calculados utilizando o software HRV Analysis. 109 xii 16 Opções utilizadas para o comando corr do software TISEAN na análise das séries temporais experimentais da frequência card́ıaca da amostra populacional total estudada nesta pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . 110 17 Opções utilizadas para o comando delay do software TISEAN na análise das séries temporais experimentais da frequência card́ıaca da amostra populacional total estudada nesta pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . 111 18 Opções utilizadas para o comando mutual do software TISEAN na análise das séries temporais experimentais da frequência card́ıaca da amostra populacional total estudada nesta pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . 111 19 Opções utilizadas para o comando false-nearest do software TISEAN na análise das séries temporais experimentais da frequência card́ıaca da amostra popula- cional total estudada nesta pesquisa. . . . . . . . . . . . . . . . . . . . . . . 112 20 Opções utilizadas para o comando lyap-spec do software TISEAN na análise das séries temporais experimentais da frequência card́ıaca da amostra populacional total estudada nesta pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . 113 MÉTODOS LINEARES E NÃO-LINEARES DE ANÁLISE DE SÉRIES TEMPORAIS E SUA APLICAÇÃO NO ESTUDO DA VARIABILIDADE DA FREQUÊNCIA CARDÍACA DE JOVENS SAUDÁVEIS Autora: MARIA TEODORA FERREIRA Orientador: Prof. Dr. MARCELO MESSIAS RESUMO Neste trabalho fazemos um estudo de métodos lineares e não-lineares utilizados na análise de séries temporais experimentais e aplicamos tais métodos na análise da Variabilidade da Frequência Card́ıaca (VFC) de jovens saudáveis. Os métodos lineares são baseados na análise estat́ıstica, enquanto os não-lineares estão relacionados à teoria dos sistemas dinâmicos determińısticos, da qual a teoria do caos é parte integrante. Chamamos de VFC o estudo das variações dos intervalos existentes entre os batimentos card́ıacos, medidos sempre entre os intervalos RR do sinal card́ıaco, pois estes apresentam maior potencial para serem captados. As séries temporais obtidas destas medidas são chamadas séries de intervalos RR (ou simplesmente séries RR). xiv Com base nos métodos estudados, fazemos uma análise das séries tempo- rais experimentais da frequência card́ıaca (séries RR) de 88 voluntários sendo que 86 não apresentam nenhuma patologia cĺınica diagnosticada e são tomados como jovens saudáveis e dois são jovens que apresentam alguma patologia cĺınica diagnosticada e são tomados como doentes, todos os voluntários na faixa etária de 18 a 25 anos. As séries temporais experimentais da frequência card́ıaca foram obtidas por meio de um cardiofrequenćımetro Polar S810i, no Laboratório de Fisiologia do Estresse da FCT/UNESP. Os ı́ndices calculados para estas séries foram: medidas lineares LF e HF; medidas não-lineares SD1 e SD2, coeficientes α1 e α2 relativos ao método DFA, REC e DET, dimensão de correlação, expoente de Lyapunov, conjetura de Kaplan- Yorke, entropia aproximada, entropia da amostra e entropia de Shannon. Os princi- pais gráficos constrúıdos foram: função de autocorrelação, gráfico de Poincaré, plot de recorrência e a reconstrução do espaço de fase, segundo o método proposto por Takens. Cada um destes ı́ndices é explicado detalhadamente no decorrer do texto. Os objetivos deste trabalho são: estudar alguns dos principais métodos lineares e não-lineares utilizados na análise de séries temporais experimentais; obter uma posśıvel padronização das séries temporais experimentais da frequência card́ıaca de jovens saudáveis; comparar o padrão obtido para jovens saudáveis com séries temporais de jovens que apresentam alguma patologia cĺınica diagnosticada; e, por fim, obter resultados que indiquem um posśıvel comportamento caótico na VFC de jovens saudáveis, principalmente por meio do cálculo do expoente de Lyapunov das séries RR destes indiv́ıduos. A caracterização do padrão da VFC de indiv́ıduos saudáveis é importante, pois permite a comparação deste padrão com condições que modificam a fisiologia normal do indiv́ıduo, como por exemplo exerćıcio f́ısico e estresse, e, principalmente, possibilita a sua aplicabilidade cĺınica, seja no diagnóstico, prognóstico ou estrati- ficação de risco de sujeitos doentes. Como exemplo, é posśıvel distinguir indiv́ıduos saudáveis dos doentes pela análise da VFC e assim encaminhá-los a um diagnóstico mais preciso, caso necessário. xv Os resultados obtidos permitem-nos concluir que é posśıvel obter uma posśıvel padronização, tanto numérica quanto graficamente, das séries temporais experimentais da frequência card́ıaca de jovens saudáveis, bem como distinguir as séries temporais de jovens saudáveis das séries de doentes. Apresentamos também um estudo das séries RR dos jovens saudáveis, quando agrupadas de acordo com o sexo, faixa etária e ńıvel de prática habitual de atividade f́ısica, obtido por meio do IPAQ (International Physical Activity Questionnarie). Quanto ao estudo sobre o comportamento caótico das séries estudadas, observamos que o cálculo dos expoentes de Lyapunov, por meio do método de Sano & Sawada, depende diretamente do tamanho da série temporal considerada. Para séries RR de 2000 pontos, dispońıveis para 61 dentre os 86 jovens estudados, obtivemos expoentes de Lyapunov positivos para a grande maioria (57 dentre os 61), o que sugere ind́ıcios de um posśıvel comportamento caótico da VFC de jovens saudáveis. LINEAR AND NONLINEAR METHODS OF TIME SERIES ANALYSIS AND ITS APPLICATION IN THE STUDY OF HEART RATE VARIABILITY OF YOUNG HEALTHY PEOPLE Author: MARIA TEODORA FERREIRA Adviser: Prof. Dr. MARCELO MESSIAS SUMMARY In this work we study methods linear and nonlinear used in the analysis of experimental time series apply such methods in the analysis of Heart Rate Vari- ability (HRV) of healthy young people. The linear methods are based on statistical analysis, while the nonlinear methods are related to deterministic dynamical sys- tems, including the chaos theory. The HRV is known as the study of variation in the intervals between the heart beats, measured as the RR intervals of the cardiac signal, because they have greater potential to be captured. Time series obtained from these measurements are called series of RR intervals (or simply RR series). Based on the methods studied, we performed HRV analysis of 88 volun- teers with 86 present no clinical disease diagnosed and are taken a healthy young people and two are young people who have some clinical pathology diagnosed and xvii are taken as patients, all volunteers age range from 18 to 25 years. The heart rate experimental times series were obtained through a Polar S810i heart rate monitor at the Laboratory of Stress Physiology based in FCT/UNESP. The indices calculated for these series were: linear measurements LF and HF; nonlinear measures SD1 and SD2, coefficients α1 and α2 for the DFA method, REC and DET, correlation dimen- sion, Lyapunov exponent, Kaplan-Yorke conjecture, approximate entropy, sample entropy and Shannon entropy. Graphically, the main plotting were autocorrelation function, Poincaré plot, plot of recurrence and the reconstruction of phase space, according to the method proposed by Takens. Each of these indices is explained in detail through the text. The objectives of this study is to study some of the key methods linear and nonlinear used in the analysis of experimental time series, obtain possible pattern standardization of the experimental RR time series of heart rate of healthy young people, comparing the pattern obtained from RR time series of young people with the same type of series obtained from people who have any clinical disease diagnosed, and, finally, getting results that indicate the possible chaotic behavior of healthy young people HRV, mainly by calculating the Lyapunov exponent of the RR series. The characterization of the pattern of HRV in healthy individuals is im- portant because it allows for the comparison of standard conditions with altered physiological conditions, such as exercise and stress, and, especially, enables its clin- ical application is the diagnosis, prognosis or risk stratification of diseases. As an example, it is possible to distinguish patients by HRV analysis and thus indicate them to a more precise diagnosis, if required. The results obtained allow us to conclude that it is possible to obtain an possible standardization, numerically and graphically, the RR series of healthy young people, and distinguish of this series from the ones obtained from young people which have disease. We also present a study of the RR series of young people when grouped according to gender, age and level of practice of physical activity, obtained through the IPAQ (International Physical Activity Questionnaire). xviii Finally, we show that the study of chaotic behavior of the time series studied, made trough the calculation of Lyapunov exponents with the Sano and Sawada method, depends directly on the size of the time series considered. For RR series with 2000 points, available for 61 among the 86 people studied, we have obtained positive Lyapunov exponents for the majority (57 out of 61), suggesting evidence of a possible the occurrence of chaotic behavior in HRV of young healthy people. 1 INTRODUÇÃO A teoria do caos iniciou-se no final do século XIX com os estudos em mecânica celeste do matemático Poincaré e posteriormente teve uma grande con- tribuição com o trabalho do meteorologista Lorenz em seu artigo clássico (Lorenz, 1963), que foi um dos primeiros trabalhos a descrever sobre caos em um sistema dinâmico determińıstico. Os sistemas caóticos, que são sistemas dinâmicos determińısticos não- lineares que apresentam comportamento caótico (Alligood et al., 1994; Guzzetti et al., 1996), são caracterizados basicamente pelas seguintes propriedades (Kernick, 2006): • Não-linearidade: Se o comportamento de um sistema dinâmico for linear, esse sistema não pode ser caótico. • Sensibilidade com relação às condições iniciais: Pequenas alterações nas condições iniciais podem levar a comportamentos radicalmente diferentes do sistema em seu estado final. É o chamado “efeito borboleta”. • Determinismo: Existem regras subjacentes determińısticas (não proba- biĺısticas) que todo estado futuro do sistema deve obedecer. • Manutenção da irregularidade no comportamento do sistema: Há uma or- dem oculta que inclui um número grande ou mesmo infinito de configurações periódicas subjacentes à estrutura desses sistemas, ou seja, há uma “ordem na desordem”. • Impossibilidade de previsão em longo prazo: Em decorrência da sensibilidade às condições iniciais, a previsão do comportamento dos sistemas caóticos em 2 longo prazo é imposśıvel, visto que as condições iniciais são sempre conhecidas apenas com precisão finita. Inicialmente relacionado apenas a fenômenos f́ısicos, os sistemas caóticos mostraram, ao longo da História, abranger desde fatos corriqueiros simples, como o cair de uma folha ou o movimento de uma bandeira ao vento, até processos muito mais complexos, como as variações climáticas, o batimento card́ıaco e outros proces- sos fisiológicos ou mesmo o próprio curso de uma vida (Argyris et al., 1994; Glass & Mackey, 1943; Guzzetti et al., 1996; Kernick, 2006). Historicamente Poincaré é considerado um dos fundadores do estudo moderno dos sistemas dinâmicos e das propriedades essenciais do caos; além disso, Poincaré compreendera a caracteŕıstica central da teoria do caos, que hoje chamamos de sensibilidade às condições iniciais, conforme descrito em (Prigogine, 1996; Savi, 2005). Lorenz assinalou um momento decisivo na história do estudo sobre o caos, apesar de seu artigo essencial (Lorenz, 1963), em que é apresentado o famoso sistema de equações que modela a evolução dos movimentos atmosféricos e no qual o atrator estranho é traçado e o efeito da sensibilidade às condições iniciais observado, tenha permanecido por cerca de dez anos desconhecido da comunidade cient́ıfica. Entre o fim dos anos 60 e o começo dos anos 70, aparecem vários outros trabalhos essenciais sobre o caos. Dentre eles, podemos citar o de Ruelle e Takens (Ruelle & Takens, 1971), que teve rapidamente um grande impacto na comunidade cient́ıfica. Este artigo foi o ponto de partida de uma corrida para tentar descobrir a existência de comportamento caótico em dados experimentais, provenientes da observação e mensuração de fenômenos f́ısicos. Neste mesmo trabalho surge pela primeira vez o termo atrator estranho, utilizado para designar os objetos geométricos que aparecem em sistemas caóticos, como o atrator do sistema de Lorenz. Uma vasta literatura pode ser encontrada sobre a teoria do caos e suas aplicações no estudo de fenômenos naturais, por meio dos programas de busca na internet. Neste trabalho estamos particularmente interessados em como esta teo- 3 ria surge no estudo de processos fisiológicos, mais especificamente no estudo da frequência card́ıaca. De fato, devido ao crescente interesse em assuntos relacionados a teoria do caos e ao grande potencial computacional atualmente existente, diversas áreas do conhecimento, incluindo a Medicina, vem experimentando transformações na forma de como pesquisadores aplicam métodos de outras áreas, como os métodos matemáticos, para analisar dados provenientes de fenômenos naturais, tais como os dados provenientes de processos fisiológicos. Os processos fisiológicos são definidos como um conjunto de funções dos organismos vivos, incluindo tanto os fatores f́ısicos e qúımicos como os processos que permitem a vida de organismos uni ou multicelulares desde sua origem e ao longo da vida. Tais processos, por estarem relacionados com a interação de grande quantidade de fatores, comportam-se como parte de um sistema dinâmico determińıstico não- linear e, recentemente, estão sendo estudados do ponto de vista da teoria do caos. Associado a estes processos, o termo caos pode ter uma conotação positiva, refletindo uma situação de saúde, na qual o organismo mostra-se preparado para responder favoravelmente às mudanças abruptas do meio no qual está inserido. Por outro lado, a perda da complexidade do sistema (ou a ausência do caos) pode ter uma conotação negativa, refletindo uma situação de doença, na qual o organismo perde a sua complexidade vital (Godoy, 2009). No século passado, Bernard enunciou o prinćıpio de homeostase: os órgãos dos seres vivos respondem às flutuações externas tentando reconduzir seu compor- tamento às condições de estabilidade e de estacionaridade. Era por assim dizer, uma “teoria de ponto fixo”. Nos anos 50, os biólogos se convenceram da presença de periodicidades nas atividades fisiológicas. Assim, primeiro acreditaram que esta periodicidade era sinônima de saúde e de juventude e que, inversamente, os compor- tamentos complexos (ou caóticos) estavam ligados a estados patológicos e à velhice. Porém estudos recentes mostraram que não é bem assim. No caso de certos ritmos, como o do coração, a variabilidade é maior em pessoas jovens do que em pessoas 4 doentes ou idosas. Por outro lado, comportamentos estritamente periódicos podem ser fatores indicativos ou ocorrer durante alguns tipos de doenças (Goldberger, 1996; Goldberger et al., 2002b; Lipsitz, 2002). A não-estacionaridade, a não-linearidade e a complexidade presente nos sinais gerados por processos fisiológicos desafiam os mecanismos tradicionais e as técnicas de análise de sinais, baseados na homeostase e nas metodologias conven- cionais da bioestat́ıstica. Assim, tanto a noção de homeostase quanto a de métodos de análise baseadas em estat́ıstica descritiva parecem não ser suficientes ou até mesmo adequadas no estudo de sistemas dinâmicos não-lineares (Goldberger et al., 2002a; Kalinichenko et al., 2008; Lombardi, 2000). No organismo humano já foram detectados vários processos fisiológicos com comportamento caótico, alguns destes relacionados com algum tipo de estado cĺınico possivelmente saudável, enquanto alguns estados cĺınicos patológicos geral- mente se associam com comportamento linear ou então totalmente aleatório (Babloy- antz & Destexhe, 1988; Godoy, 2009; Savi, 2005; Siliceo & Mendicoa, 2003; Wagner & Persson, 1998). A aceitação da aplicação da teoria do caos no estudo de processos fi- siológicos permite prever algumas implicações futuras, como descrito em (Godoy, 2009): • Novas linhas de pesquisa, altamente produtivas, deverão ser desenvolvidas procurando extrair desse terreno ainda muito pouco explorado, conhecimen- tos que venham auxiliar no entendimento do organismo humano em toda a sua complexidade. • As habilidades no terreno da matemática, o conhecimento do comportamento dos sistemas dinâmicos e das funções não-lineares e a aplicação de técnicas no domı́nio do caos, entre outras, deverão ser estimulados em vista da necessidade de se entender mais completamente a fisiologia dos sistemas orgânicos. • Do ponto de vista cĺınico, em face da ação da dinâmica não-linear será impru- 5 dente atribuir uma causa espećıfica a um determinado efeito, sabendo-se que nos sistemas dinâmicos determińısticos não-lineares, as influências são sempre multifatoriais. • Medicamentos, dispositivos e equipamentos deverão sofrer um processo de reen- genharia visando a adaptá-los ao comportamento caótico. Drogas com absorção ou distribuição não-linear permitindo concentrações variáveis ao invés de ńıveis fixos, respiradores ou aparelhos de marca-passo atendendo às leis do caos, entre outros seriam algumas das consequências previśıveis. Os sinais provenientes de vários processos fisiológicos, tais como o sinal proveniente da atividade elétrica card́ıaca, podem ser estudados através da análise da série temporal formada por este sinal. Assim, uma alternativa para tratar sistemas dinâmicos sem conhecer os detalhes de sua dinâmica é a análise de séries temporais experimentais que podem ser obtidas diretamente a partir de um experimento. A análise de séries temporais experimentais considera uma série temporal unidimensional, usualmente associada com uma aquisição experimental, para enten- der o comportamento do sistema dinâmico ou do fenômeno a ela associado. Uma série temporal experimental (ST) é um conjunto discreto numerável de valores de uma variável de estado de um sistema dinâmico e pode ser definida como um conjunto de observações em função do tempo, isto é, Xt, t = 1, 2, 3, ..., N, (1) em que t representa a variação temporal da ST e N , o comprimento da série. Um ponto essencial na análise de séries temporais experimentais é que a mesma pode conter informações sobre variáveis não observáveis ou não medidas do sistema dinâmico, que podem ser recuperadas por meio da reconstrução do espaço de fase e analisadas através de métodos lineares e não-lineares como veremos mais adiante. Algumas das dificuldades encontradas no estudo da dinâmica associada às séries temporais experimentais estão ligadas ao não conhecimento das equações do 6 sistema dinâmico que define a série temporal. Com efeito, quando se estuda uma série temporal a tarefa com a qual se depara o experimentador é tentar determinar que tipo de sistema dinâmico a produziu. Devido a complexidade das séries temporais experimentais provenientes de processos fisiológicos, o uso de apenas um método para sua análise não possibilita caracterizar completamente a série e nem afirmar com fidelidade que a série apresenta (ou não) comportamento caótico. Assim, é necessário o uso de vários métodos, tal como os métodos que serão apresentados no Caṕıtulo 4 desta dissertação, e o conjunto dos resultados de todos permite inferir algumas propriedades sobre o comportamento dinâmico da série (Roach & Sheldon, 1998). A teoria dos sistemas dinâmicos determińısticos, incluindo a teoria do caos, tem fornecido novas ferramentas para a análise de séries temporais experimen- tais e diversos algoritmos computacionais foram e ainda estão sendo criados para aperfeiçoar estas análises. Veremos, no decorrer desta dissertação, que um teorema elaborado por Takens (Takens, 1980) permite reconstruir a dinâmica de um sistema desconhecido, em um espaço m-dimensional, a partir de sua série temporal unidimensional, obtida da aquisição experimental. Além disso, apresentaremos várias medidas ou ı́ndices que podem ser calculados a partir de uma série temporal experimental, possibilitando a caracterização e classificação destas séries temporais. De modo geral, o objetivo principal deste trabalho é o estudo de alguns dos principais métodos lineares e não-lineares utilizados na análise de séries temporais experimentais. Do estudo destes métodos apresentamos a aplicação dos mesmos na análise de séries temporais experimentais provenientes da frequência card́ıaca de jovens saudáveis, bem como comparamos as séries temporais experimentais da frequência card́ıaca de indiv́ıduos saudáveis com séries temporais de indiv́ıduos que apresentam alguma patologia cĺınica diagnosticada; e, por fim, fazemos um breve estudo sobre a eficácia do cálculo do expoente de Lyapunov. Trata-se de um tema atual e relevante, que tem despertado a atenção 7 de pesquisadores do mundo todo. De fato, em junho de 2008, os editores da revista Caos, do American Institute of Physics, decidiram instituir uma nova série de artigos endereçada a tópicos pontuais e controversos ligados à ciência não-linear, bem como assuntos relacionados a possibilidade da existência de comportamento caótico em séries temporais experimentais. O primeiro número desta série foi exatamente sobre a posśıvel existência de comportamento caótico nas séries temporais experimentais provenientes da frequência card́ıaca (Baillie et al., 2009; Buchner et al., 2009; Freitas et al., 2009; Glass, 2009; Hu et al., 2009; Ramirez et al., 2009). Buscando dar uma contribuição a este estudo, neste trabalho, estudamos alguns dos principais métodos lineares e não-lineares utilizados na análise de séries temporais experimentais e aplicamos estes métodos na análise da variabilidade da frequência card́ıaca de 88 voluntários na faixa etária de 18 a 25 anos, sendo que 86 destes voluntários não apresentam quaisquer problemas de saúde diagnosticados e são tomados como jovens saudáveis e, dois destes apresentam algum tipo de patologia cĺınica diagnosticada e são tomados como doentes, para fins de comparação com os jovens saudáveis. As séries temporais dos voluntários foram obtidas no Laboratório da Fi- siologia do Estresse da Faculdade de Ciências e Tecnologia - FCT/UNESP, por meio de um cardiofrequenćımetro Polar S810i, e todos os procedimentos de coleta foram aprovados pelo Comitê de Ética da Instituição. Os caṕıtulos restantes desta dissertação encontram-se organizados da seguinte maneira: • Caṕıtulo 2: Apresentamos sucintamente conceitos sobre sistemas dinâmicos, conceituamos os chamados sistemas caóticos determińısticos e apresentamos, sem pretender esgotá-los, conceitos básicos sobre comportamento caótico de- termińıstico, atratores estranhos e estrutura fractal. • Caṕıtulo 3: Fazemos uma introdução sobre o sistema cardiovascular, exibimos conceitos sobre a análise da Variabilidade da Frequência Card́ıaca (VFC) e 8 apresentamos a amostra populacional total estudada nesta pesquisa. • Caṕıtulo 4: Descrevemos os métodos lineares e não-lineares utilizados na análise das séries temporais experimentais da frequência card́ıaca da amostra populacional total estudada. • Caṕıtulo 5: Apresentamos os resultados obtidos na análise das séries temporais experimentais da frequência card́ıaca da amostra populacional total estudada, bem como discutimos os resultados apresentados e, por fim, exibimos algumas considerações finais sobre o número de voluntários analisados, o tamanho das séries temporais experimentais estudadas, dentre outros aspectos relevantes. • Caṕıtulo 6: Apresentamos as conclusões obtidas com este trabalho. 2 SISTEMAS CAÓTICOS Neste caṕıtulo apresentamos os chamados sistemas dinâmicos, exibimos os sistemas caóticos e suas caracteŕısticas, bem como apresentamos a definição de atrator estranho e conceitos básicos sobre estrutura fractal. Estes conceitos são importantes visto que deles surgem o embasamento teórico dos métodos de análise de séries temporais experimentais que apresentaremos no Caṕıtulo 4 e é nestes sistemas dinâmicos conhecidos que estes métodos de análise são primeiramente testados e averiguados quanto a sua eficácia e veracidade nos resultados. Neste contexto, (Kantz & Schreiber, 1997), colocam que a ligação mais direta entre a teoria do caos em sistemas dinâmicos determińısticos e o mundo real é a análise de séries temporais experimentais através de métodos não-lineares. 2.1 Comportamento Caótico em Sistemas Dinâmicos Um sistema dinâmico é um sistema que evolui com o tempo de acordo com um conjunto de regras fixas que determinam como um estado do sistema se altera para outro estado. Dois tipos principais de sistemas dinâmicos são encontrados em aplicações: aqueles nos quais a variável independente, comumente tomada como sendo o tempo, é cont́ınua e aqueles nos quais a variável independente é discreta (Campanharo, 2006). Um sistema dinâmico discreto pode ser representado como a iteração de uma ou mais funções, isto é, 10 ~xn+1 = ~fµ(~xn), (2) em que ~xn+1 ∈ R m corresponde ao vetor de estados do sistema dinâmico, µ é o parâmetro de controle e ~f é a função que determina o sistema. Um sistema dinâmico cont́ınuo pode ser descrito por equações diferenciais ordinárias ou parciais. No caso de uma ou mais equações diferenciais ordinárias, tal sistema dinâmico assume a forma:    d~x(t) dt = ~fµ(~x(t)) ~x(0) = ~x0, (3) em que ~x ∈ R m corresponde ao vetor de estados do sistema dinâmico, µ ∈ R n é o parâmetro de controle, ~f é a função que determina o sistema e ~x(0) = ~x0 é a condição inicial. Os sistemas dinâmicos podem ser classificados como determińısticos ou estocásticos. Sistema dinâmico determińıstico é aquele em que o estado em um instante depende funcionalmente do estado num instante precedente ou posterior e podem ser classificados como sistemas dinâmicos lineares ou não-lineares, de acordo com a função ~f que rege o sistema. Sistemas dinâmicos lineares são aqueles em que os eventos futuros acon- tecem dentro de margens previśıveis. Duas propriedades importantes de sistemas dinâmicos lineares são: proporcionalidade e superposição. Proporcionalidade sig- nifica que a entrada e a sáıda dos dados possuem comportamento linear. Super- posição implica que o comportamento de um sistema linear composto por múltiplos componentes pode ser totalmente compreendido e previsto pelo estudo isolado dos mesmos. Deste modo, a resposta total será conhecida simplesmente pelo estudo do somatório das partes constituintes (Ferrara & Prado, 1994). Em processos fisiológicos a proporcionalidade não se aplica, porque pe- quenas mudanças nos parâmetros de controle ou nas condições iniciais das variáveis fisiológicas podem resultar em efeitos impreviśıveis. Outro fator que se adiciona a 11 essa análise é a impossibilidade de compreensão de sistemas compostos por múltiplos componentes pelo estudo de partes isoladas (superposição) (Pincus & Goldberger, 1994). Em geral, não é posśıvel obter soluções anaĺıticas para sistemas dinâmicos não-lineares. Assim, faz-se necessário um estudo qualitativo do sistema dinâmico o qual se preocupa em identificar caracteŕısticas importantes de suas soluções sem propriamente resolver as equações. Para um estudo qualitativo dos sistemas dinâmicos não-lineares pode-se recorrer à construção do seu retrato de fase, o qual mostra como o sistema evolui à medida que o tempo passa, tornando posśıvel identificar as principais caracteŕısticas das soluções. Existem também sistemas dinâmicos que, mesmo obedecendo a regras determińısticas, são impreviśıveis para um tempo futuro. Tais sistemas são carac- terizados como caóticos e necessariamente são sistemas dinâmicos não-lineares. Por sistemas caóticos entendemos sistemas dinâmicos determińısticos que exibem sensibilidade à variação das condições iniciais, sendo que essa sensibilidade, quando existe, resulta das não-linearidades presentes no sistema, as quais amplificam exponencialmente pequenas diferenças nas condições iniciais (Devaney, 1992; Sprott, 2003). A sensibilidade às condições iniciais é a caracteŕıstica fundamental que diferencia os sistemas dinâmicos caóticos determińısticos dos sistemas dinâmicos que apresentam respostas randômicas ou estocásticas. Para estes sistemas (randômicos ou estocásticos), a mesma condição inicial pode conduzi-los a estados bastante dis- tintos em pequenos intervalos de tempo, o que não ocorre nos sistemas dinâmicos caóticos determińısticos (Ott, 1994). Para a ocorrência de comportamento caótico determińıstico num sistema dinâmico cont́ınuo é necessário que a dimensão m do espaço de fase seja m maior ou igual a três, devido ao Teorema de Poincaré-Bendixson (Ferrara & Prado, 1994). Este fato não se impõe a sistemas dinâmicos discretos. Com efeito, mesmo mapas 12 uni e bidimensionais podem apresentar comportamento caótico (por exemplo, mapa loǵıstico, mapa de Hénon). 2.2 Atratores Estranhos e Estrutura Fractal De acordo com a teoria de sistemas dinâmicos, um conjunto compacto A é um atrator de um fluxo ϕ(t, x) se as quatro hipóteses a seguir são verificadas: • A é invariante segundo o fluxo ϕ. • A tem uma vizinhança contraente. • O fluxo é recorrente, isto é, trajetórias começando em qualquer subconjunto aberto de A voltam a esse subconjunto para valores de t suficientemente grandes. • O fluxo não pode ser decomposto, isto é, A não pode ser dividido em duas partes invariantes não triviais (A é conexo). Estes atratores, quando existem, podem ser classificados como: • Atrator pontual, que é independente no tempo. • Ciclo limite, que, periódico no tempo, é caracterizado por sua amplitude e peŕıodo. • Toro T n (2 ≤ n < m), que corresponde a um regime quase-periódico com n frequências fundamentais independentes. • Atratores estranhos, que apresentam sensibilidade às condições iniciais. Na medida em que descrevem o comportamento de sistemas dinâmicos para tempos longos, os atratores estão intimamente ligados à noção de estabilidade. Especificadamente, um atrator estranho pode ser visto como resultado da combinação de dobras com um número infinito de expansões em pelo menos uma direção e contrações em outras direções. 13 Atratores estranhos ocorrem em sistemas dissipativos. Sobre este atra- tor, a dinâmica é caracterizada por esticamentos e dobras; o primeiro fenômeno é responsável pela divergência de trajetórias próximas e o último pela contração da dinâmica para uma região finita em um subespaço de dimensão menor ou igual a m (Ferrara & Prado, 1994). A Figura 1 apresenta dois atratores estranhos: no item (a) o atrator estranho encontrado no modelo de Lorenz (figura extráıda de (Campanharo, 2006)) que é um sistema dinâmico cont́ınuo e, no item (b) o atrator estranho encontrado no mapa de Hénon (figura extráıda de (Mullin, 1993)), que é um sistema dinâmico discreto. Estrutura Fractal Quando se faz referência ao conceito de dimensão, em geral, trata-se da dimensão euclidiana. Um conjunto finito de pontos tem dimensão zero; uma linha tem dimensão um; uma superf́ıcie, dimensão dois, etc. No contexto dos sistemas dinâmicos, entenda-se por dimensão o limite inferior do número de variáveis essenciais necessárias para descrever a dinâmica do sistema. Contudo, ao introduzir o conceito de atrator estranho, é posśıvel construir estruturas geométricas mais complexas e com dimensões não-inteiras. Tais objetos geométricos são genericamente chamados fractais e uma de suas propriedades básicas é a chamada autossimilaridade (Acharya et al., 2004b; Mandelbrot, 1982; Mansier et al., 1996). Fractais são definidos como sendo conjuntos cuja forma é extremamente irregular ou fragmentada, apresentando essencialmente o mesmo padrão em todas as escalas (Mandelbrot, 1982). A existência de uma estrutura fractal no sistema dinâmico é uma condição necessária, mas não suficiente, para a existência de caos. De fato, a estrutura fractal pode estar associada a imprevisibilidade do sistema dinâmico no sentido de provocar uma sensibilidade às condições iniciais. 14 (a) atrator de Lorenz (b) Atrator de Hénon Figura 1: Atratores estranhos: no item (a) o atrator estranho encontrado no modelo de Lorenz (figura extráıda de (Campanharo, 2006)) que é um sistema dinâmico cont́ınuo e, no item (b) o atrator estranho encontrado no mapa de Hénon (figura extráıda de (Mullin, 1993)), que é um sistema dinâmico discreto. 15 A dimensão fractal corresponde a uma propriedade básica de um atrator. A estranheza de um atrator caótico está associada com sua dimensão fractal. De um modo geral, pode-se dizer que a dimensão fornece o valor da informação necessária para especificar a posição de um ponto no atrator com certa precisão. Em contraste com sistemas dinâmicos não-caóticos que possuem atratores de dimensão inteira como pontos fixos (que geram soluções estacionárias) e ciclos limites (que produzem soluções periódicas), sistemas caóticos podem estar associados a atratores estranhos caracterizados por uma dimensão não-inteira, apresentando, pois, estrutura fractal. Grande variedade de estruturas possui estrutura fractal, incluindo árvores, formações de coral, costa maŕıtima e montanhas. No organismo, certo número de estruturas pulmonares, artérias e veias, dentre outras, também possuem formato semelhante (Cross, 1997). 3 CASUÍSTICA E METODOLOGIA DE CO- LETA DE DADOS Neste caṕıtulo apresentamos a metodologia de coleta dos dados analisa- dos neste trabalho. Para este fim esboçamos, inicialmente, uma descrição sintética do sistema cardiovascular; exibimos conceitos sobre a análise da Variabilidade da Frequência Card́ıaca (VFC), especificamos a respeito da coleta dos dados utilizados neste trabalho, exibimos a amostra populacional total estudada e, por fim, apresen- tamos os critérios adotados para a análise da VFC dos voluntários. 3.1 Introdução ao Sistema Cardiovascular O coração é considerado o órgão central da manutenção da homeostase, recebendo influência tônica e reflexa do Sistema Nervoso Autônomo (SNA), com a finalidade de controlar o funcionamento e equiĺıbrio fisiológico interno, modificando principalmente sua frequência card́ıaca (Vanderlei et al., 2009). Embora o coração possua seus próprios sistemas intŕınsecos de controle e possa continuar a operar sem quaisquer influências nervosas, a eficácia da ação card́ıaca pode ser extremamente modificada pelos impulsos reguladores do Sistema Nervoso Autônomo (SNA), por meio dos seus componentes ou ramos simpático e parassimpático (Acharya et al., 2006). Caracterizado pela rapidez e intensidade com que altera as funções vis- cerais, o sistema nervoso autônomo, por meio dos seus componentes simpático e parassimpático, atua na regulação de mecanismos fisiológicos e fisiopatológicos card́ıacos quando a homeostase é alterada, com a finalidade de manter o equiĺıbrio 17 fisiológico interno e preservar as condições necessárias para que o mesmo exerça, adequadamente, sua interação com o meio ambiente circundante (Goldberger, 1996). O trabalho card́ıaco produz sinais elétricos que passam para os tecidos vizinhos e chegam à pele. Assim, com a colocação de elétrodos no peito, podemos gravar as variações das ondas elétricas emitidas pelas contrações card́ıacas. O registro dessas ondas pode ser feito numa tira de papel ou num monitor, sendo chamado de eletrocardiograma (ECG) (Carvalho et al., 2002; Kitlas et al., 2005). O eletrocardiograma (ECG ou EKG) é conhecido como o sinal derivado da atividade elétrica do coração e é medido na superf́ıcie do corpo usando o eletro- cardiógrafo (aparelho que capta o sinal elétrico e produz o eletrocardiograma) (Acharya et al., 2002; Kitlas et al., 2005). A frequência card́ıaca (FC) é usualmente calculada do tempo decorrido entre duas contrações ventriculares; em outras palavras, o tempo entre duas ondas R consecutivas sobre o eletrocardiograma (intervalo RR) (Acharya et al., 2006; Mansier et al., 1996). No coração normal, um ciclo card́ıaco completo é representado pelas ondas P , Q, R, S, T , com duração total menor do que 8 milissegundos (Acharya et al., 2006), ver Figura 2, extráıda de (Gomes, 2001). Figura 2: Intervalo RR utilizado para o estudo da Variabilidade da Frequência Card́ıaca (VFC). A Figura 3 apresenta os gráficos das séries temporais experimentais da 18 frequência card́ıaca, no item (a) de um jovem saudável e nos itens (b) e (c) de dois doentes. Nestes gráficos, no eixo x está representado o tempo e no eixo y o valor de cada intervalo RR; estas séries temporais são compostas de 1000 pontos (ou 1000 valores de intervalos RR consecutivos). Respostas dos componentes simpático e parassimpático modificam a frequência card́ıaca, adaptando-a as necessidades de cada momento. O aumento da frequência card́ıaca é consequência da maior ação do ramo simpático e da menor atividade parassimpática, ou seja, inibição vagal, enquanto, a sua redução depende basicamente do predomı́nio da atividade vagal (parassimpática) (Chandra et al., 2003). O Sistema Nervoso Parassimpático (SNP) diminui todas as atividades do coração, sendo que a função card́ıaca é reduzida pelo ramo parassimpático durante o peŕıodo de repouso, juntamente com o restante do corpo. Este fato talvez ajude a preservar os recursos do coração, pois, durante os peŕıodos de repouso, indubitavel- mente há um menor desgaste deste órgão. O SNP atua de forma mais individualizada sobre órgãos ou regiões distintas e provoca uma reação generalizada atuando sobre a restauração das funções vegetativas como, por exemplo, a digestão e o repouso. Quando estimulado, ele provoca, por exemplo, a contração das pupilas, dilatação de coronárias, bronquioconstrição, aumento do peristaltismo e tônus do intestino (Acharya et al., 2006; Kitlas et al., 2005). O Sistema Nervoso Simpático (SNS) aumenta a atividade card́ıaca como bomba, algumas vezes aumentando a capacidade de bombear sangue em até 100%. Este efeito fisiológico é necessário quando um indiv́ıduo é submetido as situações de estresse, tais como exerćıcios f́ısicos, doença, calor excessivo, ou outras condições que exigem um rápido fluxo sangúıneo através do sistema circulatório. Por conseguinte, os efeitos simpáticos sobre o coração constituem o mecanismo de aux́ılio utilizado numa emergência, tornando mais forte o batimento card́ıaco quando necessário. O SNS tem como função preparar o organismo para situações de emergência e atividades que exijam vigorosa ação muscular como, por exemplo, um simples pensamento, bus- 19 (a) série temporal da frequência card́ıaca de um jovem saudável (b) série temporal da frequência card́ıaca da doente1 (c) série temporal da frequência card́ıaca da doente2 Figura 3: (a) Série temporal da frequência card́ıaca de um jovem saudável, (b) série temporal da frequência card́ıaca de um doente com insuficiência renal crônica e (c) série temporal da frequência card́ıaca de um doente com diabetes mellitus. Nestes gráficos, no eixo x está representado o tempo (em unidades) e no eixo y o valor de cada intervalo RR; estas séries temporais são compostas de 1000 pontos (ou 1000 valores de intervalos RR consecutivos). 20 cando sempre ajustar os sistemas como um todo a ambientes adversos, ou alterações das necessidades internas. Este sistema atua de forma mais generalizada sobre o corpo humano (Acharya et al., 2006; Kitlas et al., 2005). Em śıntese, podemos dizer que a integração entre a modulação do sistema nervoso simpático (atuação rápida) e parassimpático (atuação lenta) sobre o coração, modificando a frequência card́ıaca batimento a batimento é a resposta natural do sistema card́ıaco a fim de atender às diferentes demandas metabólicas. 3.2 Análise da Variabilidade da Frequência Card́ıaca (VFC) O Sistema Nervoso Autônomo (SNA) desempenha um papel importante na regulação dos processos fisiológicos do organismo humano tanto em condições normais quanto patológicas. Dentre as técnicas utilizadas para sua avaliação, a Vari- abilidade da Frequência Card́ıaca (VFC) tem emergido como uma medida simples e não-invasiva dos impulsos autonômicos, representando um dos mais promissores marcadores quantitativos do balanço autonômico (Majercak, 2002). Chamamos de Variabilidade da Frequência Card́ıaca (VFC) o estudo dos intervalos existente entre os batimentos card́ıacos, medidos como a distância entre duas ondas R do sinal card́ıaco, pois estes apresentam maior potencial para tal medição. Estes intervalos apresentam variações que refletem o complexo mecanismo de operação da bomba card́ıaca e o relacionamento do sistema cardiovascular com o SNA (Guzzetti et al., 1996). A análise da VFC possibilita a observação e compreensão dos mecanis- mos extŕınsecos do controle do ritmo card́ıaco em situações fisiológicas normais e patológicas. O fato de esta análise ser uma técnica não-invasiva a torna o procedi- mento de escolha na avaliação da função do SNA em muitas condições cĺınicas (Cohen et al., 1996). A mensuração da variabilidade da frequência card́ıaca é um método que permite analisar o controle neural card́ıaco durante peŕıodos curtos ou prolongados, em diversas condições fisiológicas (durante o sono, monitoramento 24 horas, repouso, 21 exerćıcio f́ısico e bloqueio farmacológico) e patológicas. Este tipo de análise teve grande impulso após o estabelecimento da forte e independente relação entre VFC e mortalidade pós-infarto agudo do miocárdio, tendo a vantagem de possibilitar uma avaliação não-invasiva e seletiva da função autonômica, além de ser um recurso metodológico de grande simplicidade e fácil aplicação (Fojt & Holcik, 1998; Oliveira et al., 2006). O coração não tem seus batimentos regulares com intervalos fixos, assim, variações da frequência card́ıaca, moduladas principalmente pelo SNA, são normais e esperadas em indiv́ıduos saudáveis. Essas variações hemodinâmicas que ocorrem batimento a batimento expressam a resposta fisiológica de uma série de comandos neuro-humorais na tentativa de sustentar a função cardiovascular (Gomes, 2001). A VFC mostra alterações com a respiração, estresse f́ısico e mental, ativi- dade f́ısica, alterações hemodinâmicas e metabólicas (Gomes, 2001). Em śıntese, podemos dizer que alterações nos padrões da VFC provêm um indicador precoce e senśıvel do comprometimento da saúde. Em geral, uma alta variabilidade na frequência card́ıaca é sinal de boa adaptabilidade, implicando em um indiv́ıduo saudável com os mecanismos de controle autonômicos funcionando bem. Por outro lado, uma baixa variabilidade é frequentemente indicadora de adaptabili- dade anormal ou insuficiente do sistema nervoso autônomo, implicando na presença de mau funcionamento fisiológico, pelo qual se faz necessário maior investigação para se ter um diagnóstico preciso sobre a saúde do indiv́ıduo (Guzzetti et al., 1996; Hagerman et al., 1996). A variabilidade da frequência card́ıaca pode ser determinada durante registros eletrocardiográficos de curta duração e, nestes casos, geralmente em as- sociação com testes provocativos (manobras respiratórias, testes posturais, exerćıcio isométrico e dinâmico, estimulação carot́ıdea, provas farmacológicas, etc.) ou, mais frequentemente, durante monitorização eletrocardiográfica ambulatorial (Oliveira et al., 2006). 22 3.3 População Amostral Para a realização deste trabalho estudamos uma amostra populacional composta por 88 voluntários na faixa etária de 18 a 25 anos, sendo que 86 destes voluntários não apresentam quaisquer problemas de saúde diagnosticados e são toma- dos como jovens saudáveis e dois destes apresentam algum tipo de patologia cĺınica diagnosticada e são tomados como doentes, para fins de comparação com os jovens saudáveis. Os voluntários e seus responsáveis foram devidamente informados sobre os procedimentos e objetivos deste estudo e, após concordar, cada responsável assinou um termo de consentimento livre e esclarecido (vide anexo 1). Antes do ińıcio dos procedimentos necessários para obtenção das séries temporais, os voluntários foram identificados coletando-se as seguintes informações: idade (em anos), sexo, massa (em kg), altura (em cm), frequência card́ıaca (em batimentos por minuto - bpm) e ńıvel de prática habitual de atividade f́ısica, obtido por meio da aplicação do IPAQ (International Physical Activity Questionnarie). A medida da altura foi realizada em pé, por meio de um estadiômetro da marca Sanny, e a massa foi determinada em uma balança digital da marca Tin 00139 Maxima. Os voluntários tiveram sua altura e massa verificadas sem sapatos, estando eles de costas para a balança durante a medida da altura. As séries temporais dos voluntários foram obtidas no Laboratório da Fi- siologia do Estresse da Faculdade de Ciências e Tecnologia - FCT/UNESP, por meio de um cardiofrequenćımetro Polar S810i, e todos os procedimentos de coleta foram aprovados pelo Comitê de Ética em Pesquisa da Faculdade de Ciências e Tecnologia - FCT/UNESP - Processo n. 266/2008. O controle da temperatura ambiente entre 21◦C e 23◦C, umidade entre 40 e 60% e a preparação dos equipamentos utilizados foram realizados antes da chegada dos voluntários no local destinado aos testes. Foi permitida a circulação de quantidade mı́nima de indiv́ıduos nas de- pendências do laboratório durante a execução das coletas dos dados de modo a reduzir 23 a ansiedade dos voluntários. Após a avaliação inicial, foi explicado aos voluntários todo o procedimento necessário para realização da coleta de dados, que foi realizada de forma individual, e os voluntários foram orientados a manterem-se em repouso, evitando conversarem durante a coleta. Após estes procedimentos, a cinta de captação foi colocada no tórax dos voluntários e, no seu punho, o receptor de frequência card́ıaca Polar S810, equipa- mento previamente validado para captação da frequência card́ıaca batimento a ba- timento e a utilização dos seus dados para análise da variabilidade da frequência card́ıaca (Gomes, 2001; Vanderlei et al., 2008). O equipamento Polar S810 consiste em dois elétrodos montados em um transmissor eletrônico selado que é posicionado no tórax do voluntário, ao ńıvel do terço distal do esterno, utilizando-se uma cinta elástica. Estas unidades telemétricas obtêm os impulsos elétricos do coração e transmitem tais informações através de um campo eletromagnético para o monitor que está no punho do voluntário. Após a colocação da cinta e do monitor os voluntários foram colocados em decúbito dorsal em um colchonete e permaneceram em repouso com respiração espontânea por 20 minutos. Após este peŕıodo de coleta o voluntário foi liberado. Para análise da variabilidade da frequência card́ıaca, o padrão de seu comportamento foi registrado batimento a batimento durante todo o protocolo ex- perimental. Para análise dos dados foram utilizados 1000 intervalos RR consecutivos, nos quais foi feita uma filtragem digital complementada por manual, para eliminação de batimentos ectópicos prematuros e artefatos, e somente séries com mais de 95% de batimentos sinusais foram inclúıdas no estudo (Godoy, 2003; Vanderlei et al., 2008). 3.4 Critérios adotados para a análise da VFC Apresentamos, nesta subseção, alguns passos e critérios importantes uti- lizados na análise da VFC. Considerando os softwares utilizados para a análise das séries temporais experimentais da frequência card́ıaca seguimos os seguintes passos: 24 • As séries temporais experimentais da frequência card́ıaca foram devidamente filtradas, sendo extráıdos das mesmas os batimentos ectópicos. Uma filtragem inicial é feita no Polar S810i e posteriormente uma filtragem manual é feita utilizando-se o Microsoft Office Excel 2007. • As séries temporais experimentais foram analisadas individualmente no soft- ware Heart Rate Variability Analysis - HRV Analysis (Software, 2009a), onde foram calculados os ı́ndices no domı́nio da frequência, a saber, as faixas de frequência LF e HF e algumas medidas de caos, a saber, os ı́ndices SD1 e SD2, REC e DET, os coeficientes α1 e α2, entropia aproximada, entropia da amostra e dimensão de correlação. • Em seguida, calculou-se os 500 coeficientes da função de autocorrelação, a Informação Mútua Média para sabermos o tempo de atraso correto e os Falsos Vizinhos Próximos para sabermos a escolha da dimensão de imersão correta para a reconstrução do espaço de fase e, por fim, os vetores de atraso usados na reconstrução do espaço de fase. Após, foram calculados os expoentes de Lyapunov, usando o método de Sano & Sawada, a entropia de Shannon e a conjectura de Kaplan-Yorke. Estas medidas foram calculadas usando o software TISEAN - Nonlinear Time Series Analysis (Software, 2009b). • Os gráficos da função de Autocorrelação (FA), de Poincaré e da reconstrução do espaço de fases foram feitos no software MATLAB - MATrix LABoratory (Software, 2008). • Para a confecção do Plot de Recorrência (PR) usou-se o software VRA - Visual Recurrence Analysis (Software, 2009c). Para a análise da VFC com relação a idade dos indiv́ıduos, fizemos um agrupamento por faixas etárias distintas, da seguinte forma: • Grupo 1: composto de voluntários de 18 e 19 anos. 25 • Grupo 2: composto de voluntários de 20 e 21 anos. • Grupo 3: composto de voluntários de 22 a 25 anos. Para a análise da VFC com relação ao ńıvel de prática habitual de ativi- dade f́ısica utilizamos o IPAQ (International Physical Activity Questionnarie), que é um questionário originalmente desenvolvido para estimar e avaliar o ńıvel de prática habitual de atividade f́ısica de um indiv́ıduo (Matsudo, 2001). Os questionários são os mais utilizados devido a sua viabilidade, eficácia e economia, e tem se mostrado como uma forma mais prática e usada em estudos sobre a taxa de realização de atividade f́ısica de uma dada população, mesmo sabendo- se que este método pode apresentar deficiências referentes a tipos de perguntas e manipulação involuntária das respostas (Matsudo, 2002). O IPAQ possui duas versões, uma versão longa e outra curta, as quais procuram prover informações quanto à frequência e à duração de caminhadas e de atividades cotidianas que exigem esforços f́ısicos de intensidades moderada e vigorosa, além do tempo despendido em atividades realizadas em posição sentada em dias do meio (entre segunda e sexta-feira) e do final de semana (sábado e domingo), tendo como peŕıodo de referência uma semana t́ıpica ou a última semana anterior ao preenchimento do questionário (Matsudo, 2001). A versão utilizada nesta pesquisa (anexo 2) é composta por seis questões abertas e suas informações permitem estimar o tempo despendido por semana em diferentes dimensões de atividade f́ısica (caminhadas e esforços f́ısicos de intensidades moderada e vigorosa) (Matsudo, 2002). A partir dos resultados obtidos da análise dos questionários, podemos classificar os indiv́ıduos em sedentários, insuficientemente ativos do tipo A e B, ativos e muito ativos, analisando o tempo de atividades f́ısicas leves, moderadas e vigorosas, realizadas em uma semana t́ıpica (Matsudo, 2001). Para a comparação na análise da VFC com relação ao ńıvel de atividade f́ısica, calculado utilizando o IPAQ, consideramos a população amostral separada em 26 dois grupos, a saber: • Grupo A: composto por voluntários muito ativos; • Grupo B: composto por voluntários insuficientemente ativos A, B e sedentários. Ainda com relação aos dados a serem apresentados, observamos que foi utilizado o teste de Ryan-Joiner, implementado no software Minitab, para testar a normalidade dos dados obtidos; segundo este teste, para valores de p com p < 0, 05 tem-se que os dados não seguem uma distribuição normal e para valores de p com p > 0, 05 tem-se que os dados seguem uma distribuição normal. Usando o software InStat3, comparamos as séries temporais da frequência card́ıaca dos 86 jovens saudáveis por sexo, faixa etária e ńıvel de atividade f́ısica (IPAQ). Para a comparação de acordo com o sexo e o ńıvel de atividade f́ısica, quando a distribuição normal foi verificada, o teste t de Student foi aplicado e, nas situações em que a distribuição normal não foi verificada, foi aplicado o teste de Mann-Whitney. Para a comparação de acordo com a faixa etária, quando a distribuição normal foi verificada,aplicou-se o teste F da análise de variância e nas situações em que a distribuição normal não foi verificada, foi aplicado o teste “Kruskal-Wallis test with post-test”. Com base nestes testes, as diferenças dos resultados serão consideradas estatisticamente significantes quando o valor de p for menor que 0, 05. Na apresentação dos resultados numéricos dos 86 jovens saudáveis que compõem a amostra populacional total estudada, utilizamos o método estat́ıstico descritivo, apresentando os valores das médias dos ı́ndices obtidos, seguidas dos respectivos desvios padrões. Os resultados gráficos e numéricos relativos aos dois indiv́ıduos doentes são exibidos na forma bruta, conforme obtidos com os cálculos. 4 MÉTODOS DE ANÁLISE DE SÉRIES TEM- PORAIS EXPERIMENTAIS Neste caṕıtulo apresentamos alguns dos principais métodos lineares e não- lineares utilizados na análise de séries temporais experimentais. Aqui utilizamos tais métodos na análise de séries temporais experimentais da frequência card́ıaca. 4.1 Métodos Lineares Os métodos lineares são divididos em dois tipos: análise no domı́nio do tempo e análise no domı́nio da frequência; neste trabalho, ambas as análises foram feitas utilizando o software HRV Analysis (Software, 2009a). O método linear utilizado neste trabalho é a análise no domı́nio da frequência, sendo a densidade de potência espectral a mais utilizada atualmente, quando se trata de estudos com indiv́ıduos em condições de repouso (Acharya et al., 2006). Esta análise decompõe a VFC em componentes oscilatórios fundamentais, sendo que as principais faixas de frequência de oscilação são as faixas LF e HF, as quais são obtidas através da Transformada Rápida de Fourier (FFT) (Mansier et al., 1996). As caracteŕısticas das faixas de frequência calculadas são: • Componente de baixa frequência - LF, com variação na faixa de 0,04 e 0,15Hz, sendo decorrente da ação conjunta dos componentes vagal e simpático sobre o coração, com predominância do simpático e correlacionado ao sistema baror- receptor. 28 • Componente de alta frequência - HF, com variação na faixa de 0,15 a 0,4Hz, sendo, pois, um indicador da atuação do nervo vago sobre o coração; mediado pelo SNA parassimpático e sincronizado pela respiração. A análise da frequência possibilita a observação individual das divisões do sistema nervoso autônomo (simpático e parassimpático) em diferentes situações fisiológicas e patológicas, assim como sua relação com os principais sistemas que in- terferem na VFC (sistema respiratório, sistema vasomotor, sistema termorregulador, mecanismo renina-angiotensina e sistema nervoso central) (Chandra et al., 2003; Guzzetti et al., 1996). Estes ı́ndices lineares LF e HF, obtidos por métodos no domı́nio da frequência, são distinguidos como sendo o sistema nervoso card́ıaco simpático me- diado pela faixa de frequência LF e o sistema nervoso card́ıaco parassimpático me- diado pela faixa de frequência HF (Acharya et al., 2004a, 2006). Porém existem controvérsias sobre esta classificação, visto que em (Acharya et al., 2004b; Chandra et al., 2003), a faixa LF reflete tanto o ramo simpático quanto o parassimpático e HF reflete puramente o ramo parassimpático. 4.2 Métodos Não-Lineares Nesta seção, apresentamos os métodos não-lineares, ou seja, as medidas de caos utilizadas neste trabalho para a caracterização das séries temporais experi- mentais da frequência card́ıaca. As medidas descritas aqui são comumente utilizadas na literatura (Huikuri et al., 2003) para caracterizar as séries temporais experimentais da frequência card́ıaca. Para as medidas de caos que vamos apresentar nas subseções seguintes, consideremos a evolução de um sistema dinâmico dada por uma função f(t), ou, quando resultado de uma série de medidas realizadas a intervalos de tempos regulares ∆t, representada por uma série temporal da forma 29 xn = x(tn), (4) em que tn = n∆t. 4.2.1 Função de Autocorrelação - FA A função de autocorrelação, denotada por A(τ), da série temporal dada em (4), é definida por A(τ) = 1 N − τ N−τ ∑ n=1 (xn − x̄)(xn+τ − x̄) σ2 , (5) em que N é o número de pontos da série temporal, x̄ = 1 N ∑N n=1 xn sua média amostral e σ2 = 1 N−1 ∑N n=1(xn − x̄)2 sua variância amostral. Esta função representa a média do produto dos valores da série temporal xn nos instantes t e t + τ∆t e indica por quanto tempo o valor da série temporal no instante t depende de seus valores prévios. Em outras palavras, A(τ) mede o grau de semelhança existente na série temporal à medida que o tempo passa. Por meio da função de autocorrelação podemos também medir a regulari- dade ou irregularidade de uma série temporal. Se a série temporal xn é aperiódica ou quase-periódica a função de autocorrelação A(τ) permanece diferente de zero quando o tempo (ou τ) tende ao infinito. Já, A(τ) de uma série periódica é igualmente periódica, pois a série temporal volta a se parecer consigo mesma após o intervalo de tempo correspondente ao peŕıodo. Para séries caóticas, A(τ) → 0 quando τ → ∞, ou seja, a semelhança da série temporal consigo mesma diminui com o tempo e acaba por desaparecer completamente (Ferrara & Prado, 1994). A Figura 4 apresenta os gráficos da função de autocorrelação, chamado de correlograma, obtidos da análise das séries temporais experimentais da frequência card́ıaca composta de 1000 pontos; no item (a) de um jovem saudável e no item (b) de um doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. Nestes gráficos calculamos 500 coeficientes de autocorrelação. 30 0 50 100 150 200 250 300 350 400 450 500 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 tempo au to co rr el aç ão Função de Autocorrelação (a) função de autocorrelação de um jovem saudável 0 50 100 150 200 250 300 350 400 450 500 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 tempo a ut oc or re la çã o Função de Autocorrelação (b) função de autocorrelação de um doente Figura 4: Função de autocorrelação obtida da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos; no item (a) de um jovem saudável e no item (b) de um doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. Nestes gráficos calculamos 500 coeficientes de autocorrelação. Em outras palavras, pode-se dizer que a função de autocorrelação mede o grau de correlação de uma variável, em um dado instante, consigo mesma, em um instante de tempo posterior, permitindo assim analisar o grau de irregularidade da série temporal experimental em questão. É importante notar que a função de autocorrelação de um sinal multi- periódico com muitas frequências independentes e incomensuráveis também se con- 31 funde com aquela de um sinal caótico, e desta forma a análise de séries temporais experimentais, com base apenas na função de autocorrelação fica comprometida, sendo necessárias outras medidas de caos para uma melhor análise das mesmas. 4.2.2 Gráfico de Poincaré O gráfico de Poincaré, também chamado de mapa de retorno, é um gráfico traçado a partir dos pontos xn da série temporal dada em (4). Para isto, utiliza-se a série temporal, xn sendo que o eixo x corresponde aos valores de xn e o eixo y aos valores de xn+1; assim um ponto do gráfico de Poincaré é dado pelo par ordenado (xn, xn+1). Ao traçar o gráfico de pares ordenados (xn, xn+1) obtemos um conjunto de pontos, conforme ilustrado nos gráficos (a) e (b) da Figura 5, que mostram os gráficos de Poincaré obtidos das séries temporais experimentais da frequência card́ıaca com- posta de 1000 pontos; no item (a) de um jovem saudável e no item (b) de um doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra popula- cional total estudada. A análise do gráfico de Poincaré pode ser feita qualitativa ou quanti- tativamente. Qualitativamente, a forma do gráfico é uma caracteŕıstica essencial, podendo-se dizer que uma nuvem de pontos mais concentrada é indicativo de que a série temporal correspondente é de um indiv́ıduo que apresenta alguma patologia, enquanto que se os pontos apresentarem-se dispersos então a série temporal é de um indiv́ıduo que apresenta comportamento saudável (Acharya et al., 2006; Kitlas et al., 2005; Lerma et al., 2003). 32 500 1000 1500 500 600 700 800 900 1000 1100 1200 1300 1400 1500 RR(n) R R (n + 1) Gráfico de Poincaré (a) gráfico de Poincaré de um jovem saudável 500 1000 1500 500 600 700 800 900 1000 1100 1200 1300 1400 1500 RR(n) R R (n + 1) Gráfico de Poincaré (b) gráfico de Poincaré de um doente Figura 5: Gráfico de Poincaré obtido da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos; no item (a) de um jovem saudável e no item (b) de um doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. No eixo x temos o intervalo RRn e no eixo y o intervalo RRn+1. Já, para a análise quantitativa do gráfico de Poincaré, inicialmente calcula-se o desvio padrão da série temporal dada em (4) de acordo com a equação SD = √ x̄2 n − x̄2. (6) Em seguida, calcula-se o desvio padrão das sucessivas diferenças da série temporal dada em (4) de acordo com a expressão 33 SDSD = √ ∆̄x2 n − ∆x̄2, (7) em que ∆xn = xn − xn+1, x̄ é a média dos valores da série temporal xn. O ı́ndice SD1 é dado por (SD1)2 = 1 2 (SDSD)2 (8) e o ı́ndice SD2 é dado por (SD2)2 = 2(SD)2 − 1 2 (SDSD)2. (9) Na análise de séries temporais experimentais da frequência card́ıaca, o ı́ndice SD1 reflete a variabilidade instantânea de batimento a batimento da frequência card́ıaca; determina a largura da elipse e representa a atividade card́ıaca paras- simpática, enquanto que o ı́ndice SD2 reflete a variabilidade cont́ınua de batimento a batimento; determina o comprimento da elipse e representa a atividade card́ıaca global (Acharya et al., 2004a, 2006; Ahamed et al., 2009; Arzeno et al., 2007; Behnia et al., 2008). 4.2.3 Detrended Fluctuation Analysis - DFA Segundo (Eckmann et al., 1987) o método DFA é uma técnica para deter- minar a correlação existente em séries temporais estacionárias ou não estacionárias. Na área biomédica, o ı́ndice obtido pelo método DFA, tem sido aplicado em diferentes situações, como por exemplo, em sequências de DNA, comportamento de neurônios e no estudo da VFC (Echeverŕıa et al., 2003). De acordo com a literatura (Acharya et al., 2004a; Mansier et al., 1996), quando um curto intervalo RR é seguido por outro curto intervalo, denomina-se correlação de curta duração; quando um longo intervalo é seguido por outro longo intervalo denomina-se correlação de longa duração. Esta medida foi desenvolvida principalmente para caracterizar flutuações em escalas, isto é, em séries temporais experimentais de tamanhos diferentes. De 34 acordo com a coerência de similaridade em um conjunto de escalas temporais este método calcula ı́ndices denominados de coeficientes α, expoente de escala ou fator de autossimilaridade. Assim, a DFA é utilizada na detecção de anormalidades presentes em certo paciente, baseando-se em coeficientes α (Kitlas et al., 2005). A técnica DFA consiste em dividir uma série temporal em janelas de diferentes tamanhos. Para cada tamanho de janela, um coeficiente α é calculado. Primeiro, supondo uma série temporal x(t), calcula-se y(k) = k ∑ t=1 [x(t) − x̄], (10) em que x̄ é a média dos valores da série temporal x(t). A seguir, a série temporal integrada, y(k), é dividida em janelas de com- primentos iguais a n. Como nem sempre é posśıvel dividir os N pontos da série temporal em janelas de tamanho n, utilizamos um N∗, aproximado, de forma que N∗ seja múltiplo de n e tal que N∗ ≤ N . Para cada yn(k) calcula-se (10). Assim, para cada janela obtém-se F (n), ou seja, a flutuação média da série temporal em diferentes escalas de comprimento n, dada pela equação: F (n) = √ √ √ √ 1 N∗ N∗ ∑ k=1 [y(k) − yn(k)]2. (11) Geralmente, o valor de F (n) aumenta conforme o valor de n aumenta e estes valores estão relacionados para que seja calculado o coeficiente α. Este coefi- ciente α é determinado pela inclinação da reta log(F (n))× log(n), conforme expresso por: α = ∆ log(F (n)) ∆ log(n) . (12) De acordo com a literatura (Acharya et al., 2006), o coeficiente α pode ser classificado de acordo com a Tabela 1. 35 Tabela 1: Classificação para os valores do coeficiente α obtidos pelo método DFA. Valor de α Classificação α = 0, 5 rúıdo Browniano (integral de rúıdo branco) 1 < α < 1, 5 diferentes tipos de rúıdo α = 1 rúıdo 1 f 0, 5 < α < 1 valores grandes são seguidos por valores grandes e vice-versa α = 0, 5 rúıdo branco 0 < α < 0, 5 valores grandes são seguidos por valores pequenos e vice-versa Quando 0, 5 ≤ α ≤ 1 há um ind́ıcio da presença de correlação de longa duração. Em relação a área da saúde, α = 1 ou próximo de 1, indica a normalidade do sistema card́ıaco representado pela série temporal experimental da frequência card́ıaca; este valor aumenta em indiv́ıduos que apresentam alguma patologia. Usualmente, dois diferentes ı́ndices α1 e α2 podem ser calculados através do método DFA (Perfetto et al., 2006). O ı́ndice α1 é obtido para n ≤ 16 e o ı́ndice α2 é obtido para n ≥ 16. De acordo com a literatura, baixos coeficientes α1 e altos coeficientes α2 indicam anormalidades no sistema dinâmico que descreve a VFC (Perfetto et al., 2006). A Figura 6 apresenta o gráfico DFA com os coeficientes α obtidos pelo método DFA da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um jovem saudável tomado como exemplo dentre os 86 jovens saudáveis que compõem a amostra populacional estudada No software (Software, 2009a) usado para o cálculo dos coeficientes α, a inclinação α1 é obtida da ordem de 4 ≤ n ≤ 16 e reflete as flutuações de intervalos de batimentos curtos; enquanto que a inclinação α2 é obtida da ordem de 16 ≤ n ≤ 64 e reflete as flutuações de intervalos de batimentos longos. 36 Figura 6: Gráfico DFA obtido da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um jovem saudável tomado como exemplo dentre os 86 jovens saudáveis que compõem a amostra populacional estudada. No eixo x temos log(n) e no eixo y temos log(F (n)) expressos em batimentos card́ıacos. 4.2.4 Reconstrução do Espaço de Fase - REF Uma série temporal experimental não expressa todas as variáveis de es- tado do sistema e, usualmente, tem-se dispońıvel a evolução no tempo de apenas uma variável x(t), que representa uma das componentes da trajetória de um dado sistema dinâmico m-dimensional. Supondo-se que a variável x(t) corresponde a uma das coordenadas de um sistema dinâmico m-dimensional, é interessante analisar o sistema dinâmico completo a partir dessa série temporal unidimensional, o que é feito a partir de técnicas de reconstrução do espaço de fase. A ideia básica da reconstrução do espaço de fase está calcada no fato de que a evolução temporal de um sinal unidimensional contém informações sobre as variáveis de estado não observáveis, que podem ser usadas para prever um estado futuro. Uma das técnicas de reconstrução do espaço de fase é baseada no Teorema da Imersão de Takens (Takens, 1980). Este teorema permite reconstruir um espaço de fase m-dimensional similar ao espaço de fase original, a partir de uma única variável 37 de estado, a variável medida. O espaço reconstrúıdo apresenta uma suave variação de coordenadas em relação ao espaço original, porém preservando os invariantes geométricos do sistema, tais como a dimensão do atrator e os expoentes de Lyapunov. Por exemplo, utilizando-se o Teorema de Takens, o atrator de Lorenz, que é um conjunto de pontos (x(t), y(t), z(t)) no R 3, pode ser reconstrúıdo a par- tir de apenas uma das coordenadas, x(t) ou y(t) ou z(t). De fato, cada uma das coordenadas guarda em si as caracteŕısticas topológicas do atrator de Lorenz. A primeira tentativa de reconstruir um atrator caótico por meio da evolução de uma única variável de estado foi realizada por Packard em (Packard et al., 1980) usando o método das derivadas. Eles mostraram que, nesse novo espaço, a figura geométrica que caracteriza o comportamento assintótico do sistema é topo- logicamente equivalente ao atrator caótico original. Tal figura é chamada de atrator reconstrúıdo. Este método das derivadas corresponde ao primeiro método utilizado na reconstrução do espaço de fase. Neste método, as coordenadas são aproximações numéricas das derivadas de ordem sucessivamente superiores de uma variável medida, ou seja, ẋ(t) ≈ x[t0 + (n + 1)∆t] − x[t0 + n∆t] ∆t , (13) em que x[t0 + n∆t] representa a série temporal experimental, n = 1, 2, ..., N é o número total de amostras e ∆t é o intervalo de tempo entre duas amostras. Uma vantagem do uso das coordenadas derivativas é o seu significado f́ısico palpável. Por outro lado, sua principal desvantagem é a sensibilidade ao rúıdo. Apresentaremos, a seguir, o método de Takens, o qual é o método mais utilizado na literatura para a reconstrução do espaço de fase a partir de séries temporais experimentais. Método de Takens O método de Takens ou técnica da defasagem no tempo foi proposto 38 inicialmente por Ruelle (Ruelle & Takens, 1971) e Packard (Packard et al., 1980) e posteriormente por Takens (Takens, 1980). Takens provou que, no espaço de fase formado pelos eixos x(t), x(t + p), x(t + 2p), ..., x(t + (m − 1)p), o atrator reconstrúıdo é topologicamente equivalente ao atrator “real”, sobre o qual se conhece apenas a evolução em tempo discreto da variável de estado x(t). Na sua prova, Takens assumiu que a série temporal experimental é for- mada por infinitos pontos e que não há rúıdo. Se essas condições são satisfeitas, as propriedades topológicas do atrator reconstrúıdo são preservadas. Neste método, chamamos de espaço de imersão o espaço no qual realiza-se a reconstrução, m a dimensão de imersão e p o passo da reconstrução ou tempo de atraso. Assim, a cada instante ti, assinala-se o ponto de coordenadas x(ti), x(ti + p), x(ti + 2p), ..., x(ti + (m − 1)p) no espaço de imersão. Variando-se i de 1 a N , obtém-se a trajetória reconstrúıda. Supondo que ~ξa represente a posição do ponto no espaço de imersão no instante ta, a trajetória reconstrúıda é formada pela sequência: ~ξa = (x(ta), x(ta + p), x(ta + 2p), ..., x(ta + (m − 1)p)), em que a = 1, ..., M . As constantes m, p, N , M relacionam-se por N = M+(m−1)p. Assumindo que a série temporal é o resultado de um processo deter- mińıstico, cada ~ξa+1 é o resultado de um mapeamento desconhecido, M(~ξa), ou seja, ~ξa+1 = M(~ξa). Neste método o mais dif́ıcil é selecionar o tempo de atraso p e a dimensão de imersão m adequados. Veremos, a seguir, como escolher o tempo de atraso e a dimensão de imersão corretos para a reconstrução do espaço de fase. A escolha do tempo de atraso 39 Takens (Takens, 1980) demonstrou que para um número infinito de pontos e na ausência de rúıdo a escolha do tempo de atraso p é na grande maioria dos casos arbitrária. Entretanto, as séries temporais experimentais são finitas, usualmente contaminadas com rúıdo externo e obtidas com o uso de filtros. Deste modo, a escolha do tempo de atraso é importante para a reconstrução correta do espaço de fase. Nos primeiros trabalhos sobre a reconstrução do espaço de fase, a série temporal, x(t), era traçada em função de x(t+1), ou seja, usava-se o tempo de atraso p = 1. Um problema imediato dessa abordagem é a alta correlação existente entre x(t) e x(t + 1), fazendo com que o espaço de fase torne-se fortemente alinhado na direção (1, 1), ou seja, apresentando uma defasagem pequena e causando resultados distorcidos. Por outro lado, se o valor do tempo de atraso for muito grande, a distância entre os dados considerados na formação do vetor de defasagem é grande, tornando os vetores desconectados ou não correlacionados (Acharya et al., 2004b). Portanto, se o tempo de atraso p for muito pequeno x(t), x(t + p) e x(t + 2p), por exemplo, terão praticamente o mesmo valor. Como consequência, o atrator reconstrúıdo fica comprimido em torno da diagonal x = y = z, já que ~ξ1 ≃ ~ξ2 ≃ ~ξ3, ou seja, esse atrator apresentará uma dependência linear, que não ocorre nas componentes reais x, y e z. Por outro lado, como a trajetória real está restrita a um volume finito do espaço de fase, o tempo de atraso p não pode ser muito grande, sob pena dos vetores reconstrúıdos ~ξi serem completamente não correlacionados, cobrindo todo o espaço de fase. Apresentamos, a seguir, o método da informação mútua média. Este método é o mais utilizado, de acordo com a literatura (Vuksanovic & Gal, 2005), para a escolha correta do tempo de atraso usado na reconstrução do espaço de fase. 40 Método da Informação Mútua Média A teoria da informação procura identificar o quanto de informação se pode ter de uma medida realizada em um determinado tempo t, quando observa-se outra medida, da mesma série, em um tempo posterior (t + p). Façamos uma breve descrição deste método. Para isto imagine dois sis- temas Sa e Sb, com sai e sbj sendo as medidas de uma determinada variável em cada um dos sistemas. Considerando que exista uma distribuição probabiĺıstica que governa as possibilidades de medições em cada sistema, a quantidade de informação, em bits, que é identificada através da medição sai sobre a medição sbj é dada pelo argumento da teoria da informação (Savi, 2006), I(sai, sbj) = log2 ( Γb(sai, sbj) Γb(sai)Γb(sbj) ) , (14) em que Γb(sai) é a probabilidade da medida sai, Γb(sbj) é a probabilidade da medida sbj , Γb(sai, sbj) é a probabilidade da medida combinada de sai e sbj, e I(sai, sbj) é chamada de informação mútua das medidas sai e sbj . A informação mútua média corresponde à média sobre todas as posśıveis medições de Γb(sai, sbj). Esta informação fornece as mesmas informações que a função de autocorrelação fornece em sistemas lineares sendo, pois, uma generalização para sistemas não-lineares. A mesma análise pode ser considerada para uma série temporal experi- mental x(t). Desta forma, x(t) corresponde a Sa e a série temporal defasada, x(t+p), corresponde a Sb. Com isso escreve-se, I(p) = ∑ Γb(x(t), x(t + p)) log2 ( Γb(x(t), x(t + p)) Γb(x(t))Γb(x(t + p)) ) , (15) em que Γb(x(t)) é a probabilidade da medida x(t), Γb(x(t + p)) é a probabilidade da medida x(t + p), Γb(x(t), x(t + p)) é a probabilidade da medida combinada de x(t) e x(t + p) e I(p) ≥ 0. As informações mútuas médias não são funções das variáveis x(t) e x(t + 41 p), mas sim, de um funcional da probabilidade combinada de x(t) e x(t+ p). Se x(t) e x(t + p) são iguais, então I(p) é máximo. Por outro lado, se x(t) e x(t + p) são completamente independentes, então o argumento do termo logaŕıtmico é a unidade e I(p) = 0. De acordo com (Fraser, 1989), o valor do tempo de atraso correto para a reconstrução do espaço de fase corresponde ao primeiro mı́nimo local, quando este existir, da função de informação mútua média I(p). Desta forma, ao traçar I(p)×p, o melhor tempo de atraso corresponde ao valor de p no primeiro mı́nimo local. Com isso, garante-se que o espaço de fase reconstrúıdo seja topologicamente equivalente ao espaço de fase do sistema dinâmico original. A Figura 7 apresenta os gráficos da informação mútua média obtidos da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. 42 0 2 4 6 8 10 12 14 16 18 20 0 0.5 1 1.5 2 2.5 3 tempo de atraso (unidades) In fo rm aç ão M út ua M éd ia ( bi ts ) Informação Mútua Média (a) informação mútua média de um jovem saudável 0 2 4 6 8 10 12 14 16 18 20 0 0.5 1 1.5 2 2.5 3 tempo de atraso (unidades) In fo rm aç ão M út ua M éd ia ( bi ts ) Informação Mútua Média (b) informação mútua média de um doente Figura 7: Informação Mútua Média obtida da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. No eixo x temos o tempo de atraso p (em unidades) e no eixo y temos a Informação Mútua Média dada por I(p) (em bits). 43 A escolha da dimensão de imersão Existem três métodos utilizados para determinar a dimensão mı́nima de imersão, m: o método da saturação de algum invariante do sistema; a decomposição em valores singulares (SVD) e o método das falsas vizinhanças ou método dos falsos vizinhos (Savi, 2006). O método usado neste trabalho foi o método dos falsos vizinhos próximos, o qual é o mais indicado de acordo com a literatura estudada (Savi, 2005). Vejamos como ele funciona. Método dos Falsos Vizinhos O método dos falsos vizinhos foi desenvolvido baseado na busca de uma dimensão de imersão mı́nima onde não ocorra cruzamento de órbita consigo mesma. Assim, avalia se um vizinho é “verdadeiro” ou “falso” apenas em virtude da projeção do sistema em uma determinada dimensão (Savi, 2006). Geometricamente, um falso vizinho é um ponto da série temporal que só corresponde a um vizinho devido a observação das órbitas em um espaço de fase muito pequeno, d < m, onde d é a dimensão do espaço de fase e m é a dimensão de imersão do espaço de fase reconstrúıdo. Quando o espaço está imerso em uma dimensão d ≥ m, todos os pontos vizinhos de todas as órbitas são vizinhos verdadeiros. Teoricamente, um falso vizinho é definido como um ponto pertencente a trajetória de uma série temporal e que aparenta ser vizinho de um outro ponto da série, mas não é. Isto ocorre quando existem cruzamentos na órbita de pontos na série em uma dada dimensão; caso a mesma série seja representada em uma dimensão maior o cruzamento de sua órbita pode deixar de existir e consequentemente os falsos vizinhos não existirão mais. O processo de reconhecimento e contagem de falsos vizinhos são feitos por meio da observação da presença ou não de falsos vizinhos em virtude da projeção do sistema em uma determinada dimensão, sendo que quando o número de falsos vizinhos cai a zero é um indicador de que o atrator foi reconstrúıdo em uma dimensão 44 de imersão correta. O método é aplicado em uma série temporal experimental da seguinte forma: dado um ponto da série temporal, xi e seu vizinho mais próximo xj observa- se a distância, Lmk(i) em uma dimensão de imersão mk com m0 = 1; caso esta distância, L2 mk (i) aumente muito em relação à Lmk (i) quando representa-se o atrator em uma dimensão maior, mk + 1, o ponto xj é um falso vizinho. A equação (16) apresenta o teste de verificação de falsos vizinhos próximos: [ L2 mk+1(i) − L2 mk (i) L2 mk (i) ] > L, (16) em que L é a distância real entre o ponto xi e cada vizinho canditado xj , observada quando não há cruzamento de órbitas; Lmk (i) é a distância entre um ponto e seu vizinho e mk é a dimensão de imersão. A Figura 8 apresenta os gráficos dos falsos vizinhos obtidos da análise da série temporal experimental da frequência card́ıaca composta de 1000 pontos de um (a) jovem saudável e (b) doente, tomados como exemplo dentre os 88 voluntários que compõem a amostra populacional total estudada. O eixo x representa a dimensão de imersão e o eixo y o número de falsos vizinhos. Note, da Figura 8, que a dimensão de imersão correta para a reconstrução do espaço de fase das séries temporais exper- imentais da frequência card́ıaca dos 86 jovens saudáveis é m = 5. 45 1 1.5 2