LIGIA FLÁVIA ANTUNES BATISTA Modelagem espaço-temporal da colonização de macrófitas submersas no Reservatório de Taquaruçu Presidente Prudente - SP 2011 LIGIA FLÁVIA ANTUNES BATISTA Modelagem espaço-temporal da colonização de macrófitas submersas no Reservatório de Taquaruçu Tese apresentada ao Programa de Pós- graduação em Ciências Cartográficas, da Universidade Estadual Paulista Júlio de Mes- quita Filho, Campus de Presidente Prudente, como parte dos requisitos para obtenção do título de Doutor em Ciências Cartográficas. Orientador: Prof. Dr. Nilton Nobuhiro Imai Co-orientador: Prof. Dr. Edivaldo D. Velini UNIVERSIDADE JÚLIO DE MESQUITA FILHO (UNESP) FACULDADE DE CIÊNCIAS E TECNOLOGIA Presidente Prudente - SP 2011 DEDICATÓRIA Ao Luisinho, pelo amor, paciência e compreensão nos momentos difíceis. Aos meus pais: Orlando, que despertou em mim o prazer pela pesquisa e Vera, de quem herdei o gosto pelos números. À vó Tina (in memorian), que um dia disse que eu seria professora. Ao vô Chicão (in memorian), por me encorajar e incentivar. AGRADECIMENTOS A Deus, por ter me guiado para o caminho certo, na hora exata, abrindo portas em toda minha vida. Aos meus pais, pelo incentivo, dedicação e compreensão. Ao meu amor Luisinho, que sempre esteve ao meu lado durante esta trajetória, disposto a conversas que me faziam encontrar as soluções. Ao prof. Imai, pela amizade e orientação, pois acreditou em mim e me apresentou um projeto desafiador, dando liberdade para realização do trabalho e entendendo o meu ritmo. À profa. Maria de Lourdes, por todas as sugestões e contribuições. Ao prof. Maurício Galo, sempre disposto a auxiliar. Ao prof. Tommaselli, primeiro a me apresentar o programa de Pós-graduação. Ao Luiz Henrique Rotta e à Fernanda Watanabe, pela ajuda imensurável em todos os trabalhos de campo, sugestões e auxílios de toda ordem. Sem vocês este trabalho não teria sido realizado. Ao grupo de estudos da água (GeoSRQA) e aos amigos Letícia Sabo, Lauriana, Tiago Samizava. Às amigas que compartilharam dos momentos difíceis e se dispuseram a ouvir mi- nhas lamentações, Tati Dal Bosco, Elaine Ferruzzi, Adriana Borssoi. Ao PPGCC, pela oportunidade de realizar este projeto e apoio para participação em eventos científicos. A todos os funcionários da FCT/UNESP que de forma direta ou indireta contribuíram para a realização desse trabalho. Aos funcionários do condomínio Pousada do Paranapanema, em particular o bar- queiro Valmiro, sempre prestativo. À UTFPR, pelo afastamento concedido no último ano do doutorado. EPÍGRAFE O entendimento dos símbolos e dos rituais (simbólicos) exige do intérprete que possua cinco qualidades ou condições, sem as quais os símbolos serão para ele mortos, e ele um morto para eles. A primeira é a simpatia (...) A segunda é a intuição (...) A terceira é a inteligência (...) A quarta é a compreensão (...). Não direi erudição, como poderia ter dito, pois a erudição é uma soma; nem direi cultura, pois a cultura é uma síntese; e a compreensão é uma vida. (...) A quinta é a menos definível. Direi talvez, falando a uns, que é a graça, falando a outros, que é a mão do Superior Incógnito, falando a terceiros, que é o Conhecimento e a Conversação do Santo Anjo da Guarda, entendendo cada uma destas coisas, que são a mesma da maneira como as entendem aqueles que delas usam, falando ou escrevendo. Fernando Pessoa Resumo Este trabalho propõe um modelo espaço-temporal para o desenvolvimento de macrófitas sub- mersas no reservatório de Taquaruçu, rio Paranapenama, no município de Santo Inácio, estado do Paraná. A abordagem de construção do modelo é teórico-empírica, baseada em dados. O es- tudo da vegetação submersa é relevante pois a sua proliferação excessiva acarreta desequilíbrio ecológico e prejuízos econômicos para usinas hidrelétricas. Foram realizados dez levantamen- tos de campo no reservatório de Taquaruçu, rio Paranapenama. Utilizou-se a técnica hidroa- cústica para mapear a vegetação e a profundidade e foram adquiridas medidas limnológicas. A análise exploratória mostrou grande redução da infestação de 2009 para 2010, justificada pela intensa precipitação ocorrida no período. Constatou-se regiões de crescimento e decaimento da vegetação, heterogeneamente distribuídas no espaço e no tempo. O modelo gerado divide-se em: modelo pontual, determinístico, que descreve o crescimento vertical da vegetação, inde- pendente da vizinhança e modelo probabilístico, para estimar a propagação da vegetação em área. O modelo pontual foi baseado no modelo logístico, caracterizado pela curva sigmoidal. As variáveis utilizadas foram profundidade e coeficiente de atenuação. Os coeficientes do mo- delo foram calibrados com algoritmos genéticos, com a utilização de 18 pontos, coletados entre abril e agosto de 2010. Os dados de entrada deste modelo foram gerados com interpolação por krigeagem ordinária e resolução de 3 m. Na etapa de validação utilizou-se de 12 pontos, em que avaliou-se a estatística descritiva dos resíduos, índices de qualidade de ajustamento, análise grá- fica da tendência temporal e regressão linear entre dados observados e estimados pelo modelo. A raiz do erro médio quadrático encontrada na etapa de validação foi de 0.02 m e o resíduo máximo foi de 0.04 m (crescimento máximo de 0.1 m), com boa representação da tendência temporal. Testes com maior massa de dados, representativos de toda a área, foram aplicados para: dados interpolados com média ponderada e resolução de 2m; krigeagem ordinária, com resoluções de 1m e 3m. O percentual de dados com resíduo menor que 0.04 m nestes testes variou de 37 a 43 %. O modelo probabilístico foi construído a partir da aplicação da abordagem de pesos de evidência, com as variáveis de altura da coluna d’água, declividade e número de vizinhos colonizados. A coluna d’água mostrou-se favorável à colonização até o valor de 6 m. O número de vizinhos com influência positiva sobre a propagação da vegetação variou de 3 a 6. A declividade apresentou variação de comportamento no tempo. Simulações espaço-temporais foram realizadas com a plataforma TerraME, unindo o modelo pontual e o probabilístico. Fo- ram simulados três cenários em períodos de 6 meses, em que pode-se observar aumento em área de 18 a 27%. Palavras-chave: reservatórios, infestação, calibração, validação, análise de incerteza, análise de sensibilidade, pesos de evidência, TerraME. Abstract The focus of this work is to design a spatiotemporal model of submerged macrophyte develop- ment. The model developing approach is empirical, based on field data. The study of submerged vegetation is important due to its excessive proliferation, which causes ecological unbalance and economical losses to hydroelectric power plants. Ten field surveys were made in Taqua- ruçu reservoir, Paranapanema river. Hydroacoustic techniques were used to map the vegetation and depth, and limnological measurements were made. Exploratory analysis showed a great infestation reduction from 2009 to 2010, probably caused by the precipitation volume which occurred in that time. Macrophyte growth and decay regions were distributed in space and time in a heterogeneous way. The model produced is divided in: local model, deterministic, which describes the vertical vegetation growth, without neighborhood influence; and the probabilistic model, which estimates the macrophyte propagation in area. The local model was based on the logistic model whose curve is sigmoidal. The variables used were depth and attenuation co- efficient. Model coefficients were calibrated with genetic algorithms, with 18 points collected between April and August 2010. Input data were generated with ordinary kriging interpolation and a resolution of 3 m. In the validation phase 12 points were used and descriptive statistics of residual, goodness-of-fit indexes, temporal trend and linear regression were evaluated between observed and predicted data. The root mean square error obtained in the validation phase was 0.02 m and the maximum residual was 0.04 m (maximum growth of 0.1 m), and a good repre- sentation of the temporal trend. Tests with massive data sets, gotten from the whole area were applied. The input data to these tests were interpolated with: inverse distance weighted method and 2 m resolution; or ordinary kriging with 1 m and 3 m resolutions. The data percentage with residual below of 0.04 m ranged from 37 to 43 %. The probabilistic model was designed using the weights of evidence approach, with the variables water column height, slope and number of neighbors colonized by macrophytes. The water column variable was favorable to the coloni- zation until 6 m. The number of neighbors with plants that was favorable to colonization varied from 3 to 6. Slope presented a changing behavior along time. Spatiotemporal simulations were made with TerraME platform, by joining the local and the probabilistic models. Three situati- ons in a period of 6 months were simulated. Colonized area increased from 18 to 27% in these simulations. Keywords: reservoirs, infestation, calibration, validation, uncertainty analysis, sensitivity analy- sis, weights of evidence, TerraME. Lista de Figuras 1 Esquema de a bordagem clássica do processo de modelagem . . . . . . . . . . 29 2 Elementos básicos dos diagramas de Odum. Fonte: (ODUM, 1994) . . . . . . 31 3 Diagrama formulado com a linguagem de fluxos de energia de Odum . . . . . . 32 4 Passos do algoritmo genético . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 5 Exemplo de curva logística de crescimento populacional . . . . . . . . . . . . 40 6 Exemplo de possíveis comportamentos de sistema de duas populações . . . . . 43 7 Tipos de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 8 Principais definições de vizinhança . . . . . . . . . . . . . . . . . . . . . . . . 46 9 Autômatos celulares aninhados . . . . . . . . . . . . . . . . . . . . . . . . . . 47 10 Amostragem de biomassa de macrófitas pelo método do quadro . . . . . . . . . 48 11 Diagrama de espalhamento de Moran . . . . . . . . . . . . . . . . . . . . . . 51 12 Parâmetros do semivariograma . . . . . . . . . . . . . . . . . . . . . . . . . . 53 13 Ecograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 14 Cálculos realizados pelo ecobatímetro . . . . . . . . . . . . . . . . . . . . . . 63 15 Principais tipos de macrófitas aquáticas . . . . . . . . . . . . . . . . . . . . . 66 16 Foto de um ramo de E. densa . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 17 Relação entre RFA e a produtividade primária bruta (PPB) de E. densa . . . . . 75 18 Probabilidade de ocorrência de E. najas e E. densa em função de kt, em Itaipu . 76 19 Exemplos de leituras com disco de Secchi . . . . . . . . . . . . . . . . . . . . 77 20 Probabilidade de ocorrência de E. najas e E. densa, conforme profundidade de Secchi, em Itaipu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 21 Perfil vertical de temperatura de um lago estratificado . . . . . . . . . . . . . . 79 22 Variação da biomassa (mg) de E. najas em diferentes temperaturas . . . . . . . 79 23 Coeficiente de crescimento e tempo de duplicação de E. najas . . . . . . . . . 80 24 Produtividade primária bruta (PPB) de E. densa em relação a carbono inorgânico 82 25 Fotossíntese líquida de E. najas em função do pH . . . . . . . . . . . . . . . . 84 26 Vegetação submersa e perfil suave (acima) e íngreme (abaixo) de declividade . 86 27 Carta imagem do reservatório de Taquaruçu . . . . . . . . . . . . . . . . . . . 95 28 Método proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 29 Transectos percorridos pelo barco durante os trabalhos de campo . . . . . . . . 100 30 Pontos de referência da área de estudo . . . . . . . . . . . . . . . . . . . . . . 102 31 Preparação do barco com a armação metálica . . . . . . . . . . . . . . . . . . 103 32 Polígonos e pontos de calibração e validação . . . . . . . . . . . . . . . . . . . 105 33 Estratégias de seleção de pontos para calibração . . . . . . . . . . . . . . . . . 106 34 Gráficos dos 9 agrupamentos da área toda . . . . . . . . . . . . . . . . . . . . 108 35 Recorte dos dados interpolados por krigeagem e variância (c5) . . . . . . . . . 110 36 Semivariogramas ajustados para AMD do campo 6 . . . . . . . . . . . . . . . 111 37 Semivariogramas ajustado para profundidade do campo 6 . . . . . . . . . . . . 111 38 Polígonos e pontos de calibração da krigeagem . . . . . . . . . . . . . . . . . 112 39 Gráfico de silhueta usado para determinar o melhor número de grupos . . . . . 113 40 Gráficos dos grupos gerados com os dados da krigeagem . . . . . . . . . . . . 114 41 Síntese do processo de calibração . . . . . . . . . . . . . . . . . . . . . . . . . 116 42 Ecobatímetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 43 Fotos adquiridas no campo c1 . . . . . . . . . . . . . . . . . . . . . . . . . . 119 44 Fotos adquiridas no campo c2 . . . . . . . . . . . . . . . . . . . . . . . . . . 120 45 Dados de precipitação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 46 Vazão do reservatório de Taquaruçu . . . . . . . . . . . . . . . . . . . . . . . 121 47 Fotos adquiridas no campo c3 . . . . . . . . . . . . . . . . . . . . . . . . . . 122 48 Fotos adquiridas no campo c4 . . . . . . . . . . . . . . . . . . . . . . . . . . 122 49 Esquema da validação da interpolação . . . . . . . . . . . . . . . . . . . . . . 124 50 Curvas de nível do modelo batimétrico . . . . . . . . . . . . . . . . . . . . . . 125 51 Modelo batimétrico 3D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 52 Boxplot dos dados espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 53 Boxplot de AMD por campo . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 54 Percentuais de crescimento e redução de macrófitas submersas (em área) . . . . 129 55 Fotos adquiridas no campo 10 . . . . . . . . . . . . . . . . . . . . . . . . . . 130 56 Cartas de crescimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 57 Série temporal dos dados de AMD interpolados por krigeagem (3m de resolu- ção, campos c4 a c8) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 58 Modelos 3D da altura média do dossel . . . . . . . . . . . . . . . . . . . . . . 137 59 Boxplot dos dados limnológicos . . . . . . . . . . . . . . . . . . . . . . . . . 138 60 Coeficiente de variação das variáveis limnológicas por levantamento de campo 139 61 Boxplot de kt por campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 62 Boxplot de temperatura da água por campo . . . . . . . . . . . . . . . . . . . . 141 63 Boxplot de AMD por faixa de profundidade e campo . . . . . . . . . . . . . . 141 64 Boxplot de altura média do dossel por faixa de coluna d’água e campo . . . . . 142 65 Variação de fotoperíodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 66 Correlação entre as variáveis espaciais . . . . . . . . . . . . . . . . . . . . . . 143 67 Correlação entre as variáveis limnológicas . . . . . . . . . . . . . . . . . . . . 144 68 Modelo conceitual de crescimento de macrófitas submersas . . . . . . . . . . . 146 69 Modelo conceitual simplificado do desenvolvimento de macrófitas submersas . 149 70 Boxplot dos dados de calibração (a, b, c) e validação (d, e, f) . . . . . . . . . . 150 71 Comparação dos pontos de validação para o modelo e observações . . . . . . . 152 72 Dispersão entre observados e estimados e reta de regressão . . . . . . . . . . . 152 73 Gráficos dos resíduos da regressão . . . . . . . . . . . . . . . . . . . . . . . . 153 74 Dispersão entre observados e estimados e reta de regressão (sem pontos 3 e 10) 154 75 Gráficos dos resíduos da regressão (sem pontos 3 e 10) . . . . . . . . . . . . . 155 76 Simulação do modelo 8 para dois valores de AMD . . . . . . . . . . . . . . . 155 77 Curvas dos coeficientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 78 Curvas dos coeficientes projetadas como parábolas . . . . . . . . . . . . . . . 156 79 Curvas dos coeficientes projetadas como senoidais . . . . . . . . . . . . . . . 157 80 Histogramas dos resíduos do crescimento simulado para as diferentes interpo- lações e resoluções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 81 Cartas dos resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 82 Dispersão entre observados e estimados para toda a área interpolada por média ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 83 Dispersão entre observados e estimados para a área interpolada por krigeagem com resolução de 1m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 84 Dispersão entre observados e estimados para a área interpolada por krigeagem com resolução de 3m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 85 Gráficos de espalhamento do teste de Moran . . . . . . . . . . . . . . . . . . . 168 86 Mapa indicador local de associação espacial para resíduos do intervalo c5-c6 . 169 87 Mapa indicador local de associação espacial para resíduos do intervalo c6-c7 . 170 88 Mapa indicador local de associação espacial para resíduos do intervalo c7-c8 . 171 89 Superfície de AMD em função da variação de profundidade e tempo . . . . . . 173 90 Superfície de AMD função do tempo e kt . . . . . . . . . . . . . . . . . . . . 175 91 Superfície de AMD em função da profundidade e kt (t = 30) . . . . . . . . . . 176 92 Superfície de AMD em função de k1 e k2 (t = 30) . . . . . . . . . . . . . . . . 177 93 Histograma das variáveis simuladas por Monte Carlo para o elemento amostral 12179 94 Histograma do crescimento simulado . . . . . . . . . . . . . . . . . . . . . . . 179 95 Boxplot do crescimento simulado (por ponto e intervalo de campo) . . . . . . . 180 96 Boxplot do REMQ por ponto . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 97 Intervalos de confiança - percentis 5 e 95 . . . . . . . . . . . . . . . . . . . . . 181 98 Probabilidade cumulativa do REMQ . . . . . . . . . . . . . . . . . . . . . . . 182 99 Boxplot dos dados de calibração (a-f) validação (g-l) da abordagem 1 . . . . . 185 100 Boxplot dos dados de calibração (a, b, c) e validação (d, e, f) da abordagem 2 . 186 101 Pontos de calibração e validação aplicados aos modelos 1 e 2 . . . . . . . . . . 188 102 Pontos de validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 103 Gráfico dos pesos da coluna d’água . . . . . . . . . . . . . . . . . . . . . . . . 195 104 Parte da evidência CVP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 105 Gráfico dos pesos de CVP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 106 Gráfico dos pesos da declividade . . . . . . . . . . . . . . . . . . . . . . . . . 198 107 Distribuição espacial das probabilidades calculadas com base nos pesos de evi- dência para c5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 108 Distribuição espacial das probabilidades calculadas com base nos pesos de evi- dência para c6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 109 Distribuição espacial das probabilidades calculadas com base nos pesos de evi- dência para c7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 110 Localização das áreas de simulação . . . . . . . . . . . . . . . . . . . . . . . 203 111 Algoritmo das simulações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 112 Simulação do cenário 1, com um ponto de vegetação . . . . . . . . . . . . . . 206 113 Probabilidades de colonização do cenário 1, com um ponto de vegetação . . . . 207 114 Simulação do cenário 2, com condição inicial de colonização igual a c5 . . . . 208 115 Probabilidades do cenário 2, com condição inicial em c5 . . . . . . . . . . . . 209 116 Simulação do cenário 3, com condição inicial de vegetação esparsa . . . . . . . 210 117 Probabilidades do cenário 2, com condição inicial em c5 . . . . . . . . . . . . 211 118 Gráficos dos dados de AMD da área de krigeagem . . . . . . . . . . . . . . . . 232 119 Gráficos dos dados de batimetria da área de krigeagem . . . . . . . . . . . . . 233 Lista de Tabelas 1 Constantes de crescimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 2 Dados do reservatório e usina de Taquaruçu . . . . . . . . . . . . . . . . . . . 94 3 Parâmetros dos modelos para interpolação de AMD por krigeagem ordinária . . 109 4 Parâmetros dos modelos para interpolação de profundidade por krigeagem or- dinária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 5 Dados dos trabalhos de campo e estatística descritiva da AMD . . . . . . . . . 118 6 Cálculos efetuados para definir parâmetros da interpolação por média ponderada 124 7 Estatística descritiva dos dados espaciais (dados em metros) . . . . . . . . . . 127 8 Estatística descritiva dos dados limnológicos . . . . . . . . . . . . . . . . . . . 138 9 Variáveis do modelo conceitual . . . . . . . . . . . . . . . . . . . . . . . . . . 150 10 Coeficientes obtidos pela calibração . . . . . . . . . . . . . . . . . . . . . . . 151 11 Estatística descritiva dos resíduos das validações . . . . . . . . . . . . . . . . . 151 12 Índices de qualidade de ajustamento dos resultados das validações . . . . . . . 151 13 Resultado da regressão entre observados e estimados . . . . . . . . . . . . . . 153 14 Resultado da regressão entre observados e estimados (sem pontos 3 e 10) . . . 154 15 Número de pontos e área utilizados nas simulações . . . . . . . . . . . . . . . 157 16 Percentuais de pontos com resíduo em módulo menor 0.04 m . . . . . . . . . 164 17 Percentuais de resíduo em módulo menor que a média (0.02) . . . . . . . . . . 165 18 Amplitude das variáveis calibradas e das outras áreas com resíduo menor que 0.02 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 19 Desvio padrão de cada ponto para kt, profundidade e AMD . . . . . . . . . . . 178 20 Variáveis do modelo conceitual . . . . . . . . . . . . . . . . . . . . . . . . . . 183 21 Características das abordagens de calibração . . . . . . . . . . . . . . . . . . . 184 22 Características dos modelos de calibração . . . . . . . . . . . . . . . . . . . . 185 23 Coeficientes obtidos pela calibração . . . . . . . . . . . . . . . . . . . . . . . 187 24 Estatística descritiva dos resíduos das validações . . . . . . . . . . . . . . . . . 187 25 Índices de qualidade de ajustamento dos resultados das validações . . . . . . . 188 26 Avaliação da dependência condicional entre as evidências . . . . . . . . . . . . 191 27 Probabilidades a priori e taxas de transição para cada intervalo de campo . . . . 193 28 Pesos e contrastes da coluna d’água por faixa de valores (v) . . . . . . . . . . . 194 29 Pesos e contrastes da evidência CVP por faixa de valores (v) . . . . . . . . . . 196 30 Pesos e contrastes de declividade por faixa de valores (v) . . . . . . . . . . . . 197 31 Combinações das condições, probabilidades posteriores, nascimentos preditos e observados para c5-c6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 32 Combinações das condições, probabilidades posteriores, nascimentos preditos e observados para c6-c7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 33 Combinações das condições, probabilidades posteriores, nascimentos preditos e observados para c7-c8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 34 Estatística descritiva das condições iniciais e finais de cada cenário de simulação 212 35 Áreas (m2) e volumes (m3) iniciais e finais de cada cenário de simulação . . . . 212 36 Estatística descritiva dos dados de AMD da área de aplicação da krigeagem . . 231 37 Estatística descritiva dos dados de batimetria da área de aplicação da krigeagem 231 38 Cálculos para comparção dos coeficientes dos modelos 5 e 8 . . . . . . . . . . 234 39 Pesos de evidência da variável batimetria . . . . . . . . . . . . . . . . . . . . 235 40 Pesos de evidência da variável distância da margem . . . . . . . . . . . . . . . 236 41 Pesos de evidência da variável distância do talvegue . . . . . . . . . . . . . . . 236 42 Pesos de evidência da variável SAV . . . . . . . . . . . . . . . . . . . . . . . 237 Lista de abreviaturas e siglas AMD Altura média do dossel CAR Conditional Autoregressive CE Condutividade elétrica CID Carbono Inorgânico Dissolvido CVP Contagem de vizinhos com plantas DBO Demanda Bioquímica de Oxigênio DM Dry mass DS Disco de Secchi ECH Effective Canopy Height EMA Erro médio absoluto EMQ Erro médio quadrático EUA Estados Unidos da América GPS Global Positioning System IIC Incerteza de Informação Conjunta INPE Instituto Nacional de Pesquisas Espaciais IO influência de outliers kt coeficiente de atenuação LISA Local Indicator of Spatial Association MNT Modelos Numéricos de Terreno MOD Matéria orgânica dissolvida MOP Matéria orgânica particulada NTU Nephelometric Turbidity Units OD Oxigênio Dissolvido PPB Produtividade Primária Bruta REMQ raiz do erro médio quadrático RFA Radiação Fotossinteticamente Ativa RGR Relative Growth Rate SAR Spatial AutoRegressive SAV Soma da AMD da vizinhança SAVEWS Submersed Aquatic Vegetation Early Warning System SEQ soma do erro quadrático SIG Sistemas de Informação Geográfica SONAR SOund NAvigation and Ranging TerraME Terra Modeling Environment TSS Total de Sólidos em Suspensão Zeu Zona Eufótica Sumário 1 INTRODUÇÃO 21 1.1 Objetivos e Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.2 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.3 Organização do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2 REFERENCIAL TEÓRICO 26 2.1 Modelagem Dinâmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.1.1 Fases da modelagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1.2 Modelo conceitual . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.1.3 Formalismo matemático . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.2 Calibração e Validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.3 Modelos de crescimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.4 Equilíbrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.5 Modelos de Espaço Celular . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.6 Autocorrelação Espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.7 Interpolação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.8 Probabilidades Condicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.9 Sensoriamento Remoto Hidroacústico . . . . . . . . . . . . . . . . . . . . . . 60 3 ECOLOGIA DE MACRÓFITAS 65 3.1 Fatores que influenciam o crescimento de macrófitas . . . . . . . . . . . . . . 68 3.1.1 Nutrientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.1.2 Energia eletromagnética . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.1.3 Temperatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.1.4 Oxigênio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 3.1.5 Carbono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.1.6 Condutividade elétrica . . . . . . . . . . . . . . . . . . . . . . . . . . 82 3.1.7 pH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.1.8 Morfometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 3.1.9 Vento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.1.10 Velocidade de corrente . . . . . . . . . . . . . . . . . . . . . . . . . . 87 3.2 Produtividade Primária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 3.3 Decomposição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 3.4 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 4 MATERIAIS E MÉTODOS 94 4.1 Área de Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4.2 Método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4.2.1 Aquisição de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.2.2 Processo de Calibração . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.3 Materiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 5 ANÁLISE EXPLORATÓRIA 118 5.1 Avaliação dos dados e superfícies . . . . . . . . . . . . . . . . . . . . . . . . 123 6 MODELAGEM PONTUAL 145 6.1 Modelagem conceitual e matemática . . . . . . . . . . . . . . . . . . . . . . . 145 6.2 Resultados do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 6.3 Comportamento do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 6.4 Testes em toda a área . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 6.5 Dependência espacial dos resíduos . . . . . . . . . . . . . . . . . . . . . . . . 167 6.6 Análise de Sensibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 6.7 Análise de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 7 OUTROS MODELOS AVALIADOS 183 8 MODELAGEM ESPACIAL 190 9 SIMULAÇÕES 202 10 CONCLUSÕES E RECOMENDAÇÕES 214 10.1 Recomendações e trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . 216 REFERÊNCIAS 218 Apêndice A -- Procedimento de integração 228 Apêndice B -- Código utilizado como função de adaptação dos algoritmos genéticos 229 Apêndice C -- Análise exploratória dos dados utilizados na krigeagem 231 Apêndice D -- Comparação entre resultados do modelo 5 e 8 234 Apêndice E -- Pesos de evidência 235 Apêndice F -- Código fonte da simulação 238 21 1 INTRODUÇÃO Com o desenvolvimento científico e tecnológico, o poder de processamento com- putacional passa a ser capaz de realizar bilhões de operações por segundo e manipular volumes gigantescos de dados. Com isso, pesquisas em diversas áreas que requerem tais recursos pude- ram ser executadas. Nesse contexto, cita-se a área de simulação, que por sua vez, depende de mode- lagem, sendo ambas importantes para compreensão e análise de fenômenos complexos, como leis da Física, além do desenvolvimento de habilidades, como aprendizagem de manipulação de equipamentos. Como exemplos tem-se simuladores de túnel de vento, importantes para a engenharia e simuladores de vôo, utilizados na aviação para treinamento de pilotos. Seja qual for a área de aplicação, as vantagens são diversas, como ampliação ou re- dução da escala do objeto de estudo, prevenção de acidentes, economia de recursos financeiros, entre outras. No que tange ao domínio de sistemas naturais, principalmente no caso de ecossis- temas, percebe-se a existência de alguns elementos complicadores. Como sistemas abertos, estão sujeitos à influência de muitas variáveis, algumas delas imprevisíveis, além da própria interferência antrópica. Quando o processo de modelagem é empírico e exige coleta de dados in situ, há ainda outras questões que o dificultam, seja de natureza logística ou climática, que podem prejudicar tanto a aquisição de dados quanto a própria modelagem, uma vez que o objeto de estudo pode se encontrar em condições atípicas, difíceis de serem modeladas. Novamente, argumenta-se que não só o desenvolvimento de computadores, mas também de tecnologias de aquisição remota de dados, tais como sensoriamento remoto orbital ou aerotransportado, sensores que emitem pulsos a laser, radar e sonar, facilitam o processo de modelagem empírica, que depende da qualidade dos dados. Muitos dos trabalhos de modelagem têm caráter estático, desenvolvidos com o in- tuito de explicar um cenário fixo. Tais tipos de trabalho são muito importantes e apresentam grande complexidade. Quando se trata de modelos dinâmicos de abrangência espacial, aplica- 22 dos a sistemas naturais, há que se reconhecer o desafio da empreitada de lidar com todas essas dimensões. É nesse cenário que este trabalho está inserido. O objeto de estudo são macrófitas submersas, plantas encontradas em diversos re- servatórios brasileiros, em muitos dos quais desenvolvendo-se de tal forma a assumir condição de infestação indesejável. O principal interesse desta investigação é justamente modelar e si- mular o crescimento deste tipo de vegetação. As macrófitas aquáticas em geral são importantes para: o processo de ciclagem de nutrientes; como abrigo para pequenos animais; são consideradas um bioindicador da quali- dade da água; além de contribuir com elevados aportes de matéria orgânica para os ecossistemas aquáticos, importante nas teias alimentares, tanto através da herbivoria como na forma de detri- tos (THOMAZ; ESTEVES, 2011). Assim, apresenta-se como um importante componente para o balanço de carbono (SILVA; COSTA; MELACK, 2010a). Dessa forma, percebe-se que as macrófitas desempenham papel considerável na manutenção do equilíbrio ecológico dos ecossistemas em que se encontram. Por outro lado, são consideradas daninhas em potencial (MONTEIRO; PEZZATO; HENRY-SILVA, 2003), pois podem se proliferar excessivamente. Diversos reservatórios brasileiros têm apresentado altos níveis de colonização, o que prejudica os usos múltiplos do corpo d’água, gerando grandes prejuízos econômicos, em virtude de acarretar a interrupção do processo de produção de energia elétrica. Especificamente no que se refere às macrófitas submersas, tem-se a dificuldade adi- cional de realizar monitoramento de sua população e com isso, delinear estratégias de controle. Em vista disso, considera-se relevante o desenvolvimento de modelos que descrevam a dinâmica do crescimento destas plantas, bem como sua simulação, a fim de aprimorar o conhecimento sobre a influência dos fatores ligados à infestação. 1.1 Objetivos e Hipóteses O objetivo geral do trabalho é modelar e simular a dinâmica espaço-temporal do crescimento de macrófitas submersas em uma área de reservatório de usina hidrelétrica de Ta- quaruçu, situado no rio Paranapanema. Enumera-se como objetivos específicos: a) Descrever o crescimento da altura dos dosséis com um modelo pontual, defi- nindo a representação conceitual e a formulação matemática; 23 b) Especificar o modelo probabilístico espacial que representa a colonização da vegetação em área; c) Projetar os modelos de espaço celulares para simulação do crescimento de ma- crófitas submersas, cujo desenvolvimento envolve a determinação: das escalas temporal e espacial; das variáveis de estado para cada célula; das regras de tran- sição de estado; d) Simular diferentes cenários a partir da união dos modelos pontual e probabilís- tico. A hipótese que norteia este trabalho é a possibilidade de desenvolver modelos espa- ciais dinâmicos para representar o crescimento de macrófitas submersas com dados de variáveis limnológicas e ecobatimétricas coletadas in situ. Associadas a essa hipótese, as seguintes questões científicas são propostas: a) Quais variáveis devem ser representadas no modelo e como selecioná-las? b) Quais as escalas de espaço e tempo descrevem adequadamente o fenômeno de crescimento das macrófitas? c) A estrutura de modelos de espaço celular mostra-se viável para simular compu- tacionalmente modelos espaço-temporais de macrófitas submersas? 1.2 Justificativa A importância de se realizar este trabalho, bem como sua relevância podem ser vi- sualizadas sob várias óticas. Por um lado, um modelo ecológico do crescimento de macrófitas submersas, baseado em dados limnológicos e ecobatimétricos, obtidos no habitat natural da planta, representa uma contribuição significativa, haja vista que muitos dos trabalhos realizados sobre crescimento de macrófitas utilizam experimentos controlados em laboratório ou produ- zem modelos baseados em técnicas de regressão linear, logística ou análise de correlação, que não consideram a dimensão espacial (HAKANSON; BOULION, 2002; WANG et al., 2005; BARENDREGT; BIO, 2003; BINI; THOMAZ, 2005). Do ponto de vista econômico, deve-se enfatizar que plantas submersas prejudicam expressivamente a geração de energia em reservatórios de usinas hidrelétricas, acarretando per- das econômicas, pois frequentemente faz-se necessário interromper a produção para retirar ex- cesso de vegetação que obstrui grades e turbinas das usinas. Em alguns casos não é necessário 24 parar a geração de energia. Pode-se fazer a remoção de plantas que se soltaram e encontram-se flutuando, por meio da abertura das comportas e liberação de água. Ainda assim, perde-se um volume imenso de água, o que representa perdas econômicas consideráveis. A proliferação de macrófitas submersas tem gerado problemas de tal ordem que as empresas de geração de energia têm financiado projetos para desenvolvimento e integração de tecnologias para o monitoramento e controle de plantas aquáticas em reservatórios. Cita-se por exemplo projeto direcionado ao reservatório de Porto Colômbia, no Rio Grande, limite entre os estados de São Paulo e Minas Gerais, o qual foi financiado pela empresa Furnas e realizado em parceria com a UNESP. Além disso, cita-se outros problemas gerados pela infestação, como impedimento à navegação e atividades recreativas de pesca e natação; concentração de metais pesados e sais; formação de habitats propícios à reprodução de vetores de doenças, como malária, dengue, febre amarela, esquistossomose (THOMAZ; BINI, 2003) Por outro lado, sabe-se que há dificuldades para obtenção de dados de macrófitas submersas em áreas extensas. Dessa forma, estudos e desenvolvimento de métodos para facilitar as atividades de controle do desenvolvimento da planta são necessários, haja vista a dificuldade de realizar levantamentos sistemáticos na maioria dos reservatórios brasileiros, que são de gran- des dimensões. O uso de sensoriamento remoto óptico tem sido avaliado nesse tipo de trabalho. Entretanto, os sensores, ainda que de alta resolução espacial e espectral, são capazes de detectar regiões infestadas apenas até uma determinada altura da coluna d’água, devido à atenuação da luz de acordo com a profundidade, que reduz a energia refletida que poderia ser adquirida pelo sensor (HESTIR et al., 2008; MALTHUS; GEORGE, 1997; YUAN; ZHANG, 2008) . Por fim, este trabalho pode representar um avanço no sentido de contribuir futura- mente com uma informação adicional disponível a gestores responsáveis pelo monitoramento e controle dessas plantas. Evidencia-se que é um subsídio complementar, uma vez que possibilita a simulação de cenários e avaliação prévia de possíveis consequências. 1.3 Organização do Trabalho Este trabalho está organizado em nove capítulos. Após a introdução, com as justifi- cativas para a realização deste estudo e a definição dos objetivos, o capítulo 2 apresenta um refe- rencial teórico com os tópicos considerados importantes para a modelagem espaço-temporal. O capítulo 3 discorre sobre aspectos ecológicos das macrófitas aquáticas, com ênfase nas submer- sas, apresentando os principais fatores que influenciam o seu crescimento, bem como uma breve 25 exposição sobre produtividade primária, decomposição e relato de trabalhos relacionados. Os materiais e o método são descritos no capítulo 4. Os resultados deste trabalho são apresentados nos capítulos 5 a 9. O capítulo 5 aborda a análise exploratória, o qual expõe o comportamento dos dados coletados considerando as dimensões espaço e tempo, bem como mostra os testes de correlação entre as variáveis. O capítulo 6 relata todos os detalhes do processo de modelagem pontual, bem como os resultados obtidos. A modelagem probabilística da colonização é assunto do capítulo 8. Os resultados das simulações realizadas são expostos e discutidos no capítulo 9. As conclusões e recomendações estão no capítulo 10. 26 2 REFERENCIAL TEÓRICO Este capítulo aborda, na seção 2.1 aspectos teóricos relacionados a modelagem di- nâmica. Questões relacionadas à calibração e validação são tratadas na seção 2.2. Os modelos ecológicos clássicos de crescimento são apresentados na seção 2.3. Conceitos relacionados ao comportamento de modelos, como estados de equilíbrio e resiliência, são abordados na seção 2.4. Modelos de espaço celular, teoria na qual se apóia a descrição da dimensão espacial, são apresentados na seção 2.5. Conceitos de autocorrelação espacial são discutidos na seção 2.6. As técnicas de interpolação de superfícies utilizadas neste trabalhos são brevemente descritas em 2.7. Métodos probabilísticos são descritos na seção 2.8. A seção 2.9 apresenta conceitos de sensoriamento remoto hidroacústico. 2.1 Modelagem Dinâmica Modelar implica elaborar uma representação de um fenômeno, objeto ou compor- tamento, normalmente complexo, com o intuito de compreendê-lo, explicá-lo ou ainda usá-lo para fazer previsões. Sobre isso, Tundisi e Tundisi (2008) apontam a importância da mode- lagem ecológica e matemática para quantificar processos essenciais e entender componentes dinâmicos dos ecossistemas aquáticos. Nesse processo, o conceito de abstração está diretamente relacionado à definição de modelo, com a denotação de desconsiderar certas características ou pormenores que não precisam ser detalhadamente analisados. Ao ignorar alguns elementos da realidade, estabelece- se uma fronteira entre as variáveis que contribuirão para descrever o que se pretende e demais fatores, que interferem, mas podem ser isolados do conjunto que constitui o modelo sem grande prejuízo para o resultado final. Para Bivand e Lucas (2000), modelos são abstrações da realidade, descrições apro- ximadas de algo que se deseja estudar. Demonstram o quão sensíveis são as saídas face a alterações nos dados de entrada e nos parâmetros. Já Odum (1992), define modelos como re- presentações simplificadas do mundo real que reproduzem alguns fenômenos, de modo que se possa compreender situações complexas e fazer predições. 27 Um modelo é dito dinâmico se ele tem a dimensão tempo explícita, de modo que suas entradas e saídas variem conforme o tempo e um ou mais estados anteriores (WEGENER; GNAD; VANNAHME, 1986). Modelo espacial dinâmico, por sua vez, pode ser definido como uma representação matemática de um processo do mundo real no qual o estado de uma certa localização na superfície da Terra muda em resposta a variações das forçantes (BURROUGH, 1998). Mulligan e Wainwright (2004) classificam os tipos de modelos em três grande cate- gorias: empíricos, conceituais e físicos. Os modelos empíricos descrevem o fenômeno a partir dos dados observados, os quais são utilizados para ajustar as equações matemáticas que o des- crevem. Por esse motivo, são específicos para as condições sob as quais foram projetados e possuem baixa capacidade explanatória do comportamento observado. Os modelos conceituais descrevem o sistema a partir de conhecimento prévio de como as variáveis se relacionam e in- fluenciam o objeto de estudo, com médio potencial para explicar o fenômeno. Já os modelos físicos são fundamentados em princípios científicos sólidos, seguindo teorias pré-estabelecidas. Em virtude disso, possuem alto poder explanatório, embora possam apresentar baixo poder pre- ditivo, uma vez que as observações podem não possibilitar bom ajuste ao modelo (MULLIGAN; WAINWRIGHT, 2004). Além desta classificação, pode-se caracterizar um modelo segundo suas proprieda- des, a saber (MULLIGAN; WAINWRIGHT, 2004): a) Tipo de integração: analítica ou numérica; b) Matemática dos eventos: determinística ou estocástica; c) Representação espacial: homogênea, em que toda a área é representada com um único valor ou heterogênea, em que o espaço é segmentado em unidades discre- tas, como por exemplo células regulares, malhas triangulares ou poligonais; d) Dimensões espaciais: uma, duas ou três; e) Representação temporal: estática ou dinâmica. Outros conceitos importantes no que tange à modelagem espacial são escala, exten- são e resolução (GIBSON; OSTROM; AHN, 2000). A ideia de escala define as dimensões es- paciais, temporais, quantitativas ou analíticas usadas para medir e estudar o objeto de interesse. A extensão representa o tamanho das dimensões da escala. Em relação a tempo, a extensão pode envolver, por exemplo, um dia, uma semana, um ano, uma década. Em relação ao espaço, 28 a extensão pode variar de um metro a milhões de quilômetros quadrados, por exemplo. Assim, a extensão estabelece os limites em que o fenômeno será avaliado. A resolução está relacionada à precisão usada nas dimensões, a qual pode também ser chamada de granularidade, pois define as subdivisões em que uma dimensão será observada (GIBSON; OSTROM; AHN, 2000). Pode-se realizar, por exemplo, medições com resolução diária da dimensão temporal ou resolução de 100m2 no espaço, o que representaria uma obser- vação a cada 100m2. Percebe-se, assim a relação entre os conceitos de extensão e resolução, uma vez que certas situações são impraticáveis, como estudar uma área de milhões de quilôme- tros quadrados com resolução de 1m2. Kok e Veldkamp (2001) discutem os problemas de diferentes resoluções e extensões espaciais em uma análise de padrões de uso do solo. Entre outras questões, argumentam que resoluções grosseiras reduzem a heterogeneidade dos dados e que grandes extensões espaciais podem incluir outros processos além daquele de interesse, dificultando o estudo. Acrescentam ainda que resoluções pequenas em grandes extensões aumentam a dificuldade de identificar os processos principais que governam um fenômeno dinâmico. Com isso, percebe-se a importância de considerar cuidadosamente a definição de escala, extensão e resolução durante o processo de modelagem. Loucks e Beek (2005) apontam como estes conceitos estão diretamente ligados a etapas de descrição dos limites espaciais e temporais do fenômeno de interesse, além de outras questões, como a interpolação de dados que deverá ser aplicada, densidade e frequência de medidas a serem feitas. 2.1.1 Fases da modelagem Na sequência clássica do processo de modelagem define-se quatro fases principais: (a) formulação, (b) verificação, (c) calibração e (d) análise do modelo e validação (HAEFNER, 2005). Formulação compreende especificar objetivos e hipóteses do problema em estudo e a sua representação matemática. Quanto à verificação, abrange a tradução das equações matemá- ticas para algoritmos e implementação. A estimativa dos parâmetros do modelo e execuções com dados de testes são tarefas pertinentes à calibração. Finalmente, executa-se a análise e validação final, em que verifica-se a qualidade das respostas obtidas de acordo com os objetivos inicialmente propostos. Caso os resultados sejam satisfatórios, encerra-se o processo. Se não o forem, pode-se tentar encontrar o erro ou ainda reavaliar se seria válido continuar tentando solucionar o problema. O fluxograma desse processo está ilustrado na Figura 1. A definição dos objetivos inclui: a especificação clara de qual é o objeto do traba- 29 Figura 1: Esquema de a bordagem clássica do processo de modelagem Adaptado de (HAEFNER, 2005) lho; os propósitos que norteiam a necessidade de desenvolver tal modelo; o critério de validação a ser adotado e como será realizada a análise dos resultados produzidos. Com a formulação dos objetivos, deve-se identificar as hipóteses que serão testadas. Enfatiza-se que o tipo de hipótese está relacionado com os propósitos gerais do modelo, que podem ser: predição, controle ou ex- plicação. A partir das hipóteses, deve-se desenvolver a formulação matemática correspondente ao que se quer testar. Esse é considerado o estágio mais difícil do processo de modelagem, uma vez que requer aplicação de matemática avançada e, mais importante, exige tradução de con- ceitos geralmente vagos para equações. Por esse motivo, a utilização de recursos que facilitem a obtenção do formalismo matemático, como o diagrama conceitual, torna-se essencial. 30 2.1.2 Modelo conceitual Representações gráficas de modelos permitem a descrição conceitual de um fenô- meno, caracterizando-o qualitativamente, sem detalhar formulações matemáticas. Com isso, obtém-se diagramas com os elementos integrantes do processo em estudo e as relações entre eles, o que auxilia na abstração do problema. Dessa forma, parte-se dos objetivos previamente estabelecidos e do conjunto de hipóteses para produzir o modelo conceitual informal. Esse tipo de abstração está presente em muitas áreas do conhecimento, como enge- nharia elétrica, com os diagramas de circuitos estruturados; no desenvolvimento de software, para documentar a análise e o projeto, na etapa de projeto de banco de dados e modelos entidade- relacionamento (SILBERSCHATZ; KORTH; SUDARSHAN, 2006); na análise de processos industriais, em que se adota redes de Petri (CARDOSO; VALETTE, 1997). Após a criação de um diagrama, pode-se obter com menor dificuldade sua descrição quantitativa, dada pelo formalismo das equações matemáticas. Os alicerces dos modelos conceituais encontram-se definidos na Teoria Geral de Sistemas proposta por Bertalanffy (1975), a qual estabelece as bases aplicadas a vários ramos da ciência a partir da descrição de um sistema genérico por meio de um conjunto complexo de elementos em interação. As relações entre os constituintes definiriam o comportamento do todo e qualquer alteração nesse intrincado conjunto de elementos e relações modificaria sua totalidade. Os elementos propostos por Bertalanffy (1975) são denominados de variáveis de estado, estoques ou objetos. Fluxos conectando esses objetos representam as relações. Deve-se destacar que há variações dessa nomenclatura e linguagens visuais deriva- das da concepção inicial da Teoria Geral de Sistemas, com o intuito de representar conceitos próprios de certas áreas. Em termos ecológicos, cita-se principalmente a linguagem de fluxos de energia proposta por Odum (1994), que introduz elementos específicos para representar or- ganismos consumidores e produtores, variáveis de sistema e fontes externas de energia, entre outros. Além dessa, tem-se os diagramas de Forrester, também aplicados à Ecologia, cujos elementos são descritos por Haefner (2005). Os elementos básicos da linguagem de energia proposta por Odum são: fluxo de energia, fonte, estoque, sumidouro de calor, interação e produtor (ODUM, 1994). O fluxo de energia indica transporte de vários tipos de energia, como matéria, concentração de substâncias químicas, informação, dinheiro. É proporcional à fonte que o produz, sendo, portanto, associ- ado a um coeficiente de ponderação. Está ilustrado na Figura 2a. Fonte é um elemento externo, também conhecido como forçante, que influencia o sistema, mas não é alterado por ele. O ele- 31 mento gráfico está na Figura 2b. O elemento estoque está associado a uma variável de estado e pode representar armazenagem de diversos tipos de energia, assim como o elemento de fluxo. Seu gráfico está na Figura 2c. O sumidouro de calor indica dissipação, que acontece em todos os fluxos, interações e estoques, conforme a segunda lei de energia, de acordo com a qual uma parcela da energia gasta não pode mais ser utilizada, saindo do sistema (ODUM; ODUM, 2000). Seu gráfico está ilustrado na Figura 2d. O elemento interação indica interseção de dois fluxos, que se combinam para produzir um produto proporcional a ambas. Seu elemento gráfico está na Figura 2e. O produtor é o elemento que coleta e transforma energia de baixa qualidade em energia de alta qualidade. No contexto ecológico, normalmente é representado pelos organis- mos fotossintetizantes (autótrofos), que utilizam luz e carbono para produzir matéria orgânica. A Figura 2f é sua representação. (a) Fluxo de energia (b) Fonte (c) Estoque (d) Sumidouro de calor (e) Interação (f) Produtor Figura 2: Elementos básicos dos diagramas de Odum. Fonte: (ODUM, 1994) É importante ressaltar que em todas essas linguagens está presente a concepção de análise de um problema e sua representação por meio de diagramas de blocos interconectados, que definem um modelo conceitual. Enfatiza-se ainda que o início da modelagem pela construção de um diagrama con- ceitual facilita sobremaneira a compreensão do fenômeno de interesse e a delimitação do es- copo. A partir disso, pode-se simplificar o modelo e estabelecer limites que tornem seu de- senvolvimento plausível. Ademais, a partir do modelo conceitual, pode-se obter a formulação matemática inicial e então manipulá-la para atingir o objetivo proposto. 2.1.3 Formalismo matemático Os modelos conceituais podem ser convertidos para equações matemáticas de forma bem definida. Esse processo pode ser chamado de tradução de modelo qualitativo para quanti- tativo. A regra geral especifica que cada variável de estado ou estoque (Q) do diagrama requer uma equação diferencial (ou de diferenças finitas, para modelos discretos). No lado esquerdo desta equação representa-se a taxa de variação dos objetos do sistema e o lado direito descreve como tais mudanças ocorrem (HAEFNER, 2005), como na expressão 2.1, em que Q é a variável 32 de estado. dQ dt = f (variáveis de estado, parâmetros, t) (2.1) Uma segunda regra especifica que cada fluxo de entrada e saída deve ter uma repre- sentação algébrica explícita, dada por um coeficiente. A diferença entre a soma dos fluxos de entrada e a soma dos fluxos de saída é o lado direito da equação diferencial para cada variável de estado (ODUM, 1994), como colocado na expressão 2.2. dQ dt = ∑fluxos de entrada−∑fluxos de saída (2.2) Quando se considera tempo discreto, substitui-se a equação diferencial pela equação de diferenças finitas. Para cada estoque, tem-se a expressão definida pela Equação 2.3. Qt+1 = Qt +∑fluxos de entrada−∑fluxos de saída (2.3) Ao se considerar um diagrama conceitual simples como o ilustrado na Figura 3, em que Q é a variável de estado, J representa o fluxo de entrada, o fluxo de saída é proporcional ao próprio Q e ponderado pelo coeficiente k, sua formulação matemática é dada pela equação diferencial da expressão 2.4. Figura 3: Diagrama formulado com a linguagem de fluxos de energia de Odum dQ dt = J− kQ (2.4) A integral da Equação 2.4 é dada pela expressão da Equação 2.5, cuja solução está indicada na Equação 2.6. O termo Q0 indica a condição inicial da variável de estado Q, a partir da qual pode-se calcular sua evolução. Este conceito de condição inicial será muito utilizado no decorrer deste trabalho. 33 Q = � (J− kQ)dt +Q0 (2.5) Q = J k (1− e−kt)+Q0e−kt (2.6) 2.2 Calibração e Validação A etapa de calibração define os coeficientes que ponderam as variáveis do modelo. Pode ser entendida como um processo de busca de coeficientes que minimizam uma métrica de erro entre valores estimados e observados, como por exemplo o erro médio quadrático. Co- mumente, a tarefa de calibração envolve um problema de otimização de alta dimensionalidade, principalmente em modelos ecológicos, em que é necessário um volume muito grande de dados para caracterizar o sistema (TUNDISI; TUNDISI, 2008). Há várias técnicas que podem ser utilizadas para determinar os coeficientes dos mo- delos, desde métodos simples de regressão linear, regressões não lineares baseadas em métodos diretos, de transformação ou de gradiente ou ainda técnicas mais complexas. Essas técnicas seriam necessárias em casos em que o sistema é dinâmico, descrito por mais de uma equação diferencial, as quais seriam interdependentes e normalmente sem solução analítica (HAEFNER, 2005). Sendo a calibração um processo iterativo, há um risco de resultar em falta de convergên- cia ou instabilidade numérica. Haefner (2005) relata ainda que abordagens novas têm sido propostas, baseadas em analogias com a evolução de sistemas biológicos, denominadas de técnicas evolucionárias. O mesmo autor acrescenta que tais métodos têm se mostrado eficazes para estimar parâmetros de modelos complexos, mesmo que sua superfície de erro possua muitos mínimos e máximos. Loucks e Beek (2005) relatam que algoritmos genéticos são talvez o método mais robusto para calibrar modelos baseados em dados. A abordagem de algoritmos genéticos baseia-se nos princípios de seleção natural propostos por Darwin e por isso é denominada de método de computação evolutiva . Pode ser entendido como um método de busca inicialmente aleatório, que prossegue de modo iterativo pela aplicação de operadores de reprodução (cross-over) e mutação aos indivíduos. Cada possí- vel solução do problema é considerada um indivíduo e o conjunto de indivíduos é denominado de população. A população é modificada durante uma iteração e uma fração dela é substituída pelos seus melhores descendentes para iniciar a iteração seguinte. Esses melhores descendentes 34 � ������� �� ����� � �������� ����� � �� �� �� � ����������� � ����� � �������� ���� � � ����� ���� �� � �� ��� � � � ����� � ������� ��� � ��� � � ���� � � ����� � �������� ����� ���� � � !����� ��� ��� ����� � � ����� � � ������� ���� � � ���� �� � � ������� ����� � � ��������� � ����� � " �������� ���� � � ����� ���� �� � �� ��� � � � ����� " ��� ���� �� ��� � ��� � !!�� ��� � � ����� Figura 4: Passos do algoritmo genético são identificados como aqueles que otimizam uma medida numérica pré-definida para o pro- blema que se quer solucionar. A essa medida numérica denomina-se função de adaptação ou fitness, haja vista que representa, no contexto da teoria de seleção natural, o grau de adaptação daquele indivíduo (MITCHELL, 1997). Genericamente, a sequência de operações executada pelo algoritmo segue a ordem da Figura 4, como descrito por Mitchell (1997). A linha 1 especifica que para se executar o algoritmo, é necessário definir: uma função de adaptação, que atribui uma medida numérica a cada indivíduo; o limiar que determina o critério de parada; valores de p, r e m, que especificam, respectivamente, o número de indivíduos da população, a fração da população que é substituída pelo operador de reprodução em cada iteração e a taxa de mutação. A linha 2 determina que a população inicial deve ser gerada de modo aleatório. O valor da função de adaptação deve então ser calculado para cada indivíduo da população, conforme especificado na linha 3. A linha 4 especifica que o bloco de instruções (4.1 a 4.5) deve ser executado enquanto o limiar da função de adaptação não for atingido, que representa a parte iterativa do algoritmo. Nesse bloco, a instrução 4.1 determina que, a cada iteração uma parte da população é selecionada, de modo probabilístico, para permanecer na próxima geração, conforme o parâmetro r, especificado na linha 1. A linha 4.2 aplica o operador de reprodução a pares de indivíduos, também selecionados conforme uma probabilidade, e os melhores descendentes gerados permanecerão na próxima geração. Aplica-se, conforme linha 4.3 o operador de mutação, segundo o qual um percentual dos membros da população é selecionado, segundo uma certa probabilidade, e modificado. A linha 4.4 determina que a nova população seja atualizada com os indivíduos da geração anterior. Calcula-se, a seguir, a função de adaptação para cada indivíduo. Finalmente, o resultado final é obtido como sendo o indivíduo mais adaptado. Conforme Savic, Bicik e Morley (2011), esta abordagem tem sido aplicada a pro- 35 blemas de busca e otimização complexos. Salienta-se que não há garantia de que o resultado seja o ótimo global, mesmo porque em problemas de explosão combinatória, em que o número de possibilidades a serem examinadas é extremamente grande, nem sempre pode-se reconhecer o ótimo global, ainda que se possa encontrá-lo (SÁ, 2003). De qualquer forma, pode-se obter um conjunto de coeficientes, no caso da calibração de modelos, que se ajuste bem aos dados. Neste contexto, Sá (2003) defende a utilização de algoritmos genéticos para calibra- ção automática de modelos ecológicos descritos por equações diferenciais ordinárias. No caso de modelos distribuídos, em que o espaço é discretizado em células, o processo de calibração é particularmente difícil e neste caso, Mulligan e Wainwright (2004) apontam métodos estocásti- cos ou abordagens evolucionárias como as técnicas que podem gerar os melhores resultados. Após estimar parâmetros, é necessário verificar a qualidade do modelo obtido, testando-o com outro conjunto de dados, diferente daquele usado na calibração. Essa verifica- ção pode ser por simples comparações, com o uso de gráficos ou tabelas, dos valores observados com os estimados, ou por testes estatísticos rigorosos (LOUCKS; BEEK, 2005). Para isso, Mulligan e Wainwright (2004) sugerem 13 procedimentos de teste que podem ser realizados, a saber: a) Avaliação geral e superficial, a fim de verificar se os resultados parecem razoá- veis; b) Teste de Turing, originário da área de Inteligência Artificial e adaptado para mo- delagem. Faz-se um questionamento a um especialista, o qual deve distinguir os resultados produzidos pelo modelo dos adquiridos durante as observações. Se o especialista não conseguir discriminar o que foi produzido pelo modelo da- quele que é produto da realidade, o modelo é considerado validado (HAEFNER, 2005); c) Técnicas de visualização, compostas de gráficos ou imagens que façam a sobre- posição dos dados estimados pelo modelo e das observações; d) Comparação com outros modelos, normalmente aplicável quando existem pro- postas anteriores ou alternativas para o mesmo problema; e) Validação interna: repetição estocástica com os mesmos dados para verificar se a distribuição dos resultados é plausível; f) Por eventos, consiste em verificar se a ocorrência e o padrão de um evento espe- cífico são reproduzidos pelo modelo; 36 g) Histórica, usa a técnica de divisão das amostras para utilizar os dados de um período para construir o modelo e de outro para testar os resultados; h) Testes de condições extremas, submete combinações de entradas de valores ex- tremos para verificar se o comportamento do modelo é razoável; i) Rastreio: para verificar se as mudanças do modelo dinâmico ocorridas no decor- rer do tempo são realísticas; j) Análise de sensibilidade, para avaliar se pequenas mudanças nas entradas pro- duzem resultados de magnitudes razoáveis; k) Preditiva, dada pela comparação da saída do modelo com o comportamento real do sistema em questão; l) Estatística, avalia a estrutura e propagação dos erros, bem como a significância estatística das estimações; m) Multiestágio, composta de várias técnicas associadas. Dentre as técnicas citadas, é importante destacar alguns aspectos referentes à aná- lise de sensibilidade, que permite identificar os parâmetros que mais afetam o modelo. Uma forma de aplicá-la é realizar análise gráfica do produto da variação de ±10% em torno do va- lor nominal do parâmetro, a fim de detectar discrepâncias no modelo matemático (GIUSTI; MARSILI-LIBELLI, 2005). Essa análise explora e quantifica o impacto de possíveis erros nos dados de entrada sobre as saídas do modelo. Procedimentos simples podem ser usados para ilustrar graficamente ou numericamente as consequências de hipóteses alternativas (LOUCKS; BEEK, 2005). Em outras palavras, a análise de sensibilidade busca determinar a mudança nos valores de saída do modelo como resultado de pequenas oscilações nos parâmetros de entrada. Além disso, essa análise possui valor explicativo ou de decisão, uma vez que pode ser usada para identificar que fator é mais importante para prevenir crescimento excessivo. Loucks e Beek (2005) acrescentam que os resultados da análise deveriam interessar ao público geral, gestores e responsáveis por tomadas de decisão, uma vez que apresentam possibilidades que podem vir a se concretizar no futuro. A ideia é que pode-se entender como seriam as respostas de um fenômeno quando uma certa variável passasse a ter um peso maior em suas mudanças. As técnicas mais comuns para se avaliar o quão sensível é o modelo perante 37 pequenas modificações permitem verificar o efeito das mudanças em um único parâmetro e podem ser estendidas para examinar resultados combinados de múltiplas fontes de erro. Em termos quantitativos, com o intuito de validar os modelos, alguns índices de qualidade de ajustamento podem ser calculados para caracterizar o seu comportamento. Em cada expressão que define os índices (Equações 2.7 a 2.11), Oi e Pi são, respectivamente, o valor observado e o predito pelo modelo. São eles (HAEFNER, 2005): a) Erro médio quadrático (EMQ), dado pela expressão 2.7: expressa a soma dos erros ao quadrado dividida pelo número de amostras (n), quantificado em termos da unidade da variável; b) Erro médio absoluto (EMA), dado pela expressão 2.8: representa o valor abso- luto da soma das diferenças entre os valores observados e estimados, dividido por n, também quantificado em termos da unidade da variável; c) W, dado pela expressão 2.9: índice adimensional, que representa concordân- cia entre valores preditos e observados, definido como a razão do erro médio quadrático para o erro potencial total, proposto por Willmott (LEGATES; MC- CABE, 1999). Este índice varia de 0 a 1, em que 1 representa o ajuste perfeito do modelo aos dados. Entretanto, o seu termo quadrático torna-o muito sensível aos outliers, ou valores extremos. d) W1, dado pela expressão 2.10: adimensional, é o índice W modificado, sem as potências quadráticas a fim de não ampliar os erros demasiadamente, como acontece com o índice W; e) WMM (expressão 2.11): adimensional, é o índice W1 alterando a média de valo- res observados para médias móveis, útil em situações em que os dados possuem grande variabilidade temporal. Neste caso, O′ é a média móvel, correspondente a cada período de tempo. EMQ = 1 n n ∑ i=1 (Oi −Pi) 2 (2.7) EMA = n ∑ i=1 |Oi −Pi| n (2.8) 38 W = 1.0− n ∑ i=1 (Oi −Pi) 2 n ∑ i=1 (|Pi −O|+ |Oi −O|)2 (2.9) W1 = 1.0− n ∑ i=1 |Oi −Pi| n ∑ i=1 (|Pi −O|+ |Oi −O|) (2.10) WMM = 1.0− n ∑ i=1 |Oi −Pi| n ∑ i=1 (|Pi −O′|+ |Oi −O′|) (2.11) Legates e McCabe (1999) defendem a avaliação de modelos com os índices W e seus derivados (W1 e WMM), juntamente com EMQ e EMA, embora afirmem que há grande dificuldade em interpretar os índices de concordância pois não possuem significado físico claro. Mencionam como essencial apresentar gráficos de dispersão e análise de resíduos para uma avaliação apropriada do modelo. Citam a importância de medidas como EMA e EMQ, uma vez que fornecem uma avaliação do erro em unidades da variável e indicam que quando valores extremos estão presentes, EMA é preferível ao EMQ. Legates e McCabe (1999) argumentam ainda que, embora seja considerado um ín- dice de validação, o coeficiente de determinação R2, utilizado nas técnicas de regressão, deve ser ignorado em modelagem dinâmica, por ser extremamente sensível a valores extremos, além de avaliar apenas relacionamentos lineares entre as variáveis. Como modelos são representações simplificadas da realidade, incluem alguns as- pectos considerados importantes em detrimento de outros, seja por opção, seja por desconheci- mento do fenômeno ou variações naturais que não podem ser tratadas completamente. Sendo assim, há fontes de incerteza que devem ser analisadas a fim de determinar sua extensão. Entre as fontes de incerteza, cita-se: erros de medição, pois muitas vezes o próprio ato de medir perturba o que está sendo medido (MULLIGAN; WAINWRIGHT, 2004); erros na formulação matemática, nos parâmetros ou em decorrência de variações naturais (HAEFNER, 2005); em modelos espacialmente explícitos, há ainda os erros de interpolação (HEUVELINK et al., 2010); em modelos espaciais, tem-se os erros derivados das técnicas de posicionamento (MONICO, 2008). A análise de incerteza pode ser realizada analiticamente, por séries de Taylor, ou 39 numericamente, pelo Método de Monte Carlo. Essa abordagem consiste em repetir um expe- rimento de simulação diversas vezes, com base em funções de distribuição de probabilidade para os parâmetros de entrada, que refletem o conhecimento a priori sobre o comportamento destas variáveis. Após as simulações, pode-se analisar os percentis dos resultados calculados para estimar intervalos de confiança (NES; SCHEFFER, 2003). 2.3 Modelos de crescimento Em cada área do conhecimento, há modelos clássicos que descrevem os principais fenômenos de estudo. Em termos ecológicos, alguns dos modelos mais comumente encontrados destinam-se a representar a dinâmica populacional, de uma ou mais espécies de um ecossistema (RENSHAW, 1995). O caso mais simples, em que o sistema de interesse consiste de apenas uma única espécie, a qual se reproduziria a uma taxa constante a1, proporcional ao número de indivíduos presente Q, é dado pela Equação 2.12. A solução é dada pela equação 2.13, em que Q0 repre- senta o número de elementos em t = 0, sendo a condição inicial. Conforme a constante a1 for positiva ou negativa, o crescimento do sistema será positivo ou negativo. dQ dt = a1Q (2.12) Q = Q0ea1t (2.13) Essa é a lei exponencial, a qual indica crescimento indefinido, sendo chamada, nas ciências sociais, como Lei de Malthus. Possui aplicações em rendimento de capital a juros compostos; crescimento de certas bactérias e animais; conhecimento humano, medido pelo nú- mero de páginas de livros devotados às descobertas científicas. Quando a constante é negativa, pode exemplificar redução da radioatividade; decomposição de um composto químico numa reação monomolecular; perda de substância corporal pela fome em um organismo multicelular (BERTALANFFY, 1975). Na natureza, em algumas situações, o que ocorre não é o crescimento indefinido, mas uma limitação de recursos, que regula o tamanho da população, uma vez que conforme aumenta o número de indivíduos, há uma competição entre eles, seja por alimento ou por es- paço. Esta situação é formalmente representada pela Equação 2.14, proposta por Verhulst-Pearl (RENSHAW, 1995), que acrescenta um termo quadrático negativo, proporcional ao tamanho 40 da população. Desta forma, a1 é o coeficiente que pondera o crescimento e a2 representa o coeficiente relacionado ao decrescimento. O fator quadrático negativo é chamado de dreno ou fator autocatalítico (ODUM; ODUM, 2000), o qual representa o controle populacional, sendo o modelo caracterizado como densidade-dependente (HAEFNER, 2005). dQ dt = a1Q−a2Q2 (2.14) O gráfico do modelo da Equação 2.14 é uma curva sigmóide, também chamada de logística, a qual atinge um valor limitante (assíntota) (BERTALANFFY, 1975). Tal curva está ilustrada no gráfico da Figura 5, em que se percebe crescimento inicialmente maior (linha azul), seguido de uma equiparação entre crescimento e decrescimento no intervalo de tempo próximo a 20, o qual leva ao equilíbrio populacional (linha amarela). Figura 5: Exemplo de curva logística de crescimento populacional Uma forma alternativa para representar este comportamento é especificar o tamanho máximo alcançável pela população como capacidade de suporte, representada por K na Equa- ção 2.15 (RENSHAW, 1995). A taxa de crescimento máximo ocorre quando a população está na metade do valor K (HAEFNER, 2005). Quando a população Q atinge o valor de K, o quoci- ente da equação resulta em 1 e a diferença se anula, tornando o crescimento nulo e estabilizando a população. Esse efeito indica também que a taxa de morte, ou decomposição, aumenta mais rapidamente que a de nascimento, ou reprodução, devido ao fato que a maior densidade popu- lacional poderia causar estresse ou até mesmo toxicidade (ODUM; ODUM, 2000). Esta queda do crescimento conforme o tempo, ocorre porque o modelo possui o chamado fator inibidor da proporcionalidade, em que age um mecanismo autocatalítico (ODUM; ODUM, 2000). dQ dt = a1Q [ 1− ( Q K )] (2.15) Bianchini Jr. et al. (2010) aplicaram o modelo logístico para representar cresci- 41 mento de biomassa da macrófita submersa Hydrilla verticillata, sob condições controladas, trabalho que ilustra a aplicabilidade da formulação matemática desta equação, considerando o contexto deste trabalho. Em termos de modelagem, a vantagem do modelo logístico é que as duas equações, com dreno quadrático e com capacidade suporte, possuem solução analítica, o que torna seu processamento muito mais rápido em relação a casos que necessitam de integração por métodos numéricos. A solução para a forma com capacidade suporte está na equação 2.16, sendo Q0 a condição inicial. A solução para a expressão com dreno quadrático está na Equação 2.17. Q = Q0 ∗K Q0 − (K −Q0)e−a1t (2.16) Q = a1 a2 + e(−a1t) ∗ (a1−a2Q0)/Q0 (2.17) Há ainda outros modelos para crescimento populacional como o modelo de Gom- pertz, em que a taxa de crescimento diminui com o tempo, sendo proporcional ao logaritmo do tamanho da população (HAEFNER, 2005) e o modelo de Montroll, em que o ponto de inflexão da curva é indicado por um parâmetro (BASSANEZZI, 2009). Renshaw (1995) argumenta que a representação matemática simples do modelo lo- gístico corresponde a uma boa aproximação do crescimento biológico que ocorre na natureza, ainda que determinadas hipóteses não sejam satisfeitas e representadas pelo modelo, como ca- sos de imigração em estudos populacionais. O mesmo autor coloca que não se deve usar este modelo como uma lei universal de crescimento populacional, mas entendê-lo como uma esti- mativa que oferece resultados úteis. 2.4 Equilíbrio Quando se trata de sistemas dinâmicos, principalmente os não-lineares, alguns con- ceitos relacionados aos estados e ao comportamento do sistema como um todo, devem ser defi- nidos, os quais envolvem equilíbrio, resiliência, perturbações, flutuações, estabilidade. May (1975) discute as diferenças entre ponto de equilíbrio estável global e equi- líbrio instável, caracterizado por oscilações. Identificar estes pontos é útil na medida em que caracterizam o comportamento a longo prazo do modelo e permitem interpretar a sua dinâmica transiente. Holling (1973) apresenta o comportamento dinâmico de duas populações em inte- 42 ração, classificando-o em: a) equilíbrio instável, representado pela espiral aberta, em que as flutuações gradu- almente aumentam em amplitude (Figura 6a); b) ciclos estáveis, em que as trajetórias fechadas mostram que a partir de qualquer ponto inicial, chegará ao mesmo ponto de retorno (Figura 6b); c) equilíbrio estável, em que todas as possíveis trajetórias conduzem ao mesmo ponto central (Figura 6c); d) domínio de atração (Figura 6d), é uma combinação das situações das Figuras 6a e 6c, pois todas as possíveis trajetórias que estão no domínio da região pontilhada são conduzidas ao ponto central, que indica o equilíbrio, designando uma região de estabilidade local. As trajetórias externas a esse domínio tendem ao equilíbrio instável; e) ciclos com limites estáveis, contrária à Figura 6d, pois a região interna, ponti- lhada, delimita trajetórias que tendem a se deslocar para fora da espiral e a região externa ao domínio da área pontilhada tende ao centro da espiral (Figura 6e); f) nodos estáveis, para os quais todas as trajetórias convergem sem oscilações (Fi- gura 6f). Os conceitos de resiliência e estabilidade no contexto de sistemas ecológicos são também propostos por Holling (1973), o qual define resiliência como a capacidade de um sis- tema absorver mudanças das variáveis de estado, forçantes e parâmetros e persistir em um estado. Por outro lado, este autor entende estabilidade como a habilidade do sistema retornar ao estado de equilíbrio após uma perturbação temporária. Nesse contexto, May (1975) discute como o crescimento populacional de uma única espécie, descrito por um modelo logístico determinístico, baseado em capacidade de suporte, sendo descrito e simulado em passos discretos, pode apresentar comportamentos que variam de equilíbrios estáveis ou instáveis a oscilações crescentes, podendo atingir estados caóticos. Tais comportamentos tão variados são produzidos pela mesma equação matemática, apenas por meio da alteração da condição inicial e do parâmetro que representa a taxa de crescimento. Comprovou-se, ainda, que para valores da taxa de crescimento suficientemente grandes, o simples modelo logístico determinístico para uma única espécie atinge comporta- mento dinâmico arbitrário, não distinguível do caos (MAY, 1975). 43 Figura 6: Exemplo de possíveis comportamentos de sistema de duas populações Fonte: Holling (1973) No contexto da Teoria Geral de Sistemas, Bertalanffy (1975) relata que muitas orga- nizações aparentemente em estado de equilíbrio estável, na verdade estão passando por estados de flutuações cíclicas resultantes da interação de subsistemas. O autor coloca ainda que os sistemas abertos atingem estados de aparente equilíbrio dinâmico, em que há contínua importa- ção de energia gerada por fontes externas, por meio de uma harmonização das proporções dos processos vigentes. 2.5 Modelos de Espaço Celular Modelos de espaço celular têm sua estrutura definida por uma matriz bidimensional de polígonos regulares, chamadas células. Cada uma está associada a um estado, determinado e alterado a partir da vizinhança e regras de transição (COUCLELIS, 1985). Tais modelos têm a capacidade de representar dinâmicas complexas entre eventos locais. Essa concepção foi proposta inicialmente por von Neumann (1961), com o forma- lismo de autômatos celulares, mais restritos em relação a modelos de espaço celular, devido a convenções de proximidade, uniformidade e homogeneidade. Segundo Batty (2000), a noção de proximidade em autômatos celulares restringe a vizinhança apenas a células adjacentes. A uniformidade estabelece que regras de transição devem ser aplicadas a todas as células, estados e vizinhança, igualmente em todas as iterações, o que confere também a característica de ho- mogeneidade. O autor argumenta ainda que a essência de modelagem com autômatos celulares 44 reside no fato de que mudanças espaço-temporais são sempre geradas localmente, por células estritamente adjacentes a outras. A partir disso processos locais geram uma ordem global. Os modelos de espaço celular não possuem regras rígidas para a noção de proxi- midade. As regras de transição não precisam ser uniformes e em consequência disso a ideia de homogeneidade não deve ser necessariamente seguida. Com isso, pode-se perceber que autômatos celulares são menos flexíveis em comparação a modelos de espaço celular. Alguns fenômenos podem ser melhor representados se for possível relaxar certas restrições, permitindo os seguintes aspectos (COUCLELIS, 1987): a) Associação de diferentes conjuntos de estados a diferentes células; b) Especificação de vizinhança com variação local; c) Regras de transição determinísticas ou estocásticas; d) Abertura do modelo a eventos externos; e) Relaxamento da premissa de tempo discreto. No que tange a tipos de modelos celulares, Tobler (1979) propõe uma classificação em termos de mudança de estado. Nesse sentido, seja gt i, j, em que i e j indicam a posição da célula na matriz g no tempo t e gt+Δt i, j o novo estado após um intervalo de tempo. Conforme as influências que agiram sobre a transição de estado, tem-se as seguintes categorias de modelos: a) Independente: alteração associada a uma variável aleatória não relacionada a gt i, j, como ilustrado na Figura 7a; b) Funcionalmente dependente: sujeito ao estado da célula na época anterior (gt+Δt i, j = F(gt i, j)), como na Figura 7b; c) Histórico: depende de vários estados anteriores na mesma localização (gt+Δt i, j = F(gt i, j,g t−Δt i, j ,gt−2Δt i, j , . . . ,gt−kΔt i, j )), tal qual na Figura 7c; d) Multivariado: formalmente expresso por gt+Δt i, j = F(ut i, j,v t i, j,w t i, j, . . . ,z t i, j), de- pende de mais de uma variável na mesma localização, como esquematizado na Figura 7d; e) Geográfico: depende do estado das células próximas (gt+Δt i, j = F(gt i±p, j±q)), ilus- trado na Figura 7e. 45 (a) Independente (b) Funcionalmente dependente (c) Histórico (d) Multivariado (e) Geográfico Figura 7: Tipos de modelos Fonte: Tobler (1979) A definição de vizinhança é um aspecto muito importante de modelos de espaço celular, associado ao domínio de influência geográfica do modelo dinâmico (TOBLER, 1979). Os tipos clássicos de vizinhança são: a) von Neumman, apresentada na Figura 8a; b) Moore, ilustrada na Figura 8b; c) von Neumman degenerada, como mostrado na Figura 8c; d) Assimétrica, que não segue um padrão fixo, utilizada em aplicações que não se encaixam nas definições acima. Um exemplo é exibido na Figura 8d. 46 (a) von Neumann (b) Moore (c) von Neumann dege- nerada (d) Assimétrica Figura 8: Principais definições de vizinhança Fonte: Couclelis (1985) Acrescenta-se que a definição de vizinhança apóia-se no conceito de estacionarie- dade, relacionado à estrutura espacial dos dados e seus momentos de primeira e segunda ordem. Por momento de primeira ordem entende-se o valor esperado, ou média e o momento de segunda ordem diz respeito à covariância entre duas áreas ou pontos. Com base nesses fundamentos, a estacionariedade supõe que o comportamento da correlação espacial na região de estudo de- pende da distância relativa entre pontos. Em vista disso, diz-se que o processo é estacionário de segunda ordem se a média é constante e a covariância depende da distância relativa entre todos os pontos da região. Se a covariância independe da direção do vetor da distância, atribui-se ao processo a qualidade de isotropia. Se a direção influenciar na co-variância, o processo é rotulado como anisotrópico (DRUCK et al., 2004). Considerando-se esses conceitos de análise espacial, nota-se que regras de transição de modelos de espaço celulares podem ser aplicadas a vizinhanças isotrópicas ou anisotrópicas. Já as regras de autômatos celulares são somente isotrópicas. Enfatiza-se que para se aplicar o conceito de anisotropia, o número de regras de transição a serem manipuladas aumenta signifi- cativamente, pois dependem da direção. Além disso, autômatos celulares consideram apenas efeitos locais, devido à relação de vizinhança adotada para as células. Esse é um problema que nem sempre permite a mode- lagem de sistemas complexos multi-escalares. Para solucionar tal limitação, Carneiro (2006) propõe a abordagem de autômatos aninhados, inicialmente aplicados a mudanças de uso e co- bertura do solo. Por essa abordagem, não há somente um conjunto de regras para toda a matriz de células, mas várias escalas, cada uma definida como uma combinação específica de resolu- ção e extensão espacial, temporal e analítica, modelada com um autômato celular. A Figura 9 ilustra um exemplo genérico de autômatos celulares aninhados. O modelo proposto por Carneiro (2006) foi codificado em uma linguagem de mo- delagem denominada Terra Modeling Environment (TerraME), que usa a biblioteca espacial TerraLib, desenvolvida pelo Instituto Nacional de Pesquisas Espaciais (INPE). Esse ambiente implementa o modelo de autômatos celulares aninhados e serviços para gerenciamento e análise 47 Figura 9: Autômatos celulares aninhados Fonte: Carneiro (2006) de dados espaço-temporais, bem como os aspectos relacionados à simulação e avaliação dos re- sultados. TerraME é baseado na linguagem de programação chamada LUA, que é extensível e especialmente projetada para extender aplicações. A visualização dos dados não é contemplada por essa arquitetura, mas pode ser facilmente realizada com ferramentas como TerraView. Os modelos podem ser desenvolvidos em qualquer editor de texto. No contexto dos eventos que desencadeiam as mudanças de estado, sabe-se que muitas aplicações não podem ser modeladas apenas de modo determinístico, haja vista a in- certeza associada à falta de informação ou limitação da compreensão do problema. Em casos como esses, a adoção de características estocásticas confere mais realismo à simulação. Para empregar tais características, Batty (2000) explica a ocorrência de uma certa mudança de estado conforme uma probabilidade, dependente das condições da vizinhança. Com isso, uma regra de transição pode ou não ser aplicada. Em termos de aplicações de modelos de espaço celular, há diversas áreas que en- volvem abordagem espacial. Citam-se, especificamente, trabalhos sobre simulação de cres- cimento de plantas (GIUSTI; MARSILI-LIBELLI, 2006), modelagem de processos urbanos (ALMEIDA, 2004), previsão e análise de desmatamento em áreas florestais (SOARES FILHO; CERQUEIRA; PENNACHIN, 2002). 2.6 Autocorrelação Espacial Considerando a proposta de modelar a distribuição espacial das macrófitas submer- sas, surge a necessidade de determinar como a presença de plantas em uma região influencia o crescimento de vegetação em áreas próximas. Para isso, torna-se necessário, ainda, quanti- ficar a densidade de macrófitas, pontualmente ou por área. Devido à distribuição contínua da 48 planta no sedimento, que prejudica sua contagem individual, um dos métodos utilizados para determinação da biomassa constitui-se de remoção por área, de porções do banco de macrófi- tas aquáticas. Segundo Pompêo e Moschini-Carlos (2003), entende-se por biomassa o peso do material vegetal contido acima e abaixo da lâmina d’água, inclusive do material presente no interior do sedimento, expresso por unidade de área. Essa remoção é realizada com base em um amostrador de área conhecida em forma de quadro que demarca, no local de estudo, a região da qual será extraída a planta para avaliação, conforme as imagens da Figura 10a, que mostra a colocação do quadro e Figura 10b, após a coleta de Eichhornia crassipes, Lago das Garças, SP. (a) Marcação da área com o quadro (b) Situação após remoção das ma- crófitas Figura 10: Amostragem de biomassa de macrófitas pelo método do quadro Fonte: Pompêo (2009) Apesar deste trabalho não utilizar o método destrutivo, conforme será descrito na seção 2.9, serão utilizados dados de área, considerados adequados para caracterizar a presença de plantas (SCHIMIDT; NOBRE; FERREIRA, 2003). Dessa forma, pretende-se caracterizar a área de interesse, aferindo a altura do dossel da vegetação submersa em áreas delimitadas por polígonos regulares. Ademais, esse tipo de dado é condizente com a abordagem de modelos de espaço celulares, em que a região de estudo é dividida em sub-regiões. O conceito de dependência espacial, em que os fenômenos que possuem localização geográfica apresentam relações que dependem da distância (ISAAKS; SRISVASTAVA, 1989), foi proposto por Tobler como a primeira lei da Geografia, segundo a qual todas as coisas são parecidas, mas coisas mais próximas se parecem mais que coisas mais distantes (ANSELIN, 1992). Isaaks e Srisvastava (1989) acrescentam ainda que valores de um mapa, por exemplo, não parecem estar localizados aleatoriamente. Ao contrário, valores baixos tender a estar próxi- mos de outros valores baixos, assim como altos estão nas proximidades de outros valores altos. Desse princípio deriva a noção de que, se uma determinada região possui plantas, é provável que locais próximos a esse também possuam plantas, desde que não haja variações bruscas nas condições. A expressão do conceito de dependência espacial é dada pela autocorrelação es- 49 pacial. A estatística apresenta a idéia de correlação para mensurar relacionamento entre duas variáveis (ISAAKS; SRISVASTAVA, 1989). O prefixo auto indica que a medida de correlação é calculada com a mesma variável, porém, em locais diferentes (DRUCK et al., 2004). Para verificar a presença de dependência espacial, normalmente faz-se uma pré- análise, com gráficos estatísticos básicos, como dispersão e boxplot, considerando algum as- pecto espacial dos dados, como latitude ou direção (CRESSIE, 1993). Além disso, a visua- lização de mapas temáticos que descrevem o padrão espacial do fenômeno, com Sistemas de Informação Geográfica (SIG) é importante e auxilia na identificação de padrões. Entretanto, não deve limitar-se a essa interpretação visual. Câmara (2004) afirma que outras verificações são importantes, incluindo a distinção entre padrões aleatórios ou definidos, possíveis variáveis que expliquem a causa do fenômeno e a existência de agrupamentos com padrões diferenciados. Para isso, faz-se uma análise exploratória aplicando testes estatísticos para con- firmar a presença de autocorrelação espacial. Tais testes são baseados na magnitude de um indicador que combina o valor observado em cada região com os valores das áreas vizinhas, medindo a contiguidade espacial. Esses testes utilizam uma matriz de proximidade, que descreve as relações de vizi- nhança entre as sub-regiões. Pode-se considerar, para construir essa matriz: as distâncias entre os centróides de cada região, a existência de um limite comum ou o comprimento da fronteira entre as sub-regiões (CÂMARA, 2004). A matriz é quadrada, com dimensões que dependem do número de sub-regiões. Os elementos wi j da matriz W têm um valor diferente de zero quando são vizinhos e zero caso contrário. Para facilidade de interpretação, normalmente aplica-se a padronização dos valores, de modo que a soma de cada linha seja unitária. Segundo Anselin (1992), a matriz de proximidade espacial resume a topologia dos dados em termos da teoria de grafos. Com a determinação da matriz de proximidade espacial, pode-se obter as métricas de autocorrelação espacial. As medidas mais comuns são a estatística de Moran, baseada em produtos cruzados, e o índice de Geary, que emprega diferenças quadráticas. O índice I de Moran, dado pela expressão 2.18, assemelha-se ao correlograma (DRUCK et al., 2004), sendo uma medida de autocorrelação espacial. Nessa expressão, n é o número de áreas, zi é o valor do atributo considerado na área, z é o valor médio do atributo e wi j são os elementos da matriz de proximidade espacial normalizada. Essa medida considera apenas os vizinhos de primeira ordem. Pode-se estender a idéia para matrizes de proximidade de maior ordem (CÂMARA, 2004). Após a obtenção do índice, é importante avaliar sua validade estatística e a significância da correlação. Ressalta-se que o teste de Moran deve ser usado quando o dado é estacionário, 50 em primeira e segunda ordem, sendo a métrica mais utilizada para testar a hipótese nula da ausência de autocorrelação espacial (CRESSIE; WIKLE, 2011). I = n ∑ i=1 n ∑ j=1 wi j(zi − z)(z j − z) n ∑ i=1 (zi − z)2 (2.18) O teste C, de Geary, é a outra métrica de autocorrelação espacial, dado pela expres- são 2.19. Nesse teste, autocorrelação espacial positiva é indicada por um valor menor que 1 (DRUCK et al., 2004). C = (n−1) n ∑ i=1 n ∑ j=1 wi j(zi − z j) 2 n ∑ i=1 n ∑ j=1 wi j n ∑ i=1 z2 i (2.19) Quando a natureza dos processos envolvidos pressupõe a existência de diferentes regimes de correlação espacial em áreas distintas, pode-se utilizar os indicadores locais como a função LISA e posteriormente o diagrama de espalhamento de Moran, descritor do grau de similaridade dos vizinhos (ANDRADE et al., 2007). Para isso substitui-se o indicador global de Moran por um indicador local Ii, dado pela expressão 2.20, na subárea composta pelos vizinhos. Ii = zi n ∑ j=1 wi jz j n ∑ j=1 z2 j (2.20) Constrói-se, então, um gráfico bidimensional de z (valores normalizados de Ii) por wz (média dos vizinhos), que é dividido em quatro quadrantes, como mostrado na Figura 11. Os quadrantes Q1 e Q2 representam pontos de associação espacial positiva, pois a média da região é semelhante à dos vizinhos. Os quadrantes Q3 e Q4 possui pontos de associação es- pacial negativa, pois o valor da região não é semelhante ao de seus vizinhos. Dessa forma, a dependência espacial confirma-se quando a maioria dos pontos está localizada nos quadrantes Q1 e Q2. A partir da significância estatística do índice local de Moran (Ii), pode-se gerar um mapa da distribuição espacial das regiões que apresentam correlação local significativamente diferente do resto dos dados (quadrantes Q3 e Q4). Esse mapa é denominado por Anselin 51 Figura 11: Diagrama de espalhamento de Moran Fonte: Câmara (2004) (1992) de mapa indicador local de associação espacial ou Local Indicator of Spatial Association (LISA). Permite a identificação de valores extremos no espaço ou aspectos de estacionariedade, servindo, inclusive, como um método exploratório de análise de dados espaciais (CRESSIE; WIKLE, 2011). 2.7 Interpolação Os métodos de interpolação existentes podem ser determinísticos ou estatísticos, que consideram, por sua vez, efeitos locais ou globais. Cita-se como exemplos de método deter- minísticos locais aqueles que estimam cada ponto da superfície a partir dos valores das amostras mais próximas, com funções como o inverso do quadrado da distância ou média ponderada. Por outro lado, a superfície de tendência considera variações em larga escala, representando efeitos globais (DRUCK et al., 2004). Em termos de métodos determinísticos locais, cita-se a média ponderada, em que o valor de cada elemento da grade a ser gerada é definido a partir das amostras vizinhas, ponde- rado pelo inverso do quadrado da distância euclidiana do ponto da grade à amostra considerada. Matematicamente, esse método é dado pela Equação 2.21, onde ẑi é o valor de cota de um ponto i qualquer da grade; z j é a cota de uma amostra j vizinha do ponto i da grade; wi j é um fator de ponderação definido pela Equação 2.22, em que di j é o valor da distância euclidiana da amostra j ao ponto i da grade. 52 ẑi = n ∑ j=1 wi jz j n ∑ j=1 wi j (2.21) wi j = 1 d2 i j (2.22) Os métodos estatísticos referem-se aos procedimentos de krigeagem, denominados geoestatísticos. Esses estimadores apresentam a propriedade de serem os melhores estimadores lineares, não serem tendenciosos e de minimizarem a variância dos erros (ISAAKS; SRISVAS- TAVA, 1989). É uma técnica de estimação de superfícies baseada na modelagem da estrutura de correlação espacial. A hipótese implícita é a de que o processo é estacionário. O semivariograma é uma ferramenta básica de suporte às técnicas de krigeagem, pois permite representar quantitativamente a variação de um fenômeno regionalizado no espaço, sendo uma medida da dependência espacial (CRESSIE; WIKLE, 2011). O semivariograma é calculado experimentalmente, por tentativa e erro. A cada passo, verifica-se a adequação do modelo teórico. A cada ajuste, pode-se ou não redefinir o modelo, até obter um que seja considerado satisfatório. Os parâmetros que o caracterizam, conforme Druck et al. (2004) são: a) Alcance (a): distância máxima de correlação espacial entre as amostras; b) Patamar (C): valor do semivariograma que corresponde ao seu alcance, a partir do qual não há dependência espacial; c) Efeito pepita (C0): valor do semivariograma à medida em que a distância entre as amostras (h) tende a zero. A Figura 12 apresenta o gráfico que ilustra os parâmetros do semivariograma. Para determinação do semivariograma, deve-se considerar se o fenômeno em estudo é isotrópico, com comportamento igual em todas as direções, ou anisotrópico, caso em qua a estrutura espacial do fenômeno varia conforme a distância e direção (DRUCK et al., 2004). 53 Figura 12: Parâmetros do semivariograma Fonte: Druck et al. (2004) 2.8 Probabilidades Condicionais A modelagem do nascimento de plantas em regiões não colonizadas foi implemen- tada com base em probabilidades condicionais. Esse conceito depende de probabilidades a priori, estimadas sem nenhuma fonte de informação adicional. A probabilidade a posteriori, por sua vez, considera outras fontes de informação que influenciem na possibilidade de um evento ocorrer ou não, que são evidências relativas às variáveis aleatórias anteriormente desco- nhecidas. Assim, a equação 2.23, P(chuva|mês), indica a probabilidade a posteriori de chover, dado um determinado mês do ano, P(chuva) é a probabilidade a priori e o fator varia de acordo com o mês, baseado em dados históricos. Pode-se dizer, desta forma, que o mês do ano é uma evidência, ou uma fonte de informação adicional, a qual poderia não ser única, mas um conjunto de evidências. P(chuva|mes) = P(chuva)∗ f ator_mês (2.23) Quando se tem vários conjuntos de dados e deseja-se combiná-los, pode-se aplicar a abordagem bayesiana. A forma log-linear do modelo bayesiano é conhecida como pesos de evidência. Deve ser aplicada quando há dados suficientes para estimar a importância relativa das evidências por médias estatísticas, sendo, portanto, orientada a dados (BONHAM-CARTER, 1994). O método de pesos de evidência pode ser aplicado a dados espaciais e fundamenta-se nos conceitos de probabilidade, os quais serão brevemente apresentados. 54 A Equação 2.24 indica uma probabilidade condicional, em que o D poderia estar as- sociado à depósito de minerais, que estaria sendo procurado em uma região e B estaria associado a um padrão binário, uma evidência que pode auxiliar na predição desejada. Um exemplo desse padrão poderia ser um mapa de anomalias eletromagnéticas (BONHAM-CARTER, 1994). P{D|B}= P{D ⋂ B} P{B} (2.24) Por considerar representação de eventos espaciais, P{D ⋂ B} equivale à proporção de área total ocupada por B e D juntos. Desta forma, pode-se reescrever a Equação 2.24 como P{D|B} = N{D ⋂ B} N{T} , em que N{T} é a área total da região de estudo. Reescrevendo a Equação 2.24 com essa definição, tem-se a Equação 2.25. P{D|B}= N{D ⋂ B} N{B} (2.25) A Equação 2.26 expressa a probabilidade condicional de B, dado D. A partir disto, reescreve-se a Equação 2.24 sem o operador de intersecção, como na Equação 2.27. A informa- ção do numerador pode frequentemente ser determinada a partir de uma amostragem estatística de depósitos para determinar a proporção que está relacionada ao indicador de evidência. A informação do denominador vem do conhecimento da ocorrência esperada do padrão indicador, em geral determinada a partir de mapeamentos (BONHAM-CARTER, 1994). P{B|D}= P{B ⋂ D} P{D} (2.26) P{D|B}= P{D}∗ P{B|D} P{B} (2.27) De modo análogo, pode-se escrever a expressão 2.28, a qual representa a proba- bilidade posterior de um depósito ocorrer, dada a ausência do indicador padrão de anomalia (B). P{D|B}= P{D}∗ P{B|D} P{B} (2.28) Com base nestas equações matemáticas, deriva-se o conceito de odds, ou razão de chance, definido como a razão de probabilidade de que um evento vai ocorrer em relação à probabilidade de que ele não ocorrerá (O = P/(1−P)). Valores de razão de chance menores 55 que 1 correspondem às probabilidades menores que 0.5. Quando se tem o logaritmo natural da razão de chance, denomina-se logito ou logits. Considerando-se a escala de probabilidades de 0 a 1, o logito destas probabilidades é 0 para o centr