UNIVERSIDADE ESTADUAL PAULISTA Instituto de Geociências e Ciências Exatas Campus de Rio Claro MODELAGEM GEOESTATÍSTICA POR GEOPROCESSAMENTO EM UMA ÁREA DA BAIXADA SANTISTA Roberto Wagner Lourenço Orientador: Prof. Dr. Paulo Milton Barbosa Landim Tese de Doutorado elaborada junto ao Curso de Pós Graduação em Geociências, Área de Concentração em Geociências e Meio Ambiente, para a obtenção do Título de Doutor em Geociências. Rio Claro (SP) 2002 Banca Examinadora __________________________________ Prof. Dr. Paulo Milton Barbosa Landim __________________________________ Prof. Dr. Ailton Luchiari __________________________________ Prof. Dr. Arlei Benedito Macedo __________________________________ Prof. Dr. Ardemírio Barros Silva __________________________________ Prof. Dr.Juércio Tavares de Mattos MODELAGEM GEOESTATÍSTICA POR GEOPROCESSAMENTO EM UMA ÁREA DA BAIXADA SANTISTA Resumo: O aspecto fundamental do trabalho é mostrar a importância da integração de um Sistema de Informações Geográficas (SIG) com procedimentos geoestatísticos na análise e interpretação de dados distribuídos no tempo e no espaço. A idéia é aplicar uma análise integrada sobre o meio ambiente que melhor caracterize os aspectos físicos com ênfase na variação do índice de vegetação de diferença normalizada (IVDN) do ano 1989 para o ano 1997. O propósito é também realizar a caracterização morfométrica do relevo, principalmente com relação à sua declividade, mapear a concentração e distribuição espacial de metais pesados no solo, obtidos por amostragens georreferenciadas do horizonte Bw (camada do solo com profundidade de até 1m) na área de estudo. A metodologia envolve o uso e a integração de documentos cartográficos, tais como mapas topográficos, fotografias aéreas, imagens de satélite e levantamento de campo, cada qual direcionado a uma representação espacial, utilizando-se para sua manipulação de um Sistema de Informações Geográficas (SIG). A proposta é aplicada em uma área pertencente à Baixada Santista, que esta inserida na Carta Topográfica em 1:50.000 do IGG – SP – 1972 FOLHA DE SANTOS. Depois de obtidos os diversos mapas são elaborados estudos de regressão múltipla espacial, os quais demonstram correlações significativas entre as variáveis “metais pesados” e “declividade” na mudança dos índices de vegetação para os anos de 1989 e 1997. Palvras Chave: SIG, Geoestatística, Índices de Vegetação, Metal Pesado. MODELING GEOSTATISTICS FOR GEOPROCESSING IN AN AREA OF BAIXADA SANTISTA Abstract Summary: The basic approach of the work is to show the importance of the integration of a Geographic Information System (GIS) with geostatístics procedures in the analysis and interpretation of data distributed in time and space. The idea is to apply an environment integrated analysis that better characterizes the geographic landscape with emphasis in the variation of the Normalized Difference Vegetation Index (NDVI) during the years of 1989 to 1997. The purpose is also understand the morphometric characterization of the relief, mainly regarding its slope, mapping concentration and space distribution of heavy metals in the ground, obtained by sampling of the Bw horizon (layer of the ground with depth until 1m), in the study area. The methodology involves the use and the integration of cartographic documents, such as topographical maps, air photographs, satellite images and field survey, each one directed to a space representation of the studied event and manipulated by a Geographic Information System. The proposal study is applied in an area pertaining to the “Baixada Santista” that is inserted in the 1:50,000 Topographical Chart of the Institute of Geophysics and Geology (IGG) SP. 1972 “Folha de Santos”. After obtained the diverse maps multiple regression analysis had been elaborated, which demonstrated the significant correlation between changeable heavy metals and slope controlling the vegetation indices change during the studied period of time. Keywords: GIS, Geostatístics, Vegetation Index, Heavy Metals 1 CAPÍTULO 1 1 - INTRODUÇÃO As diversas atividades econômicas que envolvem investimentos de grande porte buscam áreas adequadas para seu estabelecimento, em função de variáveis físico-naturais, sócio-econômicas e de infra-estrutura regional. As regiões costeiras, de uma forma geral, apresentam forte atração para o desenvolvimento de atividades industriais, portuárias e turísticas, além de constituírem áreas historicamente ocupadas desde o processo de colonização em nosso país. Como não poderia deixar de ser, a planície costeira da Baixada Santista apresenta-se com essas características e, ainda, com alto índice de degradação ambiental, conseqüência de processos temporais e espaciais de ocupação atuantes na área. Dentro deste contexto, a realização de coleta e tratamento de informações espaciais, além da geração de mapas convencionais, arquivos digitais, e outros, resultantes da representação ambiental levando-se em conta a complexidade locacional dos variados ecossistemas atuantes na área, deverão contribuir para o estudo da dinâmica sócio-ambiental da área de estudo. Para execução deste objetivo, o trabalho foi estruturado de maneira que cada tema que norteia a proposta metodológica possa ser consultado de forma separada, sem que para isso seja necessário um conhecimento global sobre os temas, envolvendo os conhecimentos fundamentais para a compreensão do assunto, amparada por revisão bibliográfica, metodologia, resultados e discussões. No âmbito geral o trabalho apresenta os seguintes tópicos: revisão sobre o uso de técnicas de geoprocessamento e métodos geoestatísticos no estudo integrado do meio físico, biótico e antrópico; análise da medida quantitativa da vegetação de mata atlântica, e a avaliação da distribuição espacial do teor de metais pesados no solo bem como a variação topográfica da área de estudo. Ao final são apresentadas as conclusões finais envolvendo considerações sobre todos os temas abordados em conjunto. 2 2 – LOCALIZAÇÃO E CARACTERÍSTICAS BÁSICAS DA ÁREA DE ESTUDO A Folha de Santos de projeção U.T.M, cobre uma área de aproximadamente 794 km2, entre os paralelos de 23º45’00’’S e 24º03’17’’S e os meridianos de 46º15’00’’ e 46º30’00’’, compreendendo extensa área da região denominada Baixada Santista, na Faixa Atlântica do Estado de São Paulo. Os principais municípios da Região da Baixada Santista são: Santos e Cubatão (inteiramente representados), Guarujá, Praia Grande e São Vicente, com suas respectivas sedes e, também, parte predominantemente rural, de alguns municípios da Região da Grande São Paulo – Ribeirão Pires, Rio Grande da Serra, Santo André e São Bernardo do Campo (Figura 1). Figura 1 – Localização da área de estudo A Baixada Santista é uma das áreas de ocupação mais antiga do país, entretanto, foi somente após a implantação do pólo industrial em Cubatão nos anos 50, todo o contorno passou a sofrer as conseqüências da ocupação desregrada dessa área através do aumento populacional, da extensão urbana, da construção das Vias Anchieta e Imigrantes etc. (Nunes, 1990). 3 A industrialização química e petroquímica contribuiu, segundo Ferreira (1980), com o maior número de contaminantes atmosféricos, seguindo-se a metalúrgica e siderúrgica. Baccaro (1982) observa que, “os reflexos desta atuação antrópica são demonstrados na alta poluição do ar, do solo, da água; na destruição da vegetação; no assoreamento dos vales; nos movimentos de massa e nos ravinamentos das vertentes escarpadas deste setor da Serra do Mar”. Os movimentos de massa que realmente proporcionaram drásticas mudanças nesta paisagem foram os escorregamentos, provocando o desequilíbrio das vertentes, a alteração da morfologia no talvegue dos canais, a remoção da mata, o abalo ou a destruição de obras de engenharia, o assoreamento dos vales, entre outras conseqüências. (Baccaro 1982) Segundo Ab’Saber (1987), por vinte anos a fortíssima poluição atmosférica, emitida pelas numerosas indústrias do Distrito Industrial de Cubatão-Piaçaguera, vem afetando o espaço aéreo da cidade e a frente escarpada da Serra do Mar, sendo que o efeito imediato é a extinção generalizada da vegetação natural. A dinâmica dos processos atuantes associados ao uso desordenado do solo, relevo extremamente dissecado, altas declividades, alto índice pluviométricos, dentre outras variáveis favorece maior interação entre energia e matéria, determinando assim, a morfodinâmica regional da área. 2.1 – Clima Ainda, de acordo com Ab’Saber (1987), a área em estudo da Baixada Santista é caracterizada por topografia irregular, com serras, vales, planícies e manguezais, necessitando, assim, de uma ampla rede de estações meteorológicas para dar-lhe uma cobertura adequada. Esta rede não existe atualmente, devido à diferença de finalidades e objetivos dos órgãos, instituições e firmas particulares que atuam na área; cada qual instala o equipamento meteorológico para atender a seus objetivos, sem nenhuma integração num plano ou programa global para a região. Assim, por meio dos registros destes equipamentos, foi possível, apenas, uma caracterização aproximada do clima da região, objetivando a avaliação de seus efeitos sobre o meio ambiente, no que diz respeito, principalmente, à qualidade do ar e da água, tendo sido necessário, para análise de alguns aspectos do tema, o 4 recurso da extrapolação de informações obtidas em trabalhos desenvolvidos para regiões vizinhas. Quanto à situação sinóptica, a área considerada na Carta do Meio Ambiente, sofre os efeitos da atuação de três massas de ar, subtropical, polar e equatorial continental. A massa de ar equatorial possui atuação máxima durante os meses de verão, enquanto a subtropical e a polar predominam durante o resto do ano. Os períodos de transição entre o verão e o inverno, e vice-versa, são extremamente curtos, podendo-se dizer que, praticamente inexistem estações de outono e primavera nesta região. No inverno, há predominância da ação do sistema anticiclônico semifixo subtropical atlântico, alternado com a do polar, este último com menor freqüência, uma vez que o deslocamento do primeiro para o oceano ocorre somente, quando da passagem de um sistema frontal. A permanência desse anticiclone sobre o continente provoca estabilidade, de origem termodinâmica, condição esta altamente desfavorável para dispersão atmosférica. No verão, o sistema dominante é o de baixa pressão tropical úmido, o qual provoca condições de instabilidade termodinâmica, favorável à dispersão atmosférica. No que se refere à temperatura - movimentos verticais e inversões térmicas avaliados através do perfil de temperatura, são provocados pela presença da massa equatorial, mais freqüente durante os meses de verão, gerando uma situação de instabilidade térmica, o que significa ausência quase total das inversões térmicas, e, portanto, condições favoráveis à dispersão de poluentes. As massas subtropicais e polares, provocadas por anticiclones, que caracterizam o perfil térmico com uma relativa instabilidade, geram diferentes tipos de inversões térmicas ao longo deste perfil. Nas camadas acima de 2.000m, geralmente, as inversões são do tipo de subsidência e podem, ter, em Cubatão, a mesma freqüência alta da cidade de São Paulo. Deve-se assinalar, que a interferência da topografia, nessa altitude, é mínima. Quanto às inversões térmicas do tipo radiação, que têm a base na superfície do solo e o topo, atingindo, às vezes, 400 m de altitude, devem ter, na área de Cubatão, freqüência e duração maiores que as de São Paulo. Isto porque, em 5 princípio, quanto mais reduzida à energia solar incidente numa porção da superfície terrestre, maior a estabilidade termodinâmica de sua atmosfera. O inverno de São Paulo, estação que registra a mínima duração de radiação solar do ano, tem, como resultado, prolongadas inversões térmicas, quase diariamente, e, conseqüentemente, problemas de poluição atmosférica, que se agravam nas áreas onde a radiação é mais reduzida ainda, por influência de topografia mais acidentada. Na região de Cubatão, essa influência da topografia sobre a duração das inversões térmicas do tipo radiação é muito maior, devido às formas íngremes das vertentes dos principais vales e, principalmente, pela disposição geográfica desse relevo, grosso modo, perpendicular ao sentido da trajetória do sol. Nesta situação, a estabilidade termodinâmica, então reinante, representa condições altamente propícias à concentração aguda dos problemas atmosféricos. A atmosfera da Baixada Santista apresenta, como característica predominante, alta média da umidade relativa do ar ao longo do ano, a qual varia entre 70 e 90%. Isto se deve à posição geográfica e meteorológica da região: geograficamente, por ser uma área litorânea próxima ao Oceano Atlântico, sofre constantemente, sua marcante influência; meteorologicamente, pelas massas equatoriais e marítimas que atuam, quase continuamente, na área. Do ponto de vista da poluição atmosférica, este alto índice de umidade do ar é desfavorável, devido à reação química que provoca com certos poluentes gasosos, como, por exemplo, o SO2 - dióxido de enxofre, transformando-o em H2S04 - ácido sulfúreo - que causa grandes danos à fauna e à flora da região. A maior quantidade de precipitações pluviométricas, na região, ocorre durante os meses de verão - outubro a marco - representando 70% da média anual, a qual varia entre 2.000 e 3.000mm de uma área para outra. Essa chuva é provocada, geralmente, pela massa equatorial e possui as seguintes características: é intensa, de curta duração algumas vezes, outra de longa duração. Esta última causa importantes efeitos adversos na Serra do Mar, onde as vertentes apresentam alto grau de declividade. É também adversa aos rios, pelo material de erosão transportado e depositado em seus leitos, diminuindo, assim, suas capacidades, alterando o balanço hídrico e provocando alagamentos e inundações na área; é altamente favorável à redução da poluição, uma vez que provoca a deposição do material em suspensão e a relativa redução na concentração dos gases. E aquelas 6 provocadas pelos sistemas frontais, são geralmente de intensidade moderada e têm uma freqüência quinzenal na área. 2.2 - Vegetação A área em estudo caracteriza-se pela presença de três compartimentos distintos apresentando, em cada um deles, nítidas variações no tocante às demais características naturais, inclusive à distribuição espacial da vegetação. O Planalto, com altitudes variando entre 760 e 900 m e, anteriormente, revestido pela Floresta Subtropical, encontra-se hoje, recoberto, em sua maior parte, por uma floresta degenerada, contendo capoeiras e, também, pelos "Campos Antrópicos", resultantes dos desmatamentos que ocorrem, principalmente, nas áreas próximas às Rodovias e sob os fios de alta tensão. Ainda no Planalto, ao Norte da Carta, nota-se também, a presença de algumas manchas de reflorestamento, com predominância de eucaliptos. No compartimento das escarpas da serra e dos morros isolados, o clima regional, quente e úmido, acelera sobremaneira a decomposição química do substrato rochoso, dando origem a camadas relativamente espessas de material decomposto (regolitos). Nesses regolitos, em função de contínuo movimento de rastejo do material de superfície, ocorrem, em geral, solos pouco desenvolvidos nas partes mais altas e, mais evoluídos, próximos à base das vertentes. Esses solos, nas áreas ainda preservadas, apresentam-se extensivamente recobertos pela "Floresta Atlântica”, compacta, com árvores altas, de 18 a 20 m de altura e copas arredondadas (Cruz, 1974). Reflexo do relativo equilíbrio bioestático, no intrincado processo de evolução das vertentes das serras e morros, essa cobertura vegetal atua como agente estabilizador do solo, ao refrear os processos erosivos. O terceiro compartimento topográfico, a Baixada Litorânea, é formada por sedimentos quaternários marinhos, flúvio-marinhos e fluviais, cujas origens e evolução acarretaram o desenvolvimento de diferentes tipos de solos, base da existência de variadas comunidades vegetais: o jundú - vegetação cuja ocorrência se dá sobre os cordões litorâneos arenosos recentes - é caracterizado como "um conjunto de indivíduos lenhosos, que se agrupam de forma densa e emaranhada, apresentando altura de até 5 m" (Cruz, 1974). Praticamente destruídos pela 7 urbanização na Baixada Santista, apenas a Praia Grande guarda, ainda, algumas áreas residuárias dessa formação vegetal. A vegetação de restinga ou floresta tropical de planície litorânea, que é relativamente densa e formada de arbustos e árvores perenes, lembra, no seu aspecto, uma transição entre o jundú e a mata atlântica. Domina todas as áreas de planícies de restingas antigas, compreendidas entre a base das encostas das serras e morros e os limites do jundú e dos manguezais. Assim como o jundú, essa vegetação sofreu, também, os impactos de uma ocupação intensa, ora devastada para a utilização agrícola - bananicultura - e pela exploração de areia, ora dando lugar aos assentamentos urbanos e loteamentos; restam dela, apenas manchas esparsas na Ilha de Santo Amaro, próximo a Vicente de Carvalho, em outras áreas a leste da Via Piaçagüera e, no quadrante Sudoeste da Carta, em terras dos municípios de São Vicente e Praia Grande. Algumas áreas próximas à Rodovia Piaçagüera e outras ao longo da Via Anchieta, antes ocupadas pela bananicultura, encontram-se hoje, em vias de repovoamento vegetal espontâneo, em razão do progressivo abandono que vem sofrendo essa cultura na Baixada Santista. Ao longo dos estuários de Santos e São Vicente e, acompanhando a penetração dos inúmeros canais, encontram-se os manguezais. Estabelecidos sobre um solo arenoso, seu avanço se dá no sentido da corrente de vazante, acompanhando a colmatagem progressiva da Baixada Santista. Nesse sentido, os mesmos funcionam como fixadores de sedimentos, além de possuírem a função de filtro biológico e serem o primeiro elo de um riquíssimo ecossistema marinho. 2.3 - Hidrografia As águas continentais representadas na Carta pertencem a dois dos três grandes domínios hidrográficos do Estado de São Paulo: o da Bacia do Paraná e o das numerosas pequenas bacias encaixadas na Vertente Atlântica. Do primeiro deles, no Planalto Paulistano, comparecem 14% dos 560 km2 do sub-sistema da Represa Billings, integrante da Bacia do Alto Tietê através de seus principais formadores, o Rio Grande ou Jurubatuba e Pequeno. O Rio Grande, que fornece 1O m3/s para abastecimento da região do ABC, foi barrado na Ponte da Via 8 Anchieta, para se evitar mistura com as águas poluídas do corpo central da Billings, barragem esta localizada fora da área de abrangência da Carta. Ainda no Planalto, ocupando uma área de 17 km2, figura na Carta o Reservatório do Alto Rio das Pedras, afluente do Cubatão. É através dele, que se faz o controle de vazões das águas revertidas do Alto Tietê, por intermédio do Canal do Rio Pinheiros e do corpo central da Represa Billings. Daí são elas conduzidas, por dutos, superficiais e subterrâneos, até o sopé da Serra do Mar, para geração da energia na usina Henry Borden em Cubatão, e, excepcionalmente, para complementação do abastecimento de água da Baixada Santista, em épocas de grande estiagem e/ou aumento da demanda. Vale assinalar que, em função da degradação da qualidade das águas do corpo central da Billings, causada pelo aumento constante das cargas remanescentes de esgotos urbanos e industriais gerados na Grande São Paulo, foram iniciadas, em 1983, operações experimentais nos bombeamentos do Rio Pinheiros, visando ao estabelecimento de um rateio balanceado daquelas vazões poluídas, entre a Baixada Santista e o Médio Tietê, com o fim de minimizar o impacto das cargas poluidoras. Aparentemente isolada da hidrografia do Planalto, como se viu anteriormente, a rede fluvial tributária do Estuário de Santos é constituída por uma série de rios que nascem nas vertentes da Serra do Mar, onde possuem características torrenciais, desembocando nos manguezais. Essa situação, juntamente com a pequena declividade dos cursos inferiores, favorece a formação de deltas, com diversos canais. É o caso, por exemplo, do Rio Cubatão, cujo regime hidráulico assume características similares aos dos estuários estratificados, dada a relação entre as descargas líquidas afluentes e os volumes de água do mar que entram com a maré. A intervenção antrópica tem modificado substancialmente as condições naturais das bacias fluviais da Baixada Santista. A transferência de volumes líquidos da bacia do Rio Tietê para a do Cubatão e a intensa intervenção nas áreas dos cursos médios e inferiores dos rios Cubatão, Perequê e Moji alteram o regime hidráulico sedimentológico de tal modo, que as conseqüências se fazem sentir no próprio estuário. 9 O Estuário de Santos, segundo Tommasi (1979), ao contrário de um estuário clássico é, na realidade, uma baía acoplada a um sistema estuarino, numa região que se configura, historicamente como um páleo-arquipélago. Seu padrão de circulação é basicamente determinado pelas correntes de maré, com águas altamente estratificadas, especialmente no Canal de Santos. Esta estratificação existe de forma acentuada e pode ser observada até o interior do Canal da Cosipa. Embora não existam estudos acabados comprobatórios da ocorrência e comportamento da cunha salina nos trechos inferiores de todos os rios, a montante do limite superior do estuário, sabe-se que ela ocorre no Rio Cubatão, tendo em vista a construção, pela PETROBRAS de barragem móvel, à altura da ponte da Rodovia Piaçagüera, acionada nos horários de preamar, para evitar salinização no seu ponto de captação de água no rio. Quanto ao processo de assoreamento do Estuário-Santista, as marés e suas propagações passam a ser os elementos dominantes do processo de assoreamento, onde a geometria do Estuário é o fator de controle da deposição de sedimentos, que, conforme se constata através do exame da Carta, ocorre, preferencialmente, nas seções alargadas, que provocam redução na velocidade das correntes. 2.4 – Geomorfologia Geomorfologicamente a área é constituída de compartimentos bem individualizados, mas de evolução interdependente: a Serra do Mar, as planícies de piemonte, os manguezais, as planícies de páleo-restingas e as praias costeiras. Além disso, ao Norte da Carta, acha-se representado trecho do Planalto Atlântico Paulistano, de terrenos Pré-Cambrianos, com altitudes entre 760 e 800m ou mais, em alguns pontos, e que se individualiza pela presença de um relevo mamelonar, pertencente ao domínio dos "mares de morros". Destaca-se, dentre os compartimentos citados, a Serra do Mar, na realidade, constituída das escarpas costeiras dos terrenos Pré-Cambrianos do Planalto, com ressalto topográfico entre 800 e 1000m. Segundo Ab'Saber in Azevedo (1965), teria, a mesma, se originado por falhamentos, concomitantes a levantamentos epirogenéticos, que afetaram a região, durante o Cretáceo e o Terciário. O nível do mar estaria, então, a 80 - 100m abaixo do atual, o que, associado àqueles eventos, propiciou condições para o entalhamento e alargamento dos vales precedentes, cuja 10 orientação já se condicionava à da “Direção Brasileira de Dobramentos SW – NE”, gerando desdobramentos da crista principal, em forma de espigões avançados da mesma e, também, de morros isolados. Este fato pode ser observado na Carta, através do exame da disposição geográfica desses espigões, que recebem denominações locais de Serras do Quilombo, do Morrão ou Mourão e da Mãe Maria, estas duas últimas, de direções diametralmente opostas, lembrando, vistas de cima, "pinças de caranguejo", na observação de Ab'Saber, bem como dos interflúvios dos rios Jurubatuba e Diana e, ainda dos morros de Santos - São Vicente - Praia Grande e os de Guarujá. Posteriormente à formação e ao alargamento dos vales, na “Transgressão Flandriana”, o nível do mar teria subido de 5 a 6 m acima do atual, alagando aqueles e formando a páleo-baía de Santos e o páleo-arquipéiago, este decorrente da insulação de interflúvios de antigos vales. De acordo com Prandini (CETESB 1982) o evento transgressivo é documentado, na atual Baixada, pela presença de três tipos de depósitos: terraços fluviais, sedimentos de praias e de mar raso, encontrando-se, também, vestígios de atividade eólica, que chegam a caracterizar pequenos campos de dunas, atualmente estabilizados e quase totalmente mascarados pela erosão ou destruídos por terraplanagem. O rebaixamento do mar até seu nível atual condicionou a erosão regressiva das cabeceiras de alguns rios serranos sobre o Planalto Atlântico - cujos exemplos mais notáveis são as dos rios das Pedras e Perequê, assim como o entalhamento dos depósitos sedimentares mais antigos, estabelecendo-se as planícies de maré e planícies aluvionares, bem como as praias, que configuram, atualmente, o compartimento topográfico da Baixada Santista propriamente dita, com seus morros isolados. Pelas razões expostas, nessa planície, ainda em processo de formação no "páleo-golfo", distinguem-se as faixas de terrenos mais secos, compreendendo estreitos terraços sedimentares sobrelevados e depósitos coluviais e aluviais - nas baixas encostas de serras e morros e, também, as faixas de antigas praias e restingas costeiras. As áreas ainda em processo de sedimentação correspondem ao que resta do "páleo-golfo", caracterizando amplos manguezais, planícies de maré, que se interpõem entre os dois tipos citados de terrenos planos mais secos, no interior da região. Para elas convergem, em forma de pequenos deltas e/ou 11 meandrando, os rios oriundos da Serra do Mar, que ali se confundem, freqüentemente, com os canais do complexo estuarino. Esses manguezais, em lento processo de colmatagem, funcionam, onde preservados, como verdadeiros filtros geomorfológicos dos sedimentos trazidos, principalmente, pelos rios oriundos das encostas Pré-Cambrianas. Estas últimas caracterizam-se pela formação de regolitos relativamente espessos, em decorrência do clima quente e úmido, gerador de intenso intemperismo químico. A evolução dessas encostas, mesmo quando cobertas de densa cobertura florestal, se faz em função das altas declividades por processos de remoção rápida como escorregamentos e, lenta ou seja rastejo, resultando na formação de rampas de colúvio, talus e áreas de exposição de rocha. Ao regime torrencial de seus cursos d'água, associam-se sedimentos de granulometria variada, incluindo clásticos grossos, com grande proporção de blocos e matacões. Nas calhas maiores e no sopé das encostas, as frações mais grossas depositam-se, rapidamente, em cones de dejeção, continuando a serem transportados, principalmente areias e sedimentos mais finos, que, retrabalhados pela maré, acabam ficando retidos no filtro dos manguezais ou, então, nos canais principais do estuário, assoreando-os, em forma de bancos de areia e coroas submersas, e forçando a constantes dragagens nos canais de navegação. Nos terrenos mais secos da planície, de áreas relativamente reduzidas, é que seu deu a expansão urbana e industrial dos municípios da Baixada Santista, com freqüentes incursões nos manguezais, para conquista de novos espaços. No caso do município de Cubatão, cujo território abrange 160 km2, cerca de 58% são constituídos de serras e morros, 24% de manguezais e 18% de planícies aluviais, de piemonte e mangues aterrados. Considerando-se que a planície constitui uma faixa de 11 km de comprimento e largura variável entre 02 e 04 km, confinada entre a serra e os manguezais e só reaparece, em dimensões variáveis, sob a forma de aterros de mangues ou parcelas de terrenos mais elevados no interior dos próprios manguezais, depreendem-se, facilmente, os problemas gerados pelo crescimento urbano e industrial do município, realizados de forma caótica, em espaço tão restrito. Ao Sul da Carta, as ilhas de São Vicente e Santo Amaro constituem, respectivamente, sítio de expansão dos núcleos urbanos de Santos, São Vicente e 12 Guarujá, cujos limites administrativos extrapolam aqueles da Folha Topográfica Base, assim como os do município de Praia Grande, situado nas porções S e SW, confinando com a área continental do município de São Vicente. Nesses quatros municípios, as planícies enxutas (ou drenadas, como as de Santos e São Vicente,) já estão com suas maiores áreas contínuas praticamente tomadas pela urbanização, restando, ao conjunto, cerca de 50 km2 na retroterra da orla marítima, mas bastante fragmentados, pela sua intercalação com as áreas de manguezais. A figura 2 mostra as características da paisagem atual da área de estudo, elaborado sobre a composição colorida de uma componente principal das bandas R3G2B1 de uma imagem de satélite do ano de 1997. 14 3 – OBJETIVOS Este trabalho tem como objetivo principal apresentar e aplicar uma proposta metodológica, em escala regional, que permita compreender as condições ambientais de parte da planície costeira da Baixada Santista, para que se possam entender os efeitos de ações antrópicas tendo como principal conseqüência a degradação sócio-ambiental. Para tanto, foi necessário contemplar os objetivos específicos, tais como: - avaliar o uso de técnicas de Cartografia Digital e de Geomatemática na construção de modelos que caracterizem o meio ambiente; - avaliar as modificações na vegetação com base em imagens de satélite de datas diferentes; - avaliar o uso da variável morfométrica declividade como indicadora da modificação na vegetação; - o mapeamento de variáveis que funcionam como agentes desencadeadores de processos de poluição no meio físico e suas implicações ambientais; - por fim, efetuar o registro em mapas, referentes aos processos ambientais estudados. 15 4 – REFERÊNCIAS BIBLIOGRÁFICAS AB’SABER, A.N., 1985. In: A Baixada Santista: aspectos geográficos, vol. 1 As bases físicas. São Paulo, Ed. USP. AZEVEDO, A., 1965. A Baixada Santista aspectos geográficos: as bases físicas. São Paulo, EDUSP, v.1. 179 p. BACCARO, 1982. Qualidade ambiental em Cubatão: subsídios para uma política de ação. São Paulo, 154p (Relatório Final). CETESB, São Paulo. - Caracterização física do porto de Santos São Paulo, 1980. 120 p - Destinação final dos resíduos sólidos na Baixada Santista. São Paulo, 1983. 52p. (relatório Anual) - Estudo dos manguezais da Baixada santista. São Paulo, 1983. 52p (relatório Anual) - Metais pesados no Estuário da Baía de Santos. São Paulo, 1980. 75p - Poluição das águas no Estuário e Baía de Santos. São Paulo, 1978. v.1-2. CRUZ, O. A., 1974. Serra do Mar e o litoral na área de Caraguatatuba: contribuição à geomorfologia tropical litorânea. São Paulo, IGOGUSP, (Série teses e monografias, nº 11) FERREIRA, M.C., 1995. Análise Integrada de Dados Espaciais e Hidrológicos no Estado de São Paulo - uma metodologia baseada em SIG’S.Tese de Doutoramento. Flch - USP. São Paulo. NUNES, J., 1991. Geographic space as a set of concrete geographic entities. In Cognitive and Linguistic aspects of Geographic space, NATO ASID 63, edited by D.M. Mark and A.U. Frank (Dordrecht: Kluwer), p. 9 – 34. TOMMASI, L.R., 1979. Considerações ecológicas sobre o Sistema estuariano de Santos. São Paulo, v.1 –3. 17 CAPÍTULO 2 5 – REVISÃO CONCEITUAL 5.1 - Geoprocessamento e Sistemas de Informações Geográficas Os estudos que tratam de Sistemas de Informações Geográficas (SIGs) ou Sistemas de Informações Georreferenciadas para modelagem com aplicações ambientais apresentam intima relação no campo das pesquisas espaciais. Embora exemplos de integração de modelos ambientais sejam muito comuns nos programas de modelagem cartográfica, é preciso ainda alcançar uma integração ótima, permitindo a construção de modelos confiáveis usando as ferramentas de um SIG. Essas condições podem ser obtidas se o estudo e a implementação do software com os dados espaciais analisados forem corretamente integrados. Nesta linha de pensamento, vários autores, entre eles Goodchild (1992), Maidment (1993), Leavesley et al (1993), Kemp (1993), conferiram um quadro numeroso de sucessivos exemplos de ligação de SIGs e modelos ambientais. É possível o uso e adaptação das funções dos SIGs existentes para construir modelos ambientais, tendo os SIGs como interface para os parâmetros dos modelos espaciais e modelagem. Van Deursen (1995) e Wesseling et al. (1996), enfatizam que o desenvolvimento da linguagem para modelagem ambiental na construção de modelos dinâmicos usando SIG estão fortemente ligados à base de dados. A abordagem da elaboração e revisão da linguagem tem tido grande ênfase em motivações subjacente e ao esquema dos componentes mais importantes: o software, a linguagem associada ao conjunto de dados e os próprios dados. Acompanhando o raciocínio de Raper & Livingstone (1995), pode-se afirmar que a integração de modelos de dinâmica ambiental em SIG é algo visto por muitos como necessário, mas em comparação com o número de modelos implementados até hoje é pouco praticado devido à dificuldade em se conciliar a informação mantida em diferentes modelos de dados têmporo-espaciais. Como solução a esses problemas os modelos de dados semânticos que caracterizam os sistemas ambientais em consideração precisam ser definidos em um nível maior de abstração, em comparação com modelos de dados espaciais e temporais usados para representar os dados. 18 Este nível mais elevado envolve a definição de metaclasses ambientas que são adequadas para dados armazenados em diferentes modelos. Sendo assim, a informação espacial ou temporalmente referenciada, ou simplesmente estabelecida, é fundamental para um método de modelagem de sistemas ambientais baseados nesta informação, tanto para o gerenciamento correto como para a transformação desta informação. Os SIGs podem contribuir com uma importante parcela na construção de sistemas integrados, para o armazenamento, análise, visualização e modelagem de dados ambientais (Raper, 1991). Diversos autores vêm descrevendo metodologias e protótipos para esses sistemas integrados, seja em um contexto mais amplo de SIG (Fedra, 1993; Maidment, 1993), seja, fora da área dos SIGs (Farmer e Rycroft, 1991). Fedra (1993) observou que a ligação entre modelos ambientais e os SIGs está se tornando progressivamente comum, "na maioria dos casos os SIGs e os modelos ambientais não são realmente integrados - eles apenas são utilizados juntos". A questão de quando a integração é realmente presente é a chave do entendimento, semelhante à interligação entre os componentes que permitem o funcionamento do sistema. Como indicado acima, a interligação varia nas características. As bases das interligações são determinadas pelas arquiteturas e estruturas dos Sistemas de Informação e, nesses termos, a capacidade de abertura é uma chave importante. Aproximar as interligações implica em integração e em um alto grau de controle e funcionalidade com respeito ao SIG, que é foco natural para um sistema intimamente interligado. O grau de inter-relacionamento pode ser caracterizado pelo seu funcionamento ou o que ele atinge. Um sistema bem integrado deveria permitir acesso de todos os componentes do sistema aos usuários, e os dados deveriam ter suficiente informação associada a eles para poder ser usado, sem intervenção manual, por estes componentes. Um sistema bem integrado é importante porque ele deve permitir que vários problemas sejam solucionados. Os dados podem, então, serem estruturados de várias formas e processos, e associados a várias representações ou visualizações diferenciadas (Fedra, 1993). As limitações de um SIG, quando usado para as tarefas de gerenciamento de dados em um sistema de modelo ambiental integrado, são amplamente provocados 19 pelos modelos de dados subjacentes que são utilizados pelos SIGs e pelas representações derivadas daqueles modelos de dados. Isto foi comprovado por Maidment (1993), ao integrar em um SIG rotinas de modelagem hidrológica, tendo observado que “os limites mais críticos são as diferenças nos modelos de dados e no tipo de inter-relações entre variáveis que são propiciadas pelo SIG e o sistema hidrológico". Da mesma forma Nyerges (1993) escreveu, que o desenvolvimento efetivo de modelos de processos dentro de um contexto de um SIG depende da natureza da arquitetura que iniciou esse desenvolvimento. Para um SIG ser apto para manter dados derivados vindos de uma variedade de sensores diferentes e de técnicas de amostragem, e para representar e transferir dados entre uma variedade de diferentes modelos, ele necessita ser adequado para colaborar com o mapeamento de dados de um modelo para outro. Em um sistema bem integrado, os dados se localizariam na mesma base de dados e seriam acessíveis por ambos os modelos e funções do SIG (Fedra, 1993). O mesmo Fedra (1993), simulou uma situação onde o sistema é percebido pelos usuários para ser um tipo de oficina de modelagem onde os sistemas ambientais possam ser analisados, e a distinção entre as funções do SIG e as rotinas de modelagem é mesclada. Isto ilustra o fato que um dos objetivos-chave de um SIG é criar um modelo de dado espacial e possivelmente temporal, a fim de analisar e realizar operações sobre ele. 5.1.1 - Sistemas Ambientais; campo de ação Os sistemas ambientais estão entre aqueles mais complexos e menos compreendidos (Raper & Livingstone, 1995). Isto se deve a dificuldade na identificação dos elementos funcionais mais importantes no tempo e no espaço, sua natureza alojada (um dentro do outro) têmporo-espacialmente, a existência de limites do sistema, a existência de uma retroalimentação criando respostas complexas às forças externas, além de características desconhecidas dos inputs de energia externa e o impacto da intervenção e gerenciamento humano. Estas características do sistema ambiental levam ao problema da esfera de ação a uma complexidade extrema. A tentativa de manter qualquer um desses fatores fixos, enquanto os demais se 20 modificam, somente é possível em gabinete, onde se resolvem os problemas de controle dos resultados, ou com sorte, quando uma mudança da situação ocorre durante o monitoramento de campo. 5.1.2 - Organização dos dados espaciais Para modelar sistemas ambientais, são necessários a capacidade de associar dados de medidas de campo, tais como amostras de tradagem, levantamento de perfis, anotações de monitoramento, fotografias aéreas e imagens de satélite, como elementos-chave do ambiente. Por exemplo, em um sistema costeiro, os elementos serão chuvas, restingas, praias, mangues, vegetação, ocupação urbana, etc. Porém, o comportamento dessas entidades é fortemente integrado com sua expressão espacial: após uma tempestade, suas posições se modificarão, tornando difícil representá-los através de estruturas de dados geométricos fixos. Além do mais, o sistema precisa ser dinâmico, capaz de sustentar modelos processuais, e de representar cenários históricos e futuristas. Para que as tarefas de gerenciamento de dados do sistema sejam efetuadas por um SIG, este precisa ser capaz de armazenar ou representar os dados pertencentes aos elementos do ambiente da forma mais apropriada. Quando na construção de modelos se projeta os planos de representação e armazenamento de dados, estes estão quase sempre relacionados à forma em que os métodos numéricos escolhidos permitam representar os dados. Os modelos espaciais geralmente utilizados refletem os métodos numéricos que elucidam os modelos processuais, que por sua vez pode ser influenciado pelas estruturas dos dados do computador e pelos planos de armazenamento. Quando os problemas de diferenças finitas do domínio espacial são resolvidos pela estimativa de valores numéricos em uma grade regular, este método é bem adequado aos métodos computacionais. Porém, dados geográficos coletados geralmente possuem restrições específicas de amostragem espacial que lhe são impostas; a malha de amostragem é um bom exemplo disto. E em alguns casos, o modelo espacial para o qual os dados são destinados conduz exclusivamente o procedimento de amostragem. A estrutura espacial dos dados é também um fator limitante da informação que pode ser extraída a partir dos dados, neste caso, tanto para coleta como para armazenagem. 21 5.1.3 - Categoria dos dados ambientais Olhando a partir de um ponto de vista ambiental, a questão chave na elaboração de um banco de dados ambiental, é classificar o mundo de forma a permitir que dados importantes sejam associados a modelos de elementos ambientais. Isto necessita considerar os tipos de dados ambientais a partir de levantamentos existentes (coletados para uma variedade de objetivos), e os tipos de dados ambientais colecionáveis. Raper (1989) descreveu tipos de objetos conforme os métodos pelos quais são definidos a partir de dados ambientais. Inicialmente elementos “amostralmente limitados" podem ser definidos com referência a um parâmetro chave, como por exemplo, um limite discreto sobre o terreno. Neste caso os detalhes na representação do espaço são limitados pela densidade de amostragem. Assim, elementos de "definição limitada” podem ser definidos com referência ao valor de parâmetros ou modelo de variação contínua. Aqui, o detalhamento é limitado também pela densidade de amostragen, mas é também afetado pela magnitude do valor limite escolhido. O processo de criação de objetos que utilizam os métodos com definição limitada e amostragem limitada é um processo de modelagem. Este processo necessita de um input de dados, que seja ambiental, do tipo "observável" e produza um modelo ambiental satisfatório como output. Raper (1989) denomina-os "geo-objetos". O dado ambiental poderia ser oriundo de uma variedade de fontes, como a instrumentação fotográfica, amostragem regular, levantamentos locais, ou até mesmo vindo de outros modelos. Pode-o ser resgatado como um conjunto de informações que pode ser usado para a construção do modelo e como uma régua medidora para verificação dos mesmos. Dados ambientais observáveis, se derivados de um modelo ou coletados por instrumental de campo, são uma fonte das características da informação que podem ser determinadas aos elementos ambientais. Enquanto existe, é uma conexão entre a forma de uma entidade e o valor de uma série de dados. O mapeamento de um elemento efetivado a partir da superfície de um relevo é por si só atributo próprio principal de um levantamento topográfico. É somente no processo da definição de um estágio de um elemento do ambiente, tal qual uma restinga, que as elevações tomam- 22 se associados à forma da entidade. Isto poderia dar-se através do reconhecimento de um padrão, da especificação de um banco de dados, de um levantamento interativo sobre o terreno, ou uma decisão de amostragem limitada feita no campo. É certo também que as fontes nem sempre são do tipo primário. De fato, a fonte da informação geográfica muitas vezes é um mapa qualquer, que deveria ser considerado como dado observável derivado, onde as suposições usadas para resultá-lo a partir dos dados originais mensurados podem ser desconhecidos. Além disso, os dados observáveis do ambiente deveriam ser um conjunto de dados referenciados no tempo e no espaço com informação sobre a fonte e qualidade dos dados, que podem agir como uma origem ou finalização para o estabelecimento de modelos de dados ambientais. Os modelos são elaborados com referência na informação e os dados relacionados a eles devem ser tratados de maneira específica. 5.1.4 - Espaço e Tempo no contexto geográfico de um SIG A representação geométrica de uma característica é uma abstração generalizada de sua forma que impossibilita realizar análises espaciais quantitativas e qualitativas. Nunes (1992) descreve a geometria não como uma ferramenta de representação do espaço, mas sim de representação de objetos que ocupam o espaço. A noção de que os objetos, e as inter-relações entre eles, dividem o espaço, não é recente, "espaço, tempo e geometria são formas de objetos" (Wright et al., 1979), mas é particularmente relevante com o advento da modelagem de dados objeto - orientados, que é a base para a abordagem de representação das características ambientais que se pretende representar. O SIG tem sido utilizado amplamente nos últimos anos para o armazenamento e análises dos dados geo-referenciados. Os sistemas utilizados são mais comuns no mapeamento automático (demonstração e consulta de um mapa) e recursos de gerenciamento (manutenção de um registro de bens geo-referenciados) e em setores governamentais locais, meios acadêmicos, entre outros. Esta espécie de uso do SIG reflete a arquitetura de software dos sistemas mais comumente aproveitados comercialmente, isto é, a imagem / posição dos atributos do espaço geográfico são aproximados por um vetor ou "geometria raster”, e "atributos descritivos” são gravados através de tipos de dados alfanuméricos padronizados (Maguire, 1991). 23 Sistemas vetorizados deste tipo têm sido chamados de sistemas position- based (Herring, 1991), uma vez que seu esquema de representação é organizado pelo número e tipo de posições guardadas no "depósito" geométrico. Estes sistemas são usualmente estruturados de algum modo: estruturas típicas que se baseiam na criação de nós em cruzamento de linhas através do processo de "execução planar" (Goodchild, 1992). Uma conseqüência deste processo é a não - sobreposição dos polígonos formados por esse processo, e cada ponto localizável é atribuído a somente um único polígono. O sistema raster também é claramente position-based, já que as células são mutualmente exclusiva e o valor da célula determina se ele é agrupado a outras células. O armazenamento de áreas sobrepostas ou de linhas não intersectantes requer o uso de layers separados. Os SIGs com vetores position-based, comercialmente úteis, possuem ferramentas para a elaboração de estruturas que mostram as inter-relações topológicas, como a conectividade e a vizinhança, para permitir a sobreposição gráfica e lógica de diferentes layers, e para nomear as ligações entre a geometria e os atributos. Os SIGs raster são também layered, quando cada célula pode conter apenas um valor, o que necessita armazenar geometria diferente em mapas raster diferenciados. Tanto na forma raster como vetor existe uma relação 1:1 entre uma peça da geometria como um polígono e um quadro com atributos alfanuméricos. Os SIGs position-based oferecem poder de funcionalidade para aplicação onde os layers podem ter leitura bem definida, e onde eles contêm características de sobreposição, que são estáticas. Estas condições são encontradas em várias áreas de aplicação como no gerenciamento de imóveis e modelagem estatística de dados sobre áreas administrativas. Entretanto, varias organizações de controle de dados ambientais encontram uma inadequação de SIGs position-based para armazenamento e modelagem de atributos, como os sistemas hidrográficos ou costeiros que sofrem mudanças temporais rápidas. Tais sistemas não podem armazenar características complexas, pois precisam armazenar atributos de agrupamentos geométricos em diferentes estágios que mudam suas posições no tempo e no espaço, e cada uma desses estágios deve ser colocada em um layer separada. Tais restrições se aplicam igualmente aos dados geométricos vetores e raster diferentemente na forma 1:1 da ligação entre os atributos geométricos e não - geométricos, que é o fator limitante. 24 Estas limitações têm atuado como restrições significantes no uso do SIG em aplicações hidrológicas, geomorfológicas, marítimas, etc. (Raper, 1991). A introdução de abordagens "objetivas" oferece alguma força para novas soluções a estas limitações dos SIGs position-based (Worboys; 1992). Estas abordagens em SIGs são centradas nos tipos de atributos ou elementos em representação. Isto significa que o banco de dados é elaborado a partir de séries de classes de elementos relacionados, onde uma classe de elementos é definida como um fenômeno de características que podem se agrupar a níveis mais elevados e se dividir nos níveis inferiores. Estas características definem cada classe de elemento no modelo do sistema de dados, e as instâncias (elementos) da classe são armazenados no banco de dados do sistema. Em um modulo do SIG as características descritivas do elemento não se diferenciam entre os tipos geométrico e não-geométrico no nível de interface. Diferentes elementos do modulo do SIG empregam mecanismos distintos para unificar o armazenamento dos atributos geométricos e não-geométricos. Alguns sistemas usam banco de dados com armazenagem não-unificada, outros usam uma linguagem orientada pelo elemento para manipular a armazenagem dos dados em um banco de dados relacionais. Os módulos do SIG têm ferramentas representacionais flexíveis, pois elementos de qualquer classe podem possuir geometria associadas que se sobrepõe à qualquer extensão necessária. As interações de elementos dentro e entre as classes de elementos são definidas por regras de interação que podem ser controladas por critérios topológicos. As operações que atuam apenas sobre classes de elementos podem também ser armazenada junto às instâncias (estágios), tornando possível a manipulação de classes específicas de uma forma variada. 5.1.5 - Modelagem de dados orientados a objetos O paradigma da "orientação a objetos" incorpora conceitos que podem ser aplicados tanto para a descrição de sistemas do mundo real, como à definição de sistemas de informática através de uma linguagem programadora. Isto parece oferecer uma boa oportunidade de representar conceitos em ambos os tipos de sistemas; os sistemas orientados a objetos incorporam conceitos que se deslocam bem na linguagem do sistema do mundo real, por exemplo, sub-classificação, inerência, 25 encapsulamento de dados e de comportamento, e outros. Estes conceitos são semelhantes aos termos usados na descrição da natureza e classificação de sistemas físicos (Oertel, 1985). O modelo de dados orientado a objetos oferece potencialmente maiores noções semânticas que o modelo relacional, fundamentalmente matemático por natureza. Entretanto, exceto no modelo relacional, não existe seqüência de comandos que definam o modelo orientado a objetos. Este problema é abordado por organizações como o Grupo de Gerenciamento de Objetos (Martin & Odell, 1992), mas no momento o efeito tem sido o de limitar o desenvolvimento do banco de dados orientados a objetos. A ausência de uma topologia padrão é o obstáculo para a eficiência da modelagem de dados orientada a objeto, pois uma das maiores vantagens desse método é a tendência em se dissolver as fronteiras entre programas e banco-de-dados, permitindo estruturas e parâmetros para os modelos numéricos permanentes em um banco de dados gerenciado. Este é exatamente o tipo de situação que se necessita para um SIG baseado na modelagem de um banco de dados ambiental. Isto facilita projetar sistemas que usem um modelo orientado a objeto e daí implementá-los de forma mais consistente. 5.1.6 - Modelagem de Sistemas Ambientais no contexto do SIG A integração de um modelo, por meio de um SIG, possibilita implantar uma variedade de interfaces espaciais e indica que os modelos relacionais e orientados a objetos possuem as condições necessárias para implementá-los, e também para criar uma linguagem natural de interface baseada em seus conceitos semânticos, onde a linguagem dos tipos e funções dos dados espaciais são importantes para o usuário em termos de sua aplicação e em termos de mapeamento (Herring 1991). Segundo Nunes (1991), a modelagem do espaço geográfico é uma representação de elementos que precisa ser realizada em um nível mais elevado. Este é o processo de definição de um modelo semântico de dados ambientais. Quando o objetivo é idealizar um modelo de elementos e seus atributos espaciais definem o espaço, a situação surgirá onde diferentes representações e diferentes formas de dividir o espaço forem mais adequadas para objetivos distintos. Isto é desejável para evitar a situação em que diferentes elementos existam para os 26 mesmos tipos de representação e sua definição precisa estar em um nível maior de abstração. 5.1.7 - Plano para modelagem de um Sistema Ambiental Dentre os mais importantes componentes de um sistema ambiental dentro de um SIG, podem ser relacionados: o banco de dados espaciais, o modelo semântico ambiental e os processos externos dos modelos e aplicações. As características importantes poderiam se restringir à: - todos os dados são guardados no mesmo banco de dados espaciais; - diferentes níveis de dados são mantidos no banco de dados; - metaclasses ambientais; - as estruturas são do modelo semântico; - modelos externos integram-se com o SIGs; - diferentes representações são conciliadas dentro do SIGs usando morfismos definidos como métodos; perações sobre os elementos permitem o uso de funções genéricas; - elementos no banco de dados permitem definir em um modo de implantação independente; - diferentes intercâmbios entre classes fornecem dados e modelos de cada fase de modelagem; - encapsulamento de dados e métodos. Este encapsulamento permite a simulação da resposta dinâmica que utiliza métodos de automodificação em resposta a fatores externos ou internos. O banco de dados espaciais atua como um repositor para dados em diferentes níveis de definição de dados. O modelo semântico de dados ambientais é o componente do sistema que compreende modelos externos com a aplicação de SIG’S e concilia diferentes representações. Ele é definido em um nível de definição de dados maior e forma uma interface de aplicações para o nível duplo de dados (Raper e Bundock, 1992). Ao incorporar os conceitos de nível de definição de dados ao projeto de sistemas, se permite também o fornecimento dos requisitos firmados por Feuchtwanger (1989) para a independência da aplicação da geometria e realmente 27 supera uma etapa posterior por especificar a independência desse modelo de aplicação geométrica como uma meta. As classes estabelecidas no Modelo Semântico Ambiental operam como metaclasses em relação aos elementos do ambiente no SIG, metaclasses como uma classe cujas instâncias são classes por si próprias. A necessidade dos elementos serem capazes de serem representados por um modelo de dados têmporo-espacial é suprida pela associação de tais modelos com as classes de elementos e pelo fornecimento de métodos para as metaclasses que realizarão os morfismos entre os modelos. Estes modelos e métodos se associam com as metaclasses e através destas, com o nível inferior de definição de classe. Esta revisão de conceitos procurou demonstrar que um SIG tem grande potencial como o núcleo de um sistema de modelagem e de informação ambiental integrado devido a sua evolução como um sistema de gerenciamento de banco de dados espaciais capazes de manejar diferentes estruturas de dados espaciais, por meio de ferramentas analíticas computacionais. Com os novos conhecimentos, existe uma tendência de crescimento do uso de interfaces e de ferramentas de programas do tipo orientada a objetos, que se acredita que para o SIG preencher seu potencial no campo da modelagem ambiental, ele precisa estar em um ambiente independente de aplicação, bem como maximizar o número de modelos que podem ser mantidos e minimizar as implementações. Obviamente isto implica uma série de aplicações e testes para uma abordagem de sistemas aberta, e o desenvolvimento de modelos para as transposições entre modelos de dados têmporo-espaciais. Também se vê nos métodos de modelagem de dados orientados a objetos como a melhor forma de fornecer as inovações e pensa-se que a adoção de banco de dados realmente orientado a objetos com uma série padronizada de semântica é vital para esta abordagem. Isto ajudaria bastante o objetivo de interação entre modelos de dados espaciais. O incentivo aos projetos de abordagem na produção que utiliza a semântica e os métodos resultantes da linguagem e procedimentos dos dados e da modelagem ambiental está no ponto do desenvolvimento dos trabalhos direcionados a modelagem de sistemas ambientais. 28 5.2 – Metodologia estatística 5.2.1 – Análise estatística bivariada Medidas numéricas relacionadas com duas séries de dados tomadas ao mesmo tempo são estudadas pela Análise estatística bivariada. 5.2.1.1 - Covariância Segundo Laponni (1997) a covariância é a medida que expressa em um único número a tendência e a força da relação linear entre duas séries de dados. O valor da covariância de duas séries, X e Y com médias xµ e yµ respectivamente e n elementos cada uma, é obtido por: para populações: ( ) ( )( ) N yx XY n i yixi YXCov ∑ −− == 1, µµ σ (5.1) para amostras: ( ) ( )( ) 1 1, − ∑ −− == n yx XY n i yixi SYXCov µµ (5.2) 5.2.1.2 – Coeficiente de Correlação O valor da covariância pode ser positivo, nulo ou negativo e seu resultado é expresso na unidade de medida referente ao produto das unidades de medida das duas séries, o que o torna sem nenhum significado prático. Para facilitar a interpretação do valor da covariância e eliminar sua unidade de medida, foi definido o coeficiente de correlação r através da seguinte expressão: ( ) [ ]2 1 )var()var( , yx YXCov r xy = (5.3) 29 Os valores do coeficiente de correlação estão limitados entre –1 e +1, isto é, -1 ≤ rxy ≤ +1 e o significado dos valores possíveis do coeficiente de correlação limitados a este intervalo são: - Perfeita correlação positiva (r = +1): todos os pares de valores das observações estão contidos numa mesma reta com inclinação positiva. Neste caso, pode-se ver a perfeita relação linear entre as observações. - Forte correlação positiva (r próximo de +1): A maioria dos pares de valores das observações estão próximos de uma reta com inclinação positiva. - Fraca correlação positiva (r próximo de +0): A maioria dos pares de valores das observações estão afastadas de uma reta. Os pares de valores formam uma nuvem sugerindo alguma tendência de inclinação positiva. - Sem nenhuma correlação (r = 0): todos os pares de valores das observações estão afastados de uma reta, formando uma nuvem sem nenhuma tendência de inclinação. - Fraca correlação negativa (r próximo de –0): A maioria dos pares de valores das observações estão afastadas de uma reta. Os pares de valores formam uma nuvem sugerindo alguma tendência de inclinação negativa. - Forte correlação negativa (r próximo de –1): A maioria dos pares de valores das observações estão próximos de uma reta com inclinação negativa. - Correlação negativa perfeita (r = -1): Todos os pares de valores das observações estão contidos numa mesma reta com inclinação negativa, em uma perfeita relação linear entre os valores. 5.2.1.3 - Regressão Linear Simples A análise de regressão simples tem por princípio descrever e compreender a relação entre duas variáveis aleatórias e projetar (estimar) uma nova observação ou ajustar e controlar processos. Para estabelecer uma lei matemática entre variáveis que têm uma relação linear, denominada como variável independente e variável dependente, é proposto um modelo de ajuste linear a partir de dados amostrais. A reta de regressão é 30 representada pela equação y ∧ = a + bx, onde y ∧ é a variável dependente e x é a variável independente. Se os n pares de valores amostrais formassem uma reta , então a equação da reta ajustada conteria os n pontos amostrais. Em geral, os n pares de valores não estarão contidos numa reta, eles estarão distribuídos ao redor de uma reta ajustada. Desta forma pode-se verificar que: - para um valor xi,podem existir um ou mais valores de yi amostrados, e - para esse mesmo valor xi se terá um valor projetado y ∧ , - para cada valor xi existira um desvio di dos valores de y ∧ conforme indicado na figura 3 para um único par de valores: Figura 3 – Desvio do valor projetado Portanto é comum que as observações não coincidam exatamente sobre os pontos da reta; isto é, para o mesmo valor de xi, existirão desvios entre o valor observado e o valor projetado medidos pela diferença di = yi - y ∧ . Incluindo a equação da reta de regressão na formula do desvio teremos: di = yi – (a + bxi) di = yi – a – bxi 31 O objetivo é obter, a partir dos n dados amostrais, os valores dos coeficientes a e b da reta y ∧ = a + bx, denominados como coeficientes de regressão, ou simplesmente coeficientes ou constantes, que têm os seguintes significados: - o coeficiente b define o aumento (ou diminuição) da variável y por unidade de variação da variável x; - a constante a é denominada como intercepto y, sendo igual ao valor; A definição do critério para o ajuste de uma reta sobre o gráfico dos n pontos observados pode ser feito da seguinte forma, desde que, considerando-se que quanto menor for a soma dos desvios de todos os pares de observações, melhor será o poder de explicação do modelo; dessa forma tem-se os dois seguintes critérios: - o primeiro critério é ajustar uma reta horizontal de valor igual a média dos valores de y, isto é, y ; pois, a média é uma reta de regressão com b=0. Este critério não necessita de regressão, entretanto, é uma referencia usada para medir o grau de explicação da reta de regressão - o segundo critério é ajustar uma reta que divida os pontos observados de forma que a soma dos desvios seja nula. Entretanto, sabemos que a simples soma dos desvios não oferece uma boa resposta devido às compensações dos valores dos desvios positivos e negativos. O procedimento usado para obter os coeficientes da equação da reta de regressão, parte da soma dos quadrados dos desvios de todos os pontos observados; isto é, ( )∑ ∑ = = −−= n i n i iii bxyd a 1 1 22 (5.4) 32 O critério é encontrar os coeficientes a e b da reta de regressão que minimizam a soma dos quadrados dos desvios, denominado como método dos quadrados mínimos. Portanto, o objetivo é encontrar a e b de forma que a soma dos quadrados dos desvios seja um valor mínimo, isto é: ( )∑ ∑ = = ⇒−−= n i n i iii bxyd a 1 1 22 Deve ser um valor mínimo (5.5) Ao estabelecer que a soma dos quadrados dos desvios seja um valor mínimo, deve-se aplicar conceitos de cálculo diferencial com derivadas parciais. Ao mesmo tempo, como as incógnitas são duas, os coeficientes a e b, pra poder resolver é necessário formar um sistema com duas equações. Aplicando esses conceitos se obtém as equações dos coeficientes a e b por: bxay += ∧ sendo,                             − Χ−Χ = − = ∑∑ ∑∑∑ ∑∑ == === == 2 11 2 111 11 n i i n i n i i n i ii n i i n i i n i i xx yxyx xy x n n b n b a i (5.6) Finalmente, minimizar a soma dos quadrados dos desvios não garante que se tenha obtido a melhor reta ajustada, é apenas uma propriedade desejada de ajuste da reta. Sendo assim, a reta obtida pelo método dos mínimos quadrados não descreve os dados perfeitamente; ela é um resumo útil da tendência. Baseado nessas premissas, duas medições são de extrema importância para se avaliar a utilidade da reta de regressão: o erro padrão da estimativa (Se) e o coeficiente de determinação (r2 ). 5.2.1.4 - Erro Padrão da Estimativa O erro padrão da estimativa Se informa de forma aproximada quão grande são os erros de estimativa (os resíduos) do grupo de dados, medido na própria unidade de y. O objetivo é conseguir um valor de Se tão pequeno quanto possível, podendo-se 33 interpretar o valor de Se como um desvio padrão de forma que se os resíduos tem distribuição normal, podemos esperar que 68% dos pontos se encontrem dentro de S e Χ± 1 . O valor de Se é obtido da definição de variância da amostra S2, com (n-2) graus de liberdade: 22 1 2 2 − = −         − = ∑ = ∧ n SSE n i n i i e yy S (5.7) Ao ajustar uma reta, se espera que ela explique o grupo de dados. Se os dados estiverem contidos numa reta, se obterá uma reta coincidente com os pontos observados e, dessa maneira, a soma dos quadrados dos desvios será igual a zero e a reta ajustada explica completamente. Portanto, o valor de SSE (Sum of Square Errors) é à parte não explicado pela regressão. A partir da variância se obtém o valor do desvio padrão Se conhecido como erro padrão da estimativa, que mede a dispersão dos desvios ao redor da reta de regressão: 22 1 − = −         − = ∑ = ∧ n SSE n i n i i e yy S (5.8) Sendo cumpridas as premissas da regressão linear, se espera que aproximadamente 95% dos dados observados y se encontrem dentro do intervalo S e Χ± 2 de seus respectivos valores projetados pela reta de regressão y ∧ . 5.2.1.5 - Coeficiente de Determinação (r2) Sendo o coeficiente b da reta da reta de regressão e o valor da covariância igual a zero, conseqüentemente o coeficiente de correlação é nulo. Embora a reta da média não explique nada, é um ponto interessante de partida. Analisando a reta de regressão com os coeficientes a e b, pode-se ver que a maioria dos dados está distribuída ao redor da reta como mostrado na Figura 4: 34 Figura 4 – Coeficiente de determinação 1. Variação Total é igual ao quadrado dos desvios das observações y com relação ao valor da média y _ das mesmas observações y , isto é 2 1 _ ∑ =         − n i i yy ; 2. Variação não-explicada é igual ao quadrado dos desvio das observações y com relação aos valores estimados pelo modelo de regressão y ∧ , isto é 2 1 ∑ = ∧         − n i i iyy . 3. Variação explicada é igual ao quadrado dos desvios dos valores estimados pelo modelo de regressão y ∧ com relação ao valor da média das observações y, isto é, 2 1 ∑ = ∧       − n i i yy . Conforme mostrado na Figura 4: Variação total = Variação não-explicada + Variação explicada 35 Tem-se que 2 1 ∑ = ∧       − n i i yy = 2 1 ∑ = ∧       − n i i yy + 2 1 _ ∑ =         − n i i yy Defini-se o coeficiente de determinação r2 pela relação: totalVariação licadaVariação r exp2 = , que substituindo pelas expressões matemáticas obtém-se: ∑ ∑ = = ∧         −         − −= n i i n i i yy yy r i 1 2_ 1 2 2 1 (5.9) O coeficiente de determinação r2, cujo valor é sempre positivo, deve ser interpretado como a proporção da variação total na variável dependente y que é explicada pela variação da variável independente x. Demonstra-se, também, que o coeficiente de determinação é igual ao quadrado do coeficiente de correlação; e vice- versa. Ou seja, a partir do coeficiente de correlação r obtem-se o valor do coeficiente de determinação r2. O coeficiente de determinação r2 é sempre positivo e pode ser analisado de forma equivalente como foi analisado o coeficiente de correlação r. O coeficiente de correlação é mais indicado para ser usado medida da força da relação entre variáveis e o coeficiente de determinação é mais apropriado para definir quanto a reta de regressão explica o ajuste à reta. 5.2.2 – Análise estatística multivariada As técnicas utilizadas para análise de diversas variáveis simultaneamente são conhecidas como estatística multivariada ou multidimensional. Tal análise estatística de mensurações múltiplas efetuadas sobre uma amostra fornece um melhor entendimento na razão direta do número de variáveis utilizadas e permite considerar simultaneamente a variabilidade existente nas diversas propriedades medidas. 5.2.2.1 - Regressão linear múltipla A regressão linear múltipla é usada para testar dependências cumulativas de uma única variável dependente em relação a diversas variáveis independentes. 36 Neste tipo de simulação como no método tradicional, assume-se que exista um relacionamento linear entre a variável dependente e as variáveis independentes. Assim, por exemplo, no caso de três variáveis independentes para explicar uma variável dependente, a equação da regressão linear múltipla é descrita da seguinte forma: xbxbxbaY 332211 ∗+∗+∗+= onde Y é a variável dependente; x1, x2, e x3 são as variáveis independentes; a é o intercepto; b1,b2 e b3 são os coeficientes das variáveis independentes. O coeficiente bi define o aumento (ou diminuição) da variável Y por unidade de variação da variável xi ; a constante a denominada como intercepto em Y será 0 quando xi for igual a 0. 5.2.2.2 – Análise das componentes principais Entre os diversos métodos existentes, um dos mais usados é o da “Análise das componentes principais”. A análise das componentes principais consiste numa transformação linear de todas as variáveis originais em novas variáveis, de tal modo que a primeira nova variável computada seja responsável pela maior parte da variação possível existente no conjunto de dados, a segunda pela maior variação possível restante, e assim por diante até que toda a variação do conjunto tenha sido explicada (Ludwig & Reynolds, 1988). Em síntese, calculam-se os autovalores e correspondentes autovetores de uma matriz de variância –covariância ou de uma matriz de correlação. Naquela matriz simétrica, os elementos da diagonal principal são as variâncias das variáveis e dos demais valores de covariância entre os pares das variáveis e neste são os coeficientes de correlação. A análise de componentes principais é, portanto, uma técnica de transformação de dados. Cada variável medida pode ser considerada como um eixo de variabilidade, estando usualmente correlacionada com outras variáveis. Esta análise transforma os dados de tal modo a descrever a mesma variabilidade total existente, com o mesmo número de eixos originais, porém não mais correlacionados entre si (Landim, 1997). Desse modo à determinação das componentes principais permite, com freqüência, diminuir o número de variáveis a serem mais bem estudadas em função de 37 sua importância relativa, isto é, pode-se desprezar as componentes de menor variação relativa. Seu objetivo mais importante é condensar o essencial da variação das variáveis originais (Gomes, 1985) e fornecer uma informação comprimida da variação total e ainda quando aplicada como uma ferramenta de análise exploratória, sem qualquer suposição sobre a distribuição estatística das componentes individuais é possível medir a inter-relações entre estas componentes (Odden & Kvalheim, 2000). Na análise de estatística tradicional de variáveis independentes, há uma exigência de que o número dos objetos (amostras), deve ser significativamente maior que o número de variáveis. Porém este principio não se aplica a análise das componentes principais que é um método de análises fixas com variáveis fortemente correlacionadas (Wold et al, 1987; Kvalheim, 1988). Wang & Du (2000) avaliaram a análise das componentes principais como um método robusto, capaz de lidar com dados não normais, com alto desempenho, e muito útil para interpretar um número elevado de variáveis correlacionadas. A análise das componentes principais extrai a variação sistemática da matriz de dados, relacionada a um grupo de vetores ortogonais (componentes principais), e este procedimento reduz a matriz de dados a um número limitado de componentes principais que contêm a maioria da variação sistemática dos dados (Odden & Kvalheim, 2000). Das componentes principais pode-se extrair as coordenadas de cada par projetada em um eixo, definido pelas componentes principais, chamadas escores, e ainda os coeficientes para cada variável em sua expansão linear das componentes principais, definido como a carga da variável comunalidades. Os escores projetados em superfície 3D mostram o padrão espacial da distribuição das variáveis e as comunalidades indicam a importância da variável na variação dos dados por componentes. Uma das principais vantagens da modelagem dos dados em termos de análise das componentes principais é a facilidade de visualização dos resultados em mais de duas dimensões. Alguns dos mais importantes trabalhos sobre a aplicação de componentes principais podem ser encontrados em estudos sobre o meio ambiente, entre eles destacam-se os trabalhos de Austin & Smith-Greig (1968) em estudos sobre 38 vegetação, avaliou-se os efeitos do número de espécies na ordenação dos dados, em áreas de floresta temperadas e floresta pluvial tropical. Austin (1985) aplicou esta técnica para estudos de nicho ecológico em gradientes de vegetações contínuas. Johnston (1984) discutiu bem em seu livro o uso da análise multivariadas para matrizes de dados geográficos. Ainda neste texto é relatada a geometria dos vetores correspondentes às componentes principais, que se reflete nas comunalidades dos componentes principais. Gomes (1985) utilizou a análise das componentes principais em dados hidrológicos e atmosféricos de 111 locais para o zoneamento de espécies forrageiras. Digby & Kempton (1989) relataram o uso das componentes e seus escores para estudos de ordenação de variáveis ecológicas em gradientes ambientais. Wartenberg (1985) utilizou as autocorrelações espaciais como coeficiente de Moran (I) e o coeficiente de Mantel, comparando-os em uma matriz de correlações, através da análise das componentes principais. Diniz Filho (1993) analisou os padrões de diferenciação geográfica e dimorfismo sexual em 18 caracteres morfométricos de Lutosa brasiliensis (Orthoptera Henicidae), coletados em oito populações do Estado de São Paulo. Os padrões espaciais foram analisados através da análise fatorial e das autocorrelações espaciais. Ratha & Sahu (1993) estudaram a contaminação e distribuição de elementos maiores e elementos traços em solos urbanos em Bombay (Índia). A técnica usada indicou como primeira componente a contaminação dos solos pela atmosfera, como segunda componente a litologia das rochas da área e ainda uma terceira como sendo antropogênica causado por indústrias. Bernardi (1997) analisou o impacto ambiental de influência industrial no Rio Paraíba do Sul e constatou que as duas principais componentes foram, estabelecidas como abiótica e biótica pelos valores das comunidades.A interpolação dos escores permitiu visualizar uma superfície espacial do impacto do efluente e sua recuperação no final da malha e de amostragem. Grunsky & Smee (1999), usaram a análise das componentes principais para diferenciar tipos de solos e mineralização de elementos geoquímicos em diferentes 39 topografias de uma região da Sumatra. Estes elementos foram Au, Cu, Pb, Zn, As, Ba, Ca, Cd, Co, Cr, Fe, Ga, k, La, Li, Mg, Mn, Nb, Ni, Sc, Ti, V, Y, Zr, Hg. Os resultados obtidos nesse trabalho, para a primeira componente, indicaram que estes elementos estão mais relacionados à rocha formadora saprolítica ou vulcânica que originaram os solos provenientes das atmosferas coletadas. A segunda componente revela um padrão associado ao solo saprolítico, refletido em uma concentração elevada de Cu. Brumelis et al (2000) estudaram a correlação dos elementos Ca, Mg, Ni, V, Pb, Cu, Zn, Cd, Fe e K depositados pela atmosférica, através da análise das componentes principais. Yu & Chang (2000) utilizaram a análise das componentes principais para selecionar quatro áreas poluídas por ozônio no sul de Taiwan. Odden & Kvalheim (2000) aplicaram a análise das componentes principais para discriminar a detecção de hidrocarbonetos em dois tipos de rochas formadoras. Matematicamente, segundo Landim (1997), esta formulação pode assim ser descrita: - se A for uma matriz simétrica de variâncias e covariâncias, de dimensões pxp, com termos de ai j de onde os autovalores serão extraídos, Vi o i’ésimo autovetor, cujos termos são vi j e λ i o i’ésimo autovalor, tal relação pode ser expressa pôr: ( )A i iV− =λ Ι 0, onde Ι é a matriz de identidade. Alternativamente a relação acima pode ser escrita pôr: i i iAV V= λ , ou, [ ][ ] [ ][ ]A V V= Λ , onde [ ]V é uma matriz, pxp, de todos os autovetores e, [ ]Λ é uma matriz, pxp, com os autovalores iλ na diagonal principal. Multiplicando ambos os lados da equação pela transposta de V, V’, [ ] [ ][ ][ ]A V V= Λ ' A soma dos autovalores é igual a soma dos termos da diagonal em [ ]A , ou seja, a soma das variâncias, i iiaλ∑ ∑= e por definição 1 2λ λ λ≥ ≥K p 40 Resolvendo a equação acima para λ , as raízes determinadas serão os autovalores. Encontrados os autovalores, substituindo-os nas equações simultâneas e resolvendo-as, obtém-se para cada autovalor e autovetor correspondentes, ou seja, as componentes principais. Pode-se definir a variância total existente em um conjunto de dados multivariados pela soma das variâncias de cada uma das variáveis. Numa matriz de variâncias e covariâncias, essas variâncias individuais constituem os elementos da diagonal principal. Basta somá-los, portanto, encontrando o traço da matriz para se obter a variabilidade total e, em seguida, a contribuição de cada variável. A soma dos autovalores de uma matriz, igual ao traço dessa matriz, representa também a variabilidade total da mesma e a contribuição de cada autovalor em termos de variabilidade determinada. Ao primeiro corresponderá a maior variabilidade possível existente, ao segundo a maior variabilidade restante, e assim por diante. Em termos geométricos, o primeiro autovalor representa o eixo principal de maior comprimento; o segundo autovalor, um segundo vetor em comprimento, situado em posição ortogonal em relação ao primeiro, e assim sucessivamente. Os elementos de cada um dos autovetores encontrados são simplesmente coeficientes de equações lineares que transformam os dados originais em contagens (escores) indicativas do respectivo carregamento sobre os eixos correspondentes. Desse modo, utilizando-se da multiplicação da matriz de dados originais pela de autovetores, obtém-se uma matriz de dados transformados que representam projeções dos pontos, num espaço multidimensional, sobre os diversos componentes principais. [X] [V] = [Sr], onde [X] = matriz de dados originais, n x m [V] = matriz quadrada, m x m, contendo os autovetores [Sr] = matriz n x m , das contagens sobre os componentes principais. Em sensoriamento remoto, a Análise das Componentes Principais está relacionada à idéia de produzir uma transformação de uma série de layers de uma imagem tal que os novos layers chamados de “componentes” não estejam correlacionados uns com os outros, mas ordenados em termos de quantidade de variação da imagem que eles possam explicar. Os componentes são, por conseguinte, 41 uma abstração estatística da variabilidade inerente à série de layers originais. É assim que as Componentes Principais serão úteis, na consolidação dos dados retendo apenas os primeiros poucos componentes de uma imagem, podendo guardar a maior parte da informação e descartando a não significante. 5.3 - Metodologia geoestatística As propriedades naturais da superfície terrestre são na maioria dos casos espacialmente contínuos, porém, a sua representação espacial só é possível por meio de amostragem. No caso de dados com relativo espaçamento entre as amostras, os métodos mais usuais de representação da estatística clássica e métodos tradicionais de interpolação, possuem limitações em sua caracterização, pois desconsideram a direção e a continuidade do fenômeno que se quer descrever. Desta forma, modelos de inferências vêm sendo propostos para melhor poder caracterizar os fenômenos naturais. Com este intuito, têm-se utilizado a krigagem, que é um modelo conceitual fundamentado na teoria das variáveis regionalizadas, formalizada por Matheron (1971). A incorporação de procedimentos geoestatísticos em estudos ambientais baseado em técnicas de krigagem, tem sido usado por um grande número de profissionais das mais diversas áreas da ciência. Como não poderia deixar de ser, muito recentemente os profissionais da área da Geografia vem aplicando esses procedimentos, principalmente quando se trata de mapeamentos por cartografia digital. Assim, incorporado aos SIG’s, deu-se início a uma nova fase nos métodos conceituas de representação cartográfica praticado pelos geógrafos. Segundo Camargo 1999, esta incorporação se deveu ao fato de que, essa associação melhora os procedimentos tradicionais de tais sistemas devido à qualidade do estimador e, principalmente, pela informação da acurácia fornecida nesse modelo inferencial. 5.3.1 – Fundamentação teórica Krige (1951), trabalhando com dados de concentração de ouro, concluiu que somente a informação dada pela variância seria insuficiente para explicar o fenômeno em estudo. Para tal, seria necessário levar em consideração à distância entre as 42 observações. A partir daí surge o conceito de geoestatística, que leva em consideração a localização geográfica e a dependência espacial dos dados. Matheron (1963,1971), baseado nas observações de Krige, desenvolveu a teoria das variáveis regionalizadas. Segundo Blais e Carlier (1968), uma variável regionalizada é uma função numérica com distribuição espacial, que varia de um ponto a outro com continuidade aparente, mas cujas variações não podem ser representadas por uma função matemática simples. A teoria das variáveis regionalizadas pressupõe que a variação de uma variável pode ser expressa pela soma de três componentes (Burrough, 1987): - uma componente estrutural, associada a um valor médio constante ou a uma tendência constante; - uma componente aleatória, espacialmente correlacionada e, - um ruído aleatório ou erro residual. Se x representa uma posição em uma, duas ou três dimensões, então o valor da variável Z, em x, é dada por (Burrough, 1987): ( ) ( ) ( )εε "´ xxmxZ += (5.10) onde: - m(x) é uma função determinística que descreve a componente estrutural de Z em x; - ε ´ (x) é um termo estocástico, que varia localmente e depende espacialmente de m(x); - ε " é um ruído aleatório não correlacionado, com distribuição normal com média zero e variância σ 2 43 A Figura 5 ilustra os três componentes principais da variação espacial. A parte (a) apresenta uma componente determinística que varia abruptamente, enquanto a componente determinística na parte (b) apresenta uma tendência constante. Figuras – 5 - (a) e (b) - Principais componentes da variação espacial. FONTE: Modificada de Burrough (1987), p. 155. 5.3.1.2 - Hipóteses consideradas Diferente dos métodos convencionais de estimação, a krigagem está fundamentada na teoria das variáveis regionalizadas. O primeiro passo na krigagem é definir uma função apropriada para a componente determinística m(x). Para tanto, algumas hipóteses são necessárias (Burrough, 1987 e David, 1977): a - Hipótese de Estacionariedade de 2a Ordem Sob esta hipótese, admite-se que a componente determinística, m(x), é constante, ou seja, não há tendência na região. Então, m(x) é igual ao valor esperado da variável aleatória Z na posição x, e a diferença média entre os valores observados em x e x+h, separados por um vetor de distância h (módulo e direção) é nula. 44 E[Z(x) - Z(x+h)] = 0 ou E[Z(x)] = E[Z(x+h)] = m(x) = m (5.11) onde E representa o operador da esperança matemática. Admite-se também que a covariância entre os pares Z(x) e Z(x+h), separados por um vetor distância h, existe e depende somente de h. Então: C(h) = Cov [Z(x), Z(x+h)] = = E[(Z(x)-m).(Z(x+h)- m)] = E[Z(x).Z(x+h)]-m2, ? x; (5.12) onde: Cov [Z(x), Z(x+h)] é a covariância entre Z(x) e Z(x+h). Na Equação (5.11), estacionariedade da covariância implica na estacionariedade da variância: Var[Z(x)] = E{[Z(x)- m]2} = E[Z2(x)] - 2.E[Z(x)].m + m2 = = E[Z(x).Z(x+0)] - 2m2 + m2 = = E[Z(x).Z(x+0)] - m2 = C(0), ? x. (5.13) onde: Var é o operador variância. A estacionariedade da covariância também implica na estacionariedade do variograma, definido por: 2γ (h) = E{[Z(x)-Z(x+h)]2} (5.14) A Equação (5.14) pode ser desenvolvida em: 45 2γ (h) = E{Z2(x) - 2 Z(x)Z(x+h) + Z2(x+h)} = E[Z2(x)] - 2E[Z(x)Z(x+h)] + E[Z2(x+h)] (5.15) Da Equação (5.12) obtém-se: E[Z(x)Z(x+h)] = C(h) + m2 (5.16) De maneira análoga, da Equação (5.13) obtém-se: E[Z(x).Z(x+0)] = E[Z2(x)] = C(0) + m2 (5.17) Substituindo as equações (5.16) e (5.17) na Equação (5.15), obtém-se: 2γ (h) = C(0) + m2 - 2 (C(h) + m2) + C(0) + m2 = = 2 C(0) - 2 C(h) (5.18) Simplificando a equação (5.18), obtém-se: γ (h) = C(0) - C(h) (5.19) onde: γ(h) representa uma função conhecida na teoria das variáveis regionalizadas como semivariograma, que é metade do variograma. A relação em (5.19) indica que sob a hipótese de estacionariedade de 2a ordem, a covariância e o semivariograma são formas alternativas de caracterizar a autocorrelação dos pares Z(x) e Z(x+h) separados pelo vetor h. A hipótese de estacionariedade de 2a ordem supõe a existência de uma covariância e, então, de uma variância finita (Equação 5.12). Sob esta condição, o 46 correlograma, ρ(h), pode ser definido. Dividindo ambos os lados da Equação (5.18) por C(0), tem-se: )0( )( 1 )0( )( )0( )0( )0( )( )( C h C h C C C hC h γγ ρ −==== (5.20) b - Hipótese de Estacionariedade Intrínseca De modo análogo à hipótese anterior, admite-se que: E[Z(x)] = m(x) = m, ∀x . Além disso, admite-se que a variância das diferenças depende somente do vetor distância h, isto é: Var[Z(x) - Z(x+h)] = E{[Z(x)-Z(x+h)]2} = 2γ (h) (5.21) Onde: 2?γ (h) é conforme apresentado anteriormente. Segundo David (1977), esta hipótese é a mais freqüente em geoestatística, principalmente por ser a menos restritiva. Isto é, requer apenas a existência e estacionariedade do variograma, sem nenhuma restrição quanto à existência de variância finita. O variograma é uma ferramenta básica de suporte às técnicas de krigagem, que permite representar quantitativamente a variação de um fenômeno regionalizado no espaço (Huijbregts, 1975). Considere duas variáveis regionalizadas, X e Y, onde X = Z(x) e Y = Z(x+h), conforme ilustra a Figura 6, onde: 47 Figura 6 - Amostragem em duas dimensões. • x denota uma posição em duas dimensões, com componentes (xi , yi), e h um vetor distância (módulo e direção) que separa os pontos. O nível de dependência entre essas duas variáveis regionalizadas, X e Y, é representado pelo variograma, 2?γ(h), o qual é definido como a esperança matemática do quadrado da diferença entre os valores de pontos no espaço, separados pelo vetor distância h, isto é, 2?γ (h) = E{[Z(x)-Z(x+h)]2} = Var[Z(x)-Z(x+h)] . (5.22) Através de uma amostra z(xi), i=1, 2, ..., n, o variograma pode ser estimado por: (5.23) onde: - - é o variograma estimado; - N(h) - é o número de pares de valores medidos, z(xi) e z(xi+h), separados por um vetor distância h. 48 - z(xi) e z(xi+h) - são valores da i-ésima observação da variável regionalizada, coletados nos pontos xi e xi+h (i = 1, ..., n), separados pelo vetor h. Muitos autores definem variograma de forma distinta da Equação (5.22), considerando o que comumente se refere como semivariograma, dado por: (5.24) Analogamente, a função semivariograma pode ser estimada por: (5.25) onde N(h), z(xi) e z(xi +h) são conforme já definidos. 5.3.1.3 - Parâmetros do semivariograma A Figura 7 ilustra um semivariograma experimental com características muito próximas do ideal. O seu padrão representa o que, intuitivamente, se espera de dados de campo, isto é, que as diferenças {Z(xi) - Z(xi + h)} decresçam à medida que h, a distância que os separa decresce. É esperado que observações mais próximas geograficamente tenham um comportamento mais semelhante entre si do que aquelas separadas por maiores distâncias. Desta maneira, é esperado que γ ^ (h) aumente com a distância h. 49 Figura 7 - Exemplo de semivariograma. Os parâmetros do semivariograma observados diretamente da Figura 7 são assim descritos: - Alcance (a): distância dentro da qual as amostras apresentam-se correlacionadas espacialmente. Na Figura acima, o alcance ocorre próximo de 25m. - Patamar (C): é o valor do semivariograma correspondente a seu alcance (a). Deste ponto em diante, considera-se que não existe mais dependência espacial entre as amostras, porque a variância da diferença entre pares de amostras (Var[Z(x) - Z(x+h)]) torna-se invariante com a distância. - Efeito Pepita (C0): por definição, γ(0)=0, (refira-se à Equação 5.23). Entretanto, na prática, à medida que h tende para 0 (zero), γ(h) se aproxima de um valor positivo chamado Efeito Pepita (C0). O valor de C0 revela a descontinuidade do semivariograma para distâncias menores do que a menor distância entre as amostras. Parte desta descontinuidade pode ser também devida a erros de medição (Isaaks e Srivastava, 1989), mas é impossível quantificar se a maior contribuição provém dos erros de medição ou da variabilidade de pequena escala não captada pela amostragem. - Contribuição (C1): é a diferença entre o patamar (C) e o Efeito Pepita (Co). 50 5.3.1.4 - Cálculo do semivariograma a partir de amostras regularmente espaçadas Considere o conjunto de amostras regularmente espaçadas, em duas dimensões, conforme apresentado na Figura 8. Figura 8 - Amostras regularmente espaçadas em duas dimensões. Para determinar o semivariograma experimental, por exemplo, na direção de 900 o cálculo de é repetido para todos os intervalos de h. Suponha a distância entre dois pontos consecutivos igual a 100 metros (d=100m). Então, qualquer par de observações, na direção 900, cuja distância seja igual a 100m será incluído no cálculo de . Isto feito, os cálculos são repetidos para a próxima distância, por exemplo, 200m. Isto inclui todos os pares de observações cuja distância é igual a 200m. O processo é repetido até que seja alcançada a distância máxima determinada. Este procedimento pode ser mais bem compreendido com o auxílio da Figura 9 e também deve ser realizado para outras direções (0º, 450º e 135º). 51 Figura 9 - Ilustração para o cálculo do semivariograma a partir de amostras regularmente espaçadas. 5.3.1.5 - Cálculo do semivariograma a partir de amostras irregularmente espaçadas Considere o conjunto de amostras irregularmente espaçadas, em duas dimensões, conforme apresentado na Figura 10. Neste caso, para determinar o semivariograma experimental, é necessário introduzir limites de tolerância para direção e distância. Figura 10 - Parâmetros para o cálculo do semivariograma a partir de amostras irregularmente espaçadas em duas dimensões. FONTE: Modificada de Deutsch e Journel (1992), p. 45. Tome como referência o Lag2 (Lag refere-se a uma distância pré-definida, a qual é utilizada no cálculo do semivariograma) da Figura 10. Supor um incremento de 52 Lag igual a 100 metros com tolerância de 50 metros. Considere ainda a direção de medida 45º com tolerância angular 22.5º. Então, qualquer par de observações cuja distância estava compreendida entre 150m e 250m e 22.5ºe 67.5º será incluído no cálculo do semivariograma de Lag2. Este processo se repete para todos os Lag’s . Ainda com referência a Figura 10, a largura de banda (BW) se refere a um valor de ajuste a partir do qual se restringe o número de pares de observações para o cálculo do semivariograma. A próxima etapa constitui o ajuste de um modelo teórico ao semivariograma experimental, conforme descrito a seguir. 5.3.2 - Modelos teóricos O gráfico do semivariograma experimental, , calculado através da Equação (5.25), é formado por uma série de valores, conforme ilustra a Figura 10, sobre os quais se objetiva ajustar uma função. É importante que o modelo ajustado represente a tendência de em relação a h. Deste modo, as estimativas obtidas a partir da krigagem serão mais exatas e, portanto mais confiáveis. O procedimento de ajuste não é direto e automático, como no caso de uma regressão, por exemplo, mas sim interativo, pois nesse processo o intérprete faz um primeiro ajuste e verifica a adequação do modelo teórico. Dependendo do ajuste obtido, pode ou não redefinir o modelo, até obter um que seja considerado satisfatório. Os modelos aqui apresentados são considerados modelos básicos, denominados de modelos isotrópicos por Isaaks e Srivastava (1989). Estão divididos em dois tipos: modelos com patamar e modelos sem patamar. Modelos do primeiro tipo são referenciados na geoestatística como modelos transitivos. Alguns dos modelos transitivos atingem o patamar assintoticamente. Para tais modelos, o alcance é arbitrariamente definido como a distância correspondente a 95% do patamar. Modelos do segundo tipo não atingem o patamar, e continuam aumentando enquanto a distância aumenta. Tais modelos são utilizados para modelar fenômenos que possuem capacidade infinita de dispersão. 53 5.3.2.1 - Modelo efeito pepita Conforme anteriormente discutido muitos semivariogramas experimentais apresentam uma descontinuidade na origem. Quando |h|=0, o valor do semivariograma é estritamente zero. Porém quando |h| tende a zero, o valor do semivariograma pode ser significativamente maior que zero, isto é, ocorre uma descontinuidade na origem. Tal descontinuidade é modelada através do modelo de efeito pepita, assim definido: ( )       ≠ = = 01 00 0 hse hse hγ (5.26) Na literatura geoestatística, o efeito pepita não é classificado como modelo básico, mas aparece como uma constante (Co) na equação do semivariograma, e deve ser entendido que Co = 0 quando |h| = 0. A rigor, a notação para o efeito pepita é Co γo(|h|), onde Co representa o valor da descontinuidade na origem, e γo(|h|) é o modelo de efeito pepita normalizado conforme apresentado na Equação 5.24. Esta notação é consistente com a apresentação dos modelos básicos aqui descritos e torna-se conveniente quando se usa um modelo composto. Os modelos transitivos mais utilizados são: modelo esférico (Sph), modelo exponencial (Exp) e modelo gaussiano (Gau). Estes modelos estão apresentados na Figura 11 com o mesmo alcance (a). 54 Figura 11 - Representação gráfica de modelos transitivos normalizados. FONTE: Modificada de Isaaks e Srivastava (1989), p. 374. 5.3.2.2 - Modelo esférico O modelo esférico é um dos modelos mais utilizados e está representado em vermelho na Figura 11. A equação normalizada deste modelo é: (5.27) 5.3.2.3 - Modelo exponencial Um outro modelo bastante utilizado é o modelo exponencial, o qual é apresentado em azul na Figura 11 A equação normalizada deste modelo é: (5.28) Este modelo atinge o patamar assintoticamente, com o alcance prático definido como a distância na qual o valor do modelo é 95% do patamar (Isaaks e Srivastava, 1989). 55 5.3.2.4 - Modelo gaussiano O modelo gaussiano é um modelo transitivo, muitas vezes usado para modelar fenômenos extremamente contínuos (Isaaks e Srivastava, 1989). Sua formulação é dada por: (5.29) Semelhante no modelo exponencial, o modelo gaussiano atinge o patamar assintoticamente e o parâmetro a é definido como o alcance prático ou distância na qual o valor do modelo é 95% do patamar (Isaaks e Srivastava, 1989). O que caracteriza este modelo é seu comportamento parabólico próximo à origem, conforme representado na Figura 11 através da linha sólida verde. 5.3.2.5 - Modelo potência O modelo potência não é um modelo transitivo, portanto não atinge o patamar. Em geral, este tipo de modelo é utilizado para modelar fenômenos com capacidade infinita de dispersão. A Figura abaixo ilustra o modelo potência, o qual é expresso através de: (5.30) onde, - c é o coeficiente de declividade, e - e é o expoente. 56 Figura 12 - Representação gráfica do modelo potência. Até aqui foram apresentados os principais modelos básicos normalizados, os quais são utilizados para modelar ou ajustar o semivariograma experimental. Na prática, os semivariogramas experimentais possuem valores de efeito pepita (Co) maior que zero e valores de patamar (C) maiores que a unidade, conforme ilustrado na Figura 13. Figura 13 - Representação gráfica de semivariogramas experimentais e modelos teóricos. 57 Em resumo, os semivariogramas dos modelos transitivos básicos são assim definidos: a - Modelo Esférico de Semivariograma: (5.31) b - Modelo Exponencial de Semivariograma: (5.32) c - Modelo Gaussiano de Semivariograma: (5.33) De maneira análoga, o modelo potência é escrito em termos de semivariograma da seguinte forma: d - Modelo Potência de Semivariograma: ( ) ( )         ≠+=+ = = 0,. 0,0 00 hhPotc h h ChC eγ (5.34) 58 5.3.3 - Anisotropia A anisotropia pode ser facilmente constatada através da