Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 1 Análise espacial de dados de contagem com excesso de zeros aplicado ao estudo da incidência de dengue em Campinas, São Paulo, Brasil Spatial analysis of counting data with excess zeros applied to the study of dengue incidence in Campinas, São Paulo State, Brazil Análisis espacial de datos de conteo con exceso de ceros, aplicado al estudio de la incidencia de dengue en Campinas, São Paulo, Brasil 1 Programa de Pós-graduação em Demografia, Universidade Federal do Rio Grande do Norte, Natal, Brasil. 2 Instituto de Biociências, Universidade Estadual Paulista Julio de Mesquita Filho, Botucatu, Brasil. 3 Faculdade de Ciências Médicas, Universidade Estadual de Campinas, Campinas, Brasil. José Vilton Costa 1 Liciana Vaz de Arruda Silveira 2 Maria Rita Donalísio 3 QUESTÕES METODOLÓGICAS METHODOLOGICAL ISSUES http://dx.doi.org/10.1590/0102-311X00036915 Resumo A incidência de dengue ocorre predominantemente em áreas urbanas das cidades. Identificar o padrão de distribuição espacial da doença no nível local contribui na formulação de estratégias de controle e prevenção da doença. A análise espacial de dados de contagem para pequenas áreas co- mumente viola as suposições dos modelos tradicionais de Poisson, devido à quantidade excessiva de zeros. Neste estudo, comparou-se o desempenho de quatro modelos de contagem utilizados no mapeamento de doenças: Poisson, Binomial negativa, Poisson inflacionado de zeros e Binomial ne- gativa inflacionado de zeros. Os métodos foram comparados em um estudo de simulação. Os modelos analisados no estudo de simulação foram apli- cados em um estudo ecológico espacial, aos dados de dengue agregados por setores censitários, do Município de Campinas, São Paulo, Brasil, em 2007. A análise espacial foi conduzida por modelos hierárquicos bayesianos. O modelo de Poisson inflacionado de zeros apresentou melhor desempenho para estimar o risco relativo de incidência de dengue nos setores censitários. Análise Espacial; Dengue; Controle de Doenças Transmissíveis Correspondência J. V. Costa Programa de Pós-graduação em Demografia, Universidade Federal do Rio Grande do Norte. Av. Salgado Filho 3000, Campus Universitário, Natal, RN 59078-970, Brasil. josevilton@gmail.com Costa JV et al.2 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 Introdução A incidência de dengue ocorre predominan- temente em áreas urbanas das cidades 1, cuja transmissão é influenciada por um conjunto complexo de fatores 2, incluindo aspectos am- bientais, clima, comportamento humano, a for- ma de combate ao mosquito vetor e a imunidade da população humana para os diferentes soroti- pos do vírus 3,4,5,6. A precariedade das condições de saneamento básico de algumas cidades, par- ticularmente o abastecimento irregular de água e a coleta inadequada de lixo, têm favorecido o aumento de criadouros potenciais do principal mosquito vetor e contribuído para a incidência da doença 7. Compreender a associação entre fatores am- bientais e dengue é essencial para o desenvolvi- mento de ações de prevenção e controle da doen- ça 7. A incidência de inúmeras doenças infeccio- sas, particularmente aquelas transmitidas por vetores, geralmente exibem padrões espaciais 8, os quais podem ser resultantes das interações en- tre patógeno/hospedeiro/ambiente 9, em locais e em períodos específicos 10. A natureza, intensida- de, direção e o resultado dessas interações espe- cíficas dependem da forma como as populações envolvidas ocupam e se apropriam do espaço 4. Assim, considera-se apropriado analisar a distribuição espacial dos casos de dengue e sua associação com fatores socioambientais no pro- cesso de desenvolvimento da doença. A utiliza- ção de ferramentas de epidemiologia espacial 11 tem contribuído para estimar e representar a in- cidência de dengue em diferentes escalas geo- gráficas, bem como identificar fatores de risco associados à sua distribuição no espaço geográ- fico 12,13,14,15,16,17. Em relação à análise espacial e mapeamento de doenças com dados agregados, quanto me- nor o nível de agregação das unidades espaciais, maior é a capacidade para captação das intera- ções que ocorrem no território, favorecendo a identificação de microáreas prioritárias para as ações de vigilância epidemiológica. A opção por polígonos espaciais com tamanhos mínimos po- de resultar em um excesso de áreas sem notifica- ção do evento de interesse, ou seja, com conta- gens da doença igual a zero. Considerando-se que o modelo de regressão de Poisson é comumen- te empregado no mapeamento de doenças 11, alguns autores têm chamado a atenção para os problemas (por exemplo, superdispersão) e limi- tações (imprecisão dos estimadores) que o exces- so de zeros traz no processo de modelagem esta- tística, indicando a necessidade de se empregar modelos que considerem estas características dos dados 18,19,20,21,22,23. O presente trabalho avaliou, por meio de si- mulações, o desempenho do modelo de regres- são de Poisson em relação aos modelos Binomial negativa (BN), Poisson inflacionado de zeros e Binomial negativa inflacionada de zeros, na aná- lise de dados espaciais agregados, com a presen- ça de excesso de zeros. Com base em registros de dengue, analisou-se como exemplo empírico a distribuição espacial dos casos e a relação entre incidência da doença e condições socioambien- tais, no ano de 2007, no Município de Campinas, Estado de São Paulo. Métodos Desenho e área de estudo Realizou-se um estudo de simulação para ilustrar o potencial dos modelos inflacionados de zeros (ZI, do inglês zero-inflated) em modelar dados caracterizados por excesso de zeros, na presença de diferentes proporções de zeros, comparan- do-se ao desempenho dos modelos de Poisson e BN. Conduziu-se um estudo ecológico sobre a incidência de dengue em setores censitários em Campinas, notificados na epidemia de 2007. Ba- seando-se em casos registrados e georreferencia- dos foram comparados modelos de análise mais adequados para se enfrentar a frequente ocor- rência de áreas sem registro de casos. No estudo de simulação e aplicação aos da- dos empíricos, considerou-se o espaço urbano do Município de Campinas, adotando-se por unidade de análise os setores censitários (Figura 1). A escolha do setor censitário como unidade espacial de análise permite representar os gru- pos populacionais e socioeconômicos (variáveis de exposição) no nível mais desagregado de da- dos, coletados de forma sistemática de âmbito nacional. Segundo dados do Censo Demográfico de 2010 do Instituto Brasileiro de Geografia e Es- tatística (IBGE; http://www.ibge.gov.br), o mu- nicípio era subdividido em 1.749 setores, 1.695 (97%) destes localizados em áreas urbanas, cuja população era de 1.061.540 habitantes. A área mediana dos setores censitários correspondia a 0,080km2 (intervalo interquartil: 0,041-0,144km2), com densidade populacional mediana nos setores de 7.797 habitantes/km2 (intervalo interquartil: 4.390-13.450 habitantes/km2). A população ma- joritariamente (98,3%) urbana correspondia a 1.061.540 habitantes. Mapeamento de doenças A incidência Yi de uma dada doença, distribuída na região i (i = 1, 2, ..., N), comumente é modelada ANÁLISE ESPACIAL DE DADOS DE CONTAGEM COM EXCESSO DE ZEROS 3 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 Figura 1 Região de estudo, segundo a distribuição do índice de carência socioambiental (ICSA). por um modelo de Poisson, com Yi|θi ~ Poisson (λi = Eiθi) 11,24. Considera-se que Ei é o número de casos esperados, e θi o risco relativo desconhe- cido da incidência da doença na i-ésima área de estudo. O risco relativo é estimado assumindo-se a função de ligação logarítmica para o preditor linear: ηi = log(λi) = log(Ei) + α + (Xi)β + ψi + Φi Em que ηi é um preditor linear para estimar o risco relativo θi, α é o intercepto comum a to- das as áreas, X é uma matriz de covariáveis, β é o vetor dos parâmetros associado à covariável, ψi descreve a componente aleatória espacialmen- te estruturada (autocorrelação espacial local) do risco relativo e Φi a componente aleatória não estruturada espacialmente 24. O estimador de máxima verossimilhança de λi, denotado por λ = SIR = Yi / Ei, coincide com a taxa de incidência padronizada (SIR, do inglês standardized incidence ratio), uma taxa bruta que apresenta instabilidade frente a pequenos valores observados ou para populações pequenas 11. O modelo de Poisson considera a hipótese de igualdade nos valores da média e variância 25. Entretanto, quando se estuda a distribuição dos casos de uma doença em pequenas áreas geográ- ficas, é comum identificar áreas sem nenhuma ocorrência de casos. O excesso de zeros frequen- temente resulta em superdispersão dos dados (a variância é maior que a média), comprometendo a aplicabilidade do modelo de Poisson 19. Observando-se a presença de superdisper- são nos dados, é importante incluir no modelo componentes que ajustem esta superdispersão. O modelo BN Yi ~ BN (λi,τ), em que τ é um parâ- metro de escala e representa a superdispersão Costa JV et al.4 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 dos dados, é a primeira opção para modelar os dados na presença de superdispersão. Contu- do, o modelo BN não ajusta adequadamente os dados quando a variabilidade está relacio- nada ao excesso de zeros na distribuição destes dados 19. Os modelos ZI, definidos com base na mistu- ra de uma distribuição de Bernoulli e uma distri- buição discreta (por exemplo, Poisson ou BN), re- presentam uma abordagem flexível para contor- nar este problema de excesso de zeros, quando a contagem de zeros observada nos dados excede a contagem predita por um modelo de contagem. Modelos inflacionados de zeros Dois modelos comumente utilizados em dados com excesso de zeros são o Poisson inflacionado de zeros (ZIP) e o Binomial negativo inflacionado de zeros (ZINB) 18,19,20,21,22,23. O excesso de zeros é ajustado assumindo-se que os zeros surgem baseando-se em dois distintos processos. O primeiro, ocorre segundo um processo de Bernoulli com probabilidade pi, e produz apenas verdadeiros zeros (ou zeros estrutu- rais). O segundo, denominado falsos zeros (ou zeros amostrais), com probabilidade (1 - pi) é produzido segundo uma distribuição de Pois- son ou BN, com média λi 18,19,20,21,22,23. A pro- babilidade total de zeros é a combinação das probabilidades dos dois processos, pondera- da pela probabilidade do respectivo processo, ou seja, Pr(Yi = 0) = pi + (1 - pi) Pr(Zi = 0), em que Pr(Zi = 0) denota a probabilidade de Pois- son ou BN para a ocorrência de um valor ze- ro. A probabilidade de contagens positivas (maior que zero) é definida por Pr(Yi = yi) = (1 - pi)Pr(Zi = yi), em que Pr(Zi = yi) representa uma probabilidade de Poisson ou BN para a rea- lização de contagens positivas, em que 0 < pi < 1. Segundo a descrição anterior, o modelo ZIP apresenta a seguinte formulação: 𝑌𝑌𝑖𝑖 ~ 𝑍𝑍𝑍𝑍𝑍𝑍(λ𝑖𝑖 ,𝑝𝑝𝑖𝑖) ; Yi ~ � 0 , com probabilidade 𝑝𝑝𝑖𝑖 Pois(λi) , com probabilidade (1-𝑝𝑝𝑖𝑖) � Dessa forma, com probabilidade pi a variá- vel resposta assume o valor zero e com proba- bilidade (1 - pi) assume o valor de uma variável aleatória com distribuição de Poisson com média λi, conforme descrito anteriormente. A média de Yi é E(Yi) = (1 - pi)λi e variância igual a Var(Yi) = (1 - pi) λi + pi. Observa-se que a variância da mis- tura é maior que a média da distribuição. Quanto maior a probabilidade do excesso de zeros, maior a variância da variável. Na medida em que pi se aproxima de zero, a variância se aproxima de λi, ou seja, voltamos a lidar somente com uma dis- tribuição Poisson padrão. O modelo ZINB, por sua vez, é expresso por: 𝑌𝑌𝑖𝑖 ~ 𝑍𝑍𝑍𝑍𝑍𝑍𝑍𝑍(λ𝑖𝑖 , 𝜏𝜏,𝑝𝑝𝑖𝑖) e 𝑌𝑌i ~ � 0 , 𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑐𝑐𝑝𝑝𝑝𝑝𝑝𝑝𝑖𝑖𝑝𝑝𝑖𝑖𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑖𝑖 𝑍𝑍𝑍𝑍(λ𝑖𝑖 , 𝜏𝜏) , 𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑐𝑐𝑝𝑝𝑝𝑝𝑝𝑝𝑖𝑖𝑝𝑝𝑖𝑖𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 (1 − 𝑝𝑝𝑖𝑖) � A média e a variância de Yi são: E(Yi) = (1 - pi) λi e Var(Yi) = (1 - pi)λi+ p(1 - pi)λ2 i. A distribuição ZINB aproxima-se da ZIP quando τ→0 e apro- xima-se da binomial negativa quando pi→0. Se ambos 1/τ e pi convergem para zero, então a dis- tribuição ZINB é reduzida a uma distribuição de Poisson padrão. Em ambos os modelos ZIP e ZINB, o risco re- lativo é estimado por um preditor linear médio (ηi), conforme descrito previamente para o mo- delo de Poisson. Modelagem bayesiana Os modelos de contagem apresentados previa- mente foram analisados segundo a metodologia de modelo hierárquico inteiramente bayesia- no 24. Sob a abordagem bayesiana, prioris são especificadas para os parâmetros do modelo. O efeito espacial ψi foi modelado por um processo de Campos Aleatórios Markovianos Gaussianos (CAMG) 26, assumindo priori com estrutura au- torregressiva condicional (CAR). A relação espa- cial entre os setores foi modelada por uma matriz de vizinhança (adjacência) binária, adotando-se o valor 1 para cada elemento quando os setores são vizinhos, e 0 em caso contrário. Para os parâ- metros do modelo (α e β), atribuiu-se prioris com distribuição normal com média zero e variância grande (N [0, 10.000]). Para a precisão dos efeitos aleatórios (Φi e ψi), seguiu-se a recomendação da literatura 27, adotando-se hiperprioris de uma distribuição Gama (0,5; 0,0005). A análise bayesiana para estimativa dos parâ- metros foi conduzida pelo método INLA (Integra- ted Nested Laplace Aproximation). A abordagem INLA destaca-se por empregar aproximações de Laplace para aproximar as distribuições a poste- riori via métodos computacionais determinísti- cos, sem a necessidade de utilizar simulações. As estimativas obtidas são eficientes e computacio- nalmente mais rápidas em relação aos métodos tradicionais de Monte Carlo via cadeias de Mar- kov (MCMC) 26. Utilizou-se o critério DIC (Deviance Informa- tion Criterion) 28 e Deviance baseada na Orde- nada Preditiva Condicional (CPO – Conditional Predictive Ordinate) 29 para identificar o modelo com o melhor ajuste aos dados. Em relação ao DIC, quanto menor o valor estimado, melhor é o ajuste do modelo. Considerou-se que uma diferença menor que cinco entre os valores do DIC de dois modelos (D = DIC1 - DIC2) não é significativa 28. ANÁLISE ESPACIAL DE DADOS DE CONTAGEM COM EXCESSO DE ZEROS 5 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 O critério CPO avalia o poder preditivo do modelo e consiste em densidades de validação cruzada, isto é, distribuições preditivas condicio- nadas sobre o conjunto de dados observados, ex- ceto a k-ésima informação. O CPO proporciona uma medida de ajuste para cada observação in- dividualmente, e comparações entre os modelos são realizadas usando-se a média do logaritmo do CPO (-média(log(CPO)) ou LCPO) 29. As análises foram realizadas com o software R, versão 3.2.0 (The R Foundation for Statistical Computing, Viena, Áustria; http://www.r-pro ject.org), utilizando-se o pacote R-INLA. Estudo de simulação Adotando-se a malha urbana dos setores censi- tários do Município de Campinas em 2010, si- mulou-se 100 conjuntos de dados, para cinco diferentes cenários em relação à proporção (p) de setores censitários com contagem zero de ca- sos de dengue: p = 0,1; p = 0,2; p = 0,4; p = 0,6 e p = 0,8. Os setores com contagem igual a zero fo- ram selecionados aleatoriamente, de acordo com a proporção (p) de regiões com contagens zero da doença. Com base em uma distribuição uni- forme, gerou-se um número aleatório ri ~ U(0,1) para todas os setores. Selecionamos os setores com contagem zero se ri < p e para os setores com ri ≥ p, as contagens observadas (Oi) foram gera- das por uma distribuição multinomial, conforme descrito por Richardson et al. 30:         ∑i ii ii ti E E N lMultinomiaO θ θ ;~ Em que Nt é o número total de casos espera- dos. Esse procedimento assegura que em cada conjunto de dados simulado a soma dos casos observados permanece igual à soma dos casos esperados. Em relação ao risco, adotou-se um modelo básico, com a hipótese de risco constan- te e igual a um (θi = = θ = 1) sobre a região de estudo. Dados de dengue em Campinas Analisou-se os casos de dengue autóctones, ocorridos nos setores censitários urbanos da cidade de Campinas, registrados entre 1o de ja- neiro e 31 de dezembro de 2007. Adotou-se esse período de estudo por ser aquele com maior inci- dência da doença com dados disponíveis e geor- referenciados na base cartográfica da cidade, historicamente é o período com a segunda maior incidência (11.442 casos), superado pelo ano de 2014 com 42.109 casos. O banco de dados com os casos de dengue foi obtido do Sistema de Infor- mação de Agravos de Notificação (SINAN), corri- gido e fornecida nova versão pela Coordenadoria de Vigilância e Saúde da Secretária Municipal de Saúde do município (Covisa/SMS-Campinas). Os dados populacionais utilizados para a cons- trução das taxas de incidência foram obtidos do Censo Demográfico de 2010. Na análise empírica dos dados, construiu-se uma variável sintética, denominada índice de ca- rência socioambiental (ICSA), segundo três clas- ses de carência socioambiental: maior; modera- da e menor. Essa variável foi obtida baseando-se nos seguintes indicadores provenientes do Censo Demográfico de 2010: uma variável relacionada à renda domiciliar (proporção de domicílios com renda per capita até meio salário mínimo), três re- lacionadas à inadequação de serviços urbanos nos domicílios (proporção de domicílios com inadequação de: esgotamento sanitário, destina- ção do lixo e forma de abastecimento de água) e três variáveis relacionadas à infraestrutura urba- na no entorno dos domicílios (proporção de do- micílios com: ausência de pavimentação, esgoto a céu aberto e lixo acumulado no entorno). Esses indicadores foram submetidos à téc- nica de componentes principais (ACP). O ICSA é a média aritmética dos indicadores primários, após cada um ter sido padronizado em um inter- valo de valores entre 0 (zero) e 1 (um), de acordo com os valores mínimos e máximos observados para cada setor. Posteriormente, a técnica de análise de agrupamento (cluster analysis), via o método de k-médias (k-means), foi utilizada para a obtenção dos três estratos de carência so- cioambiental dos setores censitários urbanos da cidade de Campinas (Figura 1). Adicionalmente, foi estimada e mapeada a probabilidade a posteriori do risco relativo (RR) de dengue exceder 1,2 (Pr[RR > 1,2 | Y]), obtendo- se assim, uma medida de evidência (estatística) de excesso de risco em cada setor censitário. O valor de RR = 1,2 reflete o risco médio de inci- dência de dengue, observado na região urbana de Campinas. Estimativas de probabilidades a pos- teriori superiores a 0,8 representam evidências de excesso de risco nos setores 30, permitindo identi- ficar possíveis efeitos de agregação espacial. Resultados Estudo de simulação Os resultados deste estudo estão resumidos na Tabela 1, em que é apresentada a comparação do desempenho do modelo padrão de Poisson em relação aos modelos BN, ZIP e ZINB, nos dife- rentes cenários de p. Nossos resultados mostram que, segundo o valor médio do DIC, o modelo Costa JV et al.6 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 ZIP foi aquele que apresentou o menor valor deste critério para todos os cenários de p, sendo que o modelo ZINB foi o segundo com melhor ajuste. Diferenças substanciais foram observa- das na comparação dos valores do DIC do mo- delo Poisson em relação aos modelos ZIP e ZINB. Conforme se aumentou os valores da proporção p de zeros, maiores foram as diferenças entre os critérios desses modelos. Em relação ao LCPO, os resultados obtidos seguiram na mesma direção dos obtidos com o DIC, apontando melhor capacidade preditiva para o modelo ZIP. Aplicação aos dados empíricos Um total de 11.442 casos de dengue foi confir- mado e notificado ao SINAN, na cidade de Cam- pinas, em 2007. Após revisão, retirada de dupli- cações, análise de consistência do banco e cor- reção de ortografia de endereços registrados no SINAN 31, 8.956 (77%) foram georreferenciados so- bre a malha digital dos setores censitários do mu- nicípio, sendo 8.912 (99,5%) registrados nos seto- res urbanos. Entretanto, no processo de modela- gem, 31 setores foram excluídos por inexistência dos dados populacionais do Censo Demográfico de 2010, ocasionando a exclusão de 5 casos nes- tes setores. O banco de dados final para mode- lagem foi constituído de 8.907 casos de dengue. Na Figura 2, observa-se a distribuição de fre- quência das contagens dos casos de dengue. O histograma mostra alta variação na distribuição de frequência, caracterizada por uma assimetria positiva e com excesso de áreas sem registros de casos da doença. Verificou-se que em 25,8% dos setores censitários não foram registrados ne- nhum caso de dengue. A média e o desvio padrão (DP) do número de casos da doença e da SIR, por setor censitário, foram iguais a 5,3 (DP = 10,2) casos e 1,03 (DP = 2,03), respectivamente. Essas estatísticas descritivas, em que a variância das contagens dos casos é maior que a sua média, juntamente com a distribuição de frequência observada no histograma da Figura 2, indicam a presença de superdispersão na distribuição das contagens de casos de dengue. A análise da autocorrelação espacial, segun- do o índice de Moran bayesiano empírico 32, foi igual a 0,19 (valor de p < 0,001), indicando auto- correlação espacial positiva, ou seja, as taxas de incidência de dengue nos setores censitários não são independentes das taxas apresentadas em setores vizinhos. Considerando-se as características dos da- dos, com elevada proporção de setores censitá- rios com contagens zero da doença, e os resul- tados do estudo de simulação, foram ajustadas estimativas do risco relativo de dengue, ado- tando-se os modelos ZIP e ZINB. Estimaram-se cinco modelos para cada uma das distribuições, ajustando-se a presença de efeitos aleatórios es- pacialmente estruturado (ψi) e não estruturado (Φi), e o impacto da covariável ICSA. A Tabela 2 apresenta uma análise compara- tiva das medidas de ajuste dos modelos analisa- dos (ZIP e ZINB), com seus respectivos valores do critério DIC e LCPO. Os cinco modelos ZIP apresentaram os menores valores do DIC, ou seja, a distribuição ZIP ajustou-se melhor aos Tabela 1 Modelos bayesianos analisados e critério de ajuste Deviance Information Criterion (DIC) e deviance baseada na ordenada preditiva condicional (LCPO), aplicado ao estudo do dengue em Campinas, São Paulo, Brasil, 2007. Distribuição Modelos DIC LCPO ZIP 1. ψi 8.025,6 2,74 2. Φi 8.003,6 2,75 3. ψi + Φi 7.966,8 2,65 4. ψi + covariável (ICSA) 8.034,2 2,69 5. ψi + Φi + covariável (ICSA) 7.964,3 2,66 ZINB 6. ψi 8.864,7 4,45 7. Φi 8.827,2 4,52 8. ψi + Φi 8.833,1 4,15 9. ψi + covariável (ICSA) 8.753,3 4,22 10. ψi + Φi + covariável (ICSA) 8.827,4 4,16 ICSA: indicador de condições socioambientais: ZINB: modelo binomial negativo inflacionado de zeros; ZIP: modelo de Poisson inflacionado de zeros; ψi: efeito espacial estruturado; Φi: efeito espacial não estruturado. ANÁLISE ESPACIAL DE DADOS DE CONTAGEM COM EXCESSO DE ZEROS 7 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 Tabela 2 Medidas de ajuste dos modelos Deviance Information Criterion (DIC) e deviance baseada na ordenada preditiva condicional (LCPO), para diferentes proporções (p) de setores com contagem igual a zero, aplicado ao estudo de simulação. p Modelo DIC LCPO Média DP Média DP 0,1 Poisson 9.034,7 114,9 2,92 0,04 Binomial negativa 9.081,5 105,2 2,73 0,03 ZIP 8.605,3 93,9 2,59 0,04 ZINB 8.959,1 99,7 2,72 0,04 0,2 Poisson 10.543,0 187,5 2,75 0,06 Binomial negativa 9.854,3 91,7 2,76 0,05 ZIP 8.409,5 66,7 2,63 0,02 ZINB 9.715,1 74,5 2,69 0,05 0,4 Poisson 14.381,1 337,7 4,32 0,10 Binomial negativa 9.832,4 95,7 2,92 0,09 ZIP 8.213,5 61,2 2,47 0,08 ZINB 9.514,9 68,4 2,62 0,08 0,6 Poisson 20.368,0 455,7 6,13 0,14 Binomial negativa 8.285,8 130,0 2,63 0,13 ZIP 7.852,3 72,6 2,27 0,06 ZINB 8.045,5 85,5 2,45 0,15 0,8 Poisson 30.996,6 973,6 9,33 0,29 Binomial negativa 9.932,6 200,2 1,98 0,08 ZIP 6.649,4 89,0 1,48 0,04 ZINB 7.588,9 135,7 1,53 0,09 DP: desvio padrão; ZINB: modelo binomial negativo inflacionado de zeros; ZIP: modelo de Poisson inflacionado de zeros. Figura 2 Distribuição de frequência dos casos de dengue por setor censitário. Costa JV et al.8 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 dados. O modelo 5, ajustado por efeitos alea- tórios espacialmente estruturado (ψi) e não estruturado (Φi), adicionado ao efeito da cova- riável ICSA, apresentou o menor valor do DIC (7964,30) entre todos os modelos. Entretanto, ao comparar a diferença entre o DIC do modelo 5 com o respectivo DIC do modelo 3 (7966,81), essa diferença foi inferior a cinco. Segundo o cri- tério adotado neste trabalho e considerando-se a complexidade dos modelos, essa diferença nos valores do DIC é insuficiente para considerá-la significativa em favor do modelo 5. O ajuste se- gundo o critério LCPO, foi semelhante ao obser- vado com o DIC. Dessa forma, considerou-se o modelo 3, modelado por uma distribuição ZIP e ajustado para os efeitos aleatórios estruturado espacialmente e não estruturado, aquele com melhor ajuste entre os dez modelos. Desse pon- to em diante, a análise do risco relativo refere-se ao modelo 3. A Figura 3a apresenta o mapa com a SIR, e na Figura 3b o mapa ilustra as estimativas a pos- teriori do RR, as quais variaram de 0,22 a 36,52, com valor médio de 1,27 e DP de 1,55. Contras- tando-se a distribuição espacial da SIR com a distribuição do RR, nota-se que há uma redução de áreas com RR < 0,5, e em função do efeito de suavização do modelo espacial, observa-se um estreitamento das estimativas do risco em dire- ção ao risco médio. A Figura 3c ilustra as probabilidades do RR ajustado ser maior do que 1,2 (RR > 1,2), ou se- ja, dos setores censitários apresentarem RR de dengue 20% maior que a média dos 1.664 setores urbanos. Observou-se que 566 (43,6%) setores censitários apresentaram excesso de risco, com probabilidade acima de 0,8. Discussão Neste estudo, no contexto de análise espacial de dados agregados, foram avaliados quatro mode- los de regressão para dados de contagem: Pois- son, BN, ZIP e ZINB, na presença de superdis- persão nos dados. A superdispersão nos dados não apresenta parâmetro de ajuste no modelo de Poisson, é modelada por um parâmetro adi- cional no modelo BN e por uma proporção extra de zeros, utilizando-se modelos inflacionados de zeros (ZIP e ZINB). Adicionalmente, efeitos aleatórios espaciais foram incluídos nos mode- los para ajustar heterogeneidade não observada, permitindo correlações espaciais entre as obser- vações. Os dados foram analisados sob o enfo- que bayesiano. Esses modelos foram aplicados inicialmente em um estudo de simulação, na malha de seto- res censitários do Município de Campinas, em diferentes cenários para a proporção p de zeros nos dados. Obtendo-se, segundo os critérios DIC e LCPO, melhor desempenho para o modelo ZIP. O modelo de Poisson apresentou desempenho bem inferior aos modelos inflacionados de zero, principalmente com proporção de zeros igual ou superior a 40% (p = 0,4). Esse resultado é reflexo da falta de um parâmetro adicional no mode- lo de Poisson para correção de superdispersão nos dados. O modelo BN também apresentou desempenho inferior em relação aos modelos inflacionados de zero. Isso porque o parâmetro adicional da distribuição BN considera que a so- bredispersão decorre de uma heterogeneidade não observada 20, sendo que nos nossos dados a principal fonte da superdispersão é o excesso de regiões com contagens iguais a zero. Os resultados desse estudo de simulação evi- denciaram a importância de se empregar méto- dos adequados que ajustem o excesso de zeros presentes na distribuição dos dados. Com base nos resultados desse estudo de si- mulação foram aplicados os modelos inflaciona- dos de zero (ZIP e ZINB) a um conjunto de da- dos reais com contagens de casos de dengue do Município de Campinas, em 2007. Nessa análise, segundo os critérios DIC e LCPO, o modelo ZIP apresentou melhor ajuste, estimando de forma consistente o risco relativo da incidência de den- gue nos setores censitários urbanos, corrigin- do os efeitos de correlação espacial, flutuações aleatórias, superdispersão e excesso de zeros. Foi possível identificar áreas onde ocorreu maior in- cidência em 2007, assim prioritárias para ações de controle naquele ano. A distribuição espacial dos casos de dengue não se mostrou associada às condições socioambientais dos setores. Ressal- ta-se que embora áreas periféricas apresentem menor cobertura de saneamento e intermitência de oferta de água encanada com pior situação socioeconômica, outros fatores interferem na circulação viral. A circulação prévia do sorotipo do vírus, resultando na imunidade adquirida pela população, medidas de controle específicas por parte do poder público, mudança no com- portamento da população após a notificação de casos, são fatores que interferem nos caminhos da transmissão 12,14,16. Em relação ao nível de agregação dos dados, os setores censitários são as menores unidades geográficas disponíveis para os dados socioam- bientais, permitindo a visualização espacial mais precisa do território onde se concentram os maiores níveis de transmissão de dengue. O aumento da escala (áreas menores) também per- mite obter informações contextuais com maior homogeneidade interna, diferentemente do que ANÁLISE ESPACIAL DE DADOS DE CONTAGEM COM EXCESSO DE ZEROS 9 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 Figura 3 Mapas com a distribuição do risco de dengue em Campinas, São Paulo, Brasil: (3a) razão de incidência padronizada (SIR); (3b) estimativas do risco relativo (RR) obtidas com o modelo de Poisson inflacionado de zeros (ZIP); e (3c) probabilidade a posteriori do RR > 1,2. Costa JV et al.10 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 se observa com dados agregados em escala me- nor (áreas maiores). Um método alternativo foi proposto para permitir a agregação dos dados censitários em uma grade regular com cerca de 0,0625km2 ou 250x250m na Amazônia brasileira 33. A disponi- bilidade dos dados em grade regular apresenta algumas vantagens em relação aos setores cen- sitários: permite obter estabilidade temporal destas unidades, sendo possível trabalhar com regiões ainda menores, do mesmo tamanho e também se obter maior homogeneidade interna nos dados populacionais. Dessa forma, a aplica- ção do modelo de Poisson inflacionado de zeros viabiliza a análise de dados que se apresentam na forma de contagens para pequenas áreas, na pre- sença de contagens nulas, sem a necessidade de se agregar um conjunto de áreas para a obtenção de áreas maiores. A inclusão do efeito aleatório espacial ajustou a heterogeneidade espacial não observada e cor- rigiu a presença de correlação espacial presente entre as observações. A correlação espacial foi modelada segundo uma matriz de vizinhança binária, definida baseando-se na relação de vizi- nhança entre os setores censitários. É importante considerar que diferentes especificações na ma- triz de vizinhança produzem diferentes estima- tivas na análise espacial. Esses critérios também podem ser determinados com base no tamanho da fronteira, com ou sem a presença de barreiras naturais, ou outra característica geográfica que possa interferir na ligação entre as áreas 11. A utilização da abordagem INLA para es- timativa dos parâmetros mostrou-se atrativa e conveniente para a realização de inferências. O processo de estimação dos parâmetros não apre- sentou problemas de convergência, estimando os parâmetros de forma bem rápida (aproxima- damente 13 segundos), conforme já demonstra- do em outros estudos 29. A identificação dos parâmetros é uma das principais dificuldades encontradas no contexto em que a inferência bayesiana é realizada via o método de MCMC. Para superar esse problema, o processo de estimação pela INLA impõe uma restrição de soma zero ao efeito aleatório estru- turado espacialmente 34. Os resultados obtidos demonstraram a pre- sença de variação espacial na distribuição geo- gráfica da incidência de dengue em Campinas. Embora as estimativas do RR não tenham sido significantes, não há como desconsiderar total- mente a importância de fatores socioambientais na dinâmica do vetor transmissor. Um estudo identificou que nesse período de análise a trans- missão originou-se na região Norte da cidade, uma área carente de infraestrutura urbana, com moradores apresentando precárias condições socioeconômicas e marcada pela presença de importantes rodovias que favorecem o intenso fluxo de pessoas e veículos 31. Estudos demonstram que o espaço e o tempo são duas dimensões importantes a serem consi- deradas na descrição da dinâmica de epidemias e na distribuição de risco da doença, sendo ne- cessário o acompanhamento sistemático das áreas mais vulneráveis à doença. Wen et al. 35 desenvolveram um modelo espaço-temporal de risco com base em indicadores de frequên- cia, duração e intensidade para o mapeamento e acompanhamento da dinâmica da doença, identificação de áreas de risco e comparação dos diferentes padrões de risco. Estudos com o modelo espaço-temporal realizados nos muni- cípios de São José do Rio Preto 36 e Tupã 37, em São Paulo, e Rio de Janeiro 14 identificaram di- ferentes áreas de risco nos períodos analisados, demonstrando-se que as áreas de risco podem variar entre alças epidêmicas. A persistência de ondas epidêmicas na cidade denotam que estas variações em escala temporal e espacial podem estar mais relacionadas à redução de indivíduos suscetíveis ao sorotipo do vírus circulante do que a medidas de controle 38. Alguns autores encontraram evidência da associação entre risco de dengue e condições socioambientais após a reintrodução de novo so- rotipo do vírus, sendo que depois da dispersão do vírus as incidências ocorrem de forma geral em todos os extratos socioeconômicos 38. Nes- se sentido, verifica-se que, em anos anteriores, a incidência da doença em Campinas foi mais concentrada em áreas periféricas, em especial nas regiões Sul e Norte da cidade 39,40, e em 2007, distribuiu-se de forma generalizada pelo mu- nicípio 31. Destaca-se que essa epidemia foi ca- racterizada pela circulação do sorotipo DENV-3. Esse sorotipo já havia sido isolado em 2006, na região Norte da cidade e em municípios vizinhos 31 no ano de 2003 e na epidemia de 2001/2002, juntamente com o DENV-1 41, mas sem grande disseminação. O histórico sobre os sorotipos cir- culantes na região ainda revela que houve iso- lamento dos sorotipos DENV-1 nos primeiros casos detectados em 1995 e 1996, e epidemia de 1998, o DENV-2 39. Estudos sobre a associação entre fatores socioambientais e incidência de dengue apre- sentam resultados contraditórios 42. Almeida et al. 14 na cidade do Rio de Janeiro, Pessanha et al. 43 em Belo Horizonte (Minas Gerais), Resen- des et al. 44 em Niterói (Rio de Janeiro) e Costa et al. 17 em Campinas encontraram relação positiva entre condições socioambientais e incidência de dengue. Distintamente, Mondini & Chiaraval- ANÁLISE ESPACIAL DE DADOS DE CONTAGEM COM EXCESSO DE ZEROS 11 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 loti-Neto 45 em São José do Rio Preto, Machado et al. 46 em Nova e Iguaçu (Rio de Janeiro) e Tei- xeira et al. 47 no Rio de Janeiro encontraram re- sultados semelhantes aos registrados no presen- te estudo. Os resultados conflitantes encontrados nos diferentes estudos demonstram a complexa rela- ção entre fatores socioambientais e o risco de in- fecção da doença, cuja variação espacial também pode estar associada a outros fatores não men- surados. Estudos anteriores demonstraram que a dinâmica do dengue também é afetada por fa- tores ambientais e climáticos, interações hospe- deiro/vetor e imunidade da população 4,48,49,50. As variações nas condições climáticas (aumento da temperatura, pluviosidade e umidade do ar) afetam a sobrevivência, a reprodução do vetor, as mudanças na sua distribuição e a densidade. Diferentes estratégias metodológicas adota- das para avaliar a relação entre dengue e condi- ções socioambientais também podem influen- ciar os resultados obtidos. O tipo de dado uti- lizado (dados primários ou secundários), dife- rentes variáveis adotadas para a caracterização socioambiental e o tipo de agregação usada (se- tor censitário, bairro, distritos e/ou municípios) podem gerar distorções nos diferentes estudos 38. Diante da complexa teia de fatores envolvi- dos na incidência de dengue e da indisponibi- lidade de uma vacina eficaz e segura, os esfor- ços devem ser concentrados para o controle do vetor transmissor 3,4, direcionados às realidades locais com base na intersetorialidade, integra- lidade e participação social no enfrentamento da doença 43,44. Destacam-se algumas limitações observadas nos estudos de análise espacial que trabalham com dados secundários. Quanto ao tipo de agre- gação adotada, os diferentes resultados obtidos segundo diferentes recortes espaciais são cha- mados de problema da unidade de área modi- ficável 45. Nesse caso, mudanças na escala e nas dimensões da unidade de análise podem levar a conclusões diferentes. Um estudo de revisão sobre a relação entre dengue e indicadores so- cioeconômicos e ambientais, ao comparar dife- rentes estudos com dados secundários, concluiu que resultados semelhantes foram observados principalmente nos estudos com a mesma escala de agregação. A possibilidade de subnotificação de casos e da variabilidade da qualidade dos dados registra- dos no SINAN constitui outra limitação do estu- do. São registrados principalmente aqueles casos de evolução mais grave, havendo subnotificação das formas mais leves da doença. Essas subno- tificações ocorrem frequentemente por falhas do próprio sistema de informações em saúde e treinamento dos profissionais de saúde sobre o diagnóstico, vigilância e assistência à doença 46. Adicionalmente, distorções no conhecimento da distribuição da circulação dos vírus do dengue podem ocorrer devido aos dados registrados no SINAN retratarem mais fielmente a busca à as- sistência médica nos serviços públicos, não in- cluindo parte dos indivíduos que buscam atendi- mento nos serviços privados, embora se observe aumento das notificações nestes serviços. Por fim, os estudos ecológicos por não utili- zarem dados sobre indivíduos, apenas agregados sobre grupos de pessoas, estão sujeitos ao “viés ecológico”, que se refere à impossibilidade das associações obtidas no nível ecológico (agrega- do) refletirem associações no nível individual 14. Uma alternativa para reduzir esse tipo de viés se- ria a combinação de dados de área e uma amos- tra de dados individuais 49. Trabalhos futuros precisam considerar o ajuste para outros fatores de exposição no nível agregado e no nível indivi- dual, além de considerar a variação espaço-tem- poral da incidência de dengue. Portanto, conclui-se que na análise espacial de dados agregados é fundamental avaliar de for- ma adequada a distribuição discreta que melhor ajusta o conjunto de dados em análise, não se restringindo somente à distribuição de Poisson. Os modelos inflacionados de zero permitem ana- lisar os dados de área em níveis mais desagrega- dos, sem a necessidade de juntar áreas com baixa frequência do evento de interesse com áreas em que não houve a ocorrência do evento. Com base na abordagem bayesiana, a aplicação dos mo- delos inflacionados de zeros com a inclusão de efeitos aleatórios, permite obter estimativas ro- bustas da distribuição espacial do risco relativo. Somando-se a outras variáveis obtidas junto aos serviços de vigilância epidemiológica, virológica e vetorial, contribuem para refinar o conheci- mento sobre a transmissão em pequenas áreas. Costa JV et al.12 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 Colaboradores J. V. Costa participou no desenho do estudo, análise dos dados, discussão dos resultados, redação e revisão fi- nal do artigo. L. V. A. Silveira contribuiu no desenho do estudo, na análise dos dados e revisão do artigo. M. R. Donalísio colaborou no desenho do estudo, redação e revisão do artigo. Agradecimentos À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) pela bolsa de doutorado concedida parcialmente a J. V. Costa. À Heloísa Girardi Malavasi por geocodificar os casos de dengue. Referências 1. Gubler DJ. Dengue/dengue haemorrhagic fever: history and current status. Novartis Found Symp 2006; 277:3-16. 2. Gubler DJ. Dengue and dengue hemorrhagic fever. Clin Microbiol Rev 1998; 11:480-96. 3. Martina BEE, Koraka P, Osterhaus ADME. Dengue virus pathogenesis: an integrated view. Clin Micro- biol Rev 2009; 22:564-81. 4. Rodenhuis-Zybert IA, Wilschut J, Smit JM. Dengue virus life cycle: viral and host factors modulating infectivity. Cell Mol Life Sci 2010; 67:2773-86. 5. Gubler DJ. Dengue, urbanization and globaliza- tion: the unholy trinity of the 21st century. Trop Med Health 2011; 39(4 Suppl):S3-11. 6. Lambrechts L, Paaijmans KP, Fansiri T, Carrington LB, Kramer LD, Thomas MB, et al. Impact of daily temperature fluctuations on dengue virus trans- mission by Aedes aegypti. Proc Natl Acad Sci U S A 2011;108:7460-5. 7. Alirol E, Getaz L, Stoll B, Chappuis F, Loutan L. Ur- banisation and infectious diseases in a globalised world. Lancet Infect Dis 2011; 11:131-41. 8. Liebman KA, Stoddard ST, Morrison AC, Rocha C, Minnick S, Sihuincha M, et al. Spatial dimensions of dengue virus transmission across interepidemic and epidemic periods in Iquitos, Peru (1999-2003). PLoS Negl Trop Dis 2012; 6:e1472. 9. Halstead SB. Dengue virus-mosquito interactions. Annu Rev Entomol 2008; 53:273-91. 10. Eisen L, Lozano-Fuentes S. Use of mapping and spatial and space-time modeling approaches in operational control of Aedes aegypti and dengue. PLoS Negl Trop Dis 2009; 3:e411. 11. Elliott P, Wakefield J, Best N, Briggs D. Spatial epi- demiology: methods and applications. London: Oxford University Press; 2001. 12. Siqueira JB, Martelli CMT, Maciel IJ, Oliveira RM, Ribeiro MG, Amorim FP, et al. Household survey of dengue infection in central Brazil: spatial point pattern analysis and risk factors assessment. Am J Trop Med Hyg 2004; 71:646-51. 13. Mondini A, Chiaravalloti Neto F, Gallo Y, Sanches M, Lopes JCC. Análise espacial da transmissão de dengue em cidade de porte médio do interior pau- lista. Rev Saúde Pública 2005; 39:444-51. 14. Almeida AS, Medronho RA, Valencia LIO. Análise espacial da dengue e o contexto socioeconômico no Município do Rio de Janeiro, RJ. Rev Saúde Pú- blica 2009; 43:666-73. 15. Flauzino RF, Souza-Santos R, Barcelllos C, Gracie R, Magalhães MAFM, Oliveira RM. Heterogeneida- de espacial da dengue em estudos locais, Niterói, RJ. Rev Saúde Pública 2009; 43:1035-43. 16. Cordeiro R, Donalísio MR, Andrade VR, Mafra AC, Nucci LB, Brown JC, et al. Spatial distribution of the risk of dengue fever in southeast Brazil, 2006- 2007. BMC Public Health 2011; 11:355. 17. Costa JV, Donalisio MR, Silveira LVA. Spatial dis- tribution of dengue incidence and socio-environ- mental conditions in Campinas, São Paulo State, Brazil, 2007. Cad Saúde Pública 2013; 29:1522-32. 18. Lambert D. Zero-inflated Poisson regression, with an application to defects in manufacturing. Tech- nometrics 1992; 34:1-14. ANÁLISE ESPACIAL DE DADOS DE CONTAGEM COM EXCESSO DE ZEROS 13 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 19. Ridout M, Malling W, Me K. Models for count data with many zeros. North 1998; 19:179-92. 20. Hall DB. Zero-inflated Poisson and binomial re- gression with random effects: a case study. Bio- metrics 2000; 56:1030-9. 21. Ghosh S, Mukhopadhyay P, Lu J. Bayesian analysis of zero-inflated regression models. J Stat Plan In- ference 2006; 136:1360-75. 22. Gschlößl S, Czado C. Modelling count data with overdispersion and spatial effects. Stat Pap (Berl) 2008; 49:531-52. 23. Haining R, Law J, Griffith D. Modelling small area counts in the presence of overdispersion and spa- tial autocorrelation. Comput Stat Data Anal 2009; 53:2923-37. 24. Besag J, York J, Molli A. Bayesian image restoration, with two applications in spatial statistics. Ann Inst Stat Math 1991; 43:1-20. 25. Cameron AC, Trivedi PK. Regression analysis of count data. Cambridge: Cambridge University Press; 1998. (Econometric Society Monograph, 30). 26. Rue H, Martino S. Approximate Bayesian inference for hierarchical Gaussian Markov random field models. J Stat Plan Inference 2007; 137:3177-92. 27. Kelsall J, Wakefield J. Discussion of “Bayesian models for spatially correlated disease and expo- sure data”. In: Bernardo J, Berger J, Dawid A, Smith A, editors. Bayesian statistics 6. Oxford: Oxford University Press; 1999. p. 131-56. 28. Spiegelhalter D, Thomas A, Best N, Way R. Win- BUGS user manual. Cambridge: MRC Biostat Unit; 2003. 29. Held L, Schrödle B, Rue H. Posterior and cross-val- idatory predictive checks: a comparison of MCMC and INLA. In: Kneib T, Tutz G, editors. Statistical modelling and regression structures. Heidelberg: Physica-Verlag HD; 2010. p. 91-110. 30. Richardson S, Thomson A, Best N, Elliott P. Inter- preting posterior relative risk estimates in disease- mapping studies. Environ Health Perspect 2004; 112:1016-25. 31. Malavasi H. Análise espacial da epidemia de den- gue em Campinas/SP no ano de 2007 [Dissertação de Mestrado]. Campinas: Faculdade de Ciências Médicas, Universidade Estadual de Campinas; 2011. 32. Assunção RM, Reis EA. A new proposal to adjust Moran’s I for population density. Stat Med 1999; 18:2147-62. 33. D’Antona AO, Bueno MCD, Dagnino RS. Estimati- va da população em unidades de conservação na Amazônia Legal brasileira: uma aplicação de gra- des regulares a partir da Contagem 2007. Rev Bras Estud Popul 2013; 30:401-28. 34. Schrödle B, Held L. A primer on disease mapping and ecological regression using INLA. Comput Stat 2011; 26:241-58. 35. Wen T-H, Lin NH, Chao D-Y, Hwang K-P, Kan C-C, Lin KC-M, et al. Spatial-temporal patterns of den- gue in areas at risk of dengue hemorrhagic fever in Kaohsiung, Taiwan, 2002. Int J Infect Dis 2010; 14:e334-43. 36. Galli B, Chiaravalloti Neto F. Modelo de risco tem- po-espacial para identificação de áreas de risco para ocorrência de dengue. Rev Saúde Pública 2008; 42:656-63. 37. Barbosa GL, Lourenço RW. Análise da distribuição espaço-temporal de dengue e da infestação lar- vária no Município de Tupã, Estado de São Paulo. Rev Soc Bras Med Trop 2010; 43:145-51. 38. Almeida MCM, Assunção RM, Proietti FA, Caiaf- fa WT. Dinâmica intra-urbana das epidemias de dengue em Belo Horizonte, Minas Gerais, Brasil, 1996-2002. Cad Saúde Pública 2008; 24:2385-95. 39. Kemp B. Os casos que não se confirmaram como dengue durante a epidemia de dengue no Muni- cípio de Campinas/SP, 2002 [Tese de Doutorado]. Campinas: Faculdade de Ciências Médicas, Uni- versidade Estadual de Campinas; 2005. 40. Andrade VR. Distribuição espacial do risco de den- gue em região do Município de Campinas [Tese de Doutorado]. Campinas: Faculdade de Ciências Médicas, Universidade Estadual de Campinas; 2009. 41. Lima VLC, Rangel O, Andrade VR, Silveira NYJ, Oli- veira SS, Figueiredo LTM. Dengue: inquérito popu- lacional para pesquisa de anticorpos e vigilância virológica no Município de Campinas, São Paulo, Brasil. Cad Saúde Pública 2007; 23:669-80. 42. Flauzino RF, Souza-Santos R, Oliveira RM. Dengue, geoprocessamento e indicadores socioeconômi- cos e ambientais: um estudo de revisão. Rev Pa- nam Salud Pública 2009; 25:456-61. 43. Pessanha JEM, Caiaffa WT, Kroon EG, Proietti FA. Dengue em três distritos sanitários de Belo Ho- rizonte, Brasil: inquérito soroepidemiológico de base populacional, 2006 a 2007. Rev Panam Salud Pública 2010; 27:252-8. 44. Resendes APC, Silveira NAPR, Sabroza PC, Souza- Santos R. Determinação de áreas prioritárias para ações de controle da dengue. Rev Saúde Pública 2010; 44:274-82. 45. Mondini A, Chiaravalloti Neto F. Socioeconomic variables and dengue transmission. Rev Saúde Pública 2007; 41:923-30. 46. Machado JP, Oliveira RM, Souza-Santos R. Análise espacial da ocorrência de dengue e condições de vida na cidade de Nova Iguaçu, Estado do Rio de Ja- neiro, Brasil. Cad Saúde Pública 2009; 25:1025-34. 47. Teixeira TRA, Cruz OG. Spatial modeling of den- gue and socio-environmental indicators in the city of Rio de Janeiro, Brazil. Cad Saúde Pública 2011; 27:591-602. 48. Barclay E. Is climate change affecting dengue in the Americas? Lancet 2008; 371:973-4. 49. Kyle JL, Harris E. Global spread and persistence of dengue. Annu Rev Microbiol 2008; 62:71-92. 50. Sessions OM, Barrows NJ, Souza-Neto JA, Robin- son TJ, Hershey CL, Rodgers MA, et al. Discovery of insect and human dengue virus host factors. Na- ture 2009; 458:1047-50. Costa JV et al.14 Cad. Saúde Pública, Rio de Janeiro, 32(8):e00036915, ago, 2016 Abstract Dengue incidence occurs predominantly within city limits. Identifying spatial distribution of the disease at the local level helps formulate strategies to control and prevent the disease. Spatial analysis of counting data for small areas commonly violates the assump- tions of traditional Poisson models due to the exces- sive amount of zeros. This study compared the perfor- mance of four counting models used in mapping dis- eases: Poisson, negative binomial, zero-inflated Pois- son, and zero-inflated negative binomial. The meth- ods were compared in a simulation study. The models analyzed in the simulation were applied to a spatial ecological study of dengue data aggregated by census tracts in the city of Campinas, São Paulo State, Brazil, 2007. Spatial analysis was conducted with Bayesian hierarchical models. The zero-inflated Poisson model showed the best performance for estimating relative risk of dengue incidence in the census tracts. Spatial Analysis; Dengue; Communicable Disease Control Resumen La incidencia de dengue se produce, predominan- temente, en las áreas urbanas de las ciudades. Iden- tificar el patrón de distribución espacial de la enfer- medad a nivel local contribuye a la formulación de estrategias de control y prevención de la enfermedad. El análisis espacial de datos de conteo para pequeñas áreas comúnmente transgrede las suposiciones de los modelos tradicionales de Poisson, debido a la canti- dad excesiva de ceros. En este estudio, se comparó el desempeño de cuatro modelos de conteo utilizados en el mapeo de enfermedades: Poisson, binomial nega- tivo, Poisson con exceso de ceros y binomial negativo con exceso de ceros. Los métodos fueron comparados en un estudio de simulación. Los modelos analizados en el estudio de simulación fueron aplicados en un es- tudio ecológico espacial, a los datos de dengue agrega- dos por sectores censales, del Municipio de Campinas, São Paulo, Brasil, 2007. El análisis espacial fue realiza- do con modelos jerárquicos bayesianos. El modelo de Poisson con exceso de ceros presentó un mejor desem- peño para estimar el riesgo relativo de incidencia de dengue en los sectores censales. Análisis Espacial; Dengue; Control de Enfermedades Transmisibles Recebido em 09/Mar/2015 Versão final reapresentada em 18/Fev/2016 Aprovado em 06/Abr/2016