UNIVERSIDADE ESTADUAL PAULISTA “JULIO DE MESQUITA FILHO” INSTITUTO DE BIOCIÊNCIAS CAMPUS DE BOTUCATU Heterogeneidade genética de Anopheles darlingi e suas implicações para epidemiologia da malária MELINA AULINO CAMPOS DE LIMA Tese apresentada ao Curso de Pós- graduação em Ciências Biológicas, Área de Concentração Genética do Instituto de Biociências de Botucatu, Universidade Estadual Paulista – UNESP. BOTUCATU- SP 2016 MELINA AULINO CAMPOS DE LIMA Bacharel em Ciências Biomédicas Heterogeneidade genética de Anopheles darlingi e suas implicações para epidemiologia da malária Orientador: Prof. Dr. Paulo Eduardo Martins Ribolla Tese apresentada ao Curso de Pós- graduação em Ciências Biológicas, Área de Concentração Genética do Instituto de Biociências de Botucatu, Universidade Estadual Paulista – UNESP. BOTUCATU- SP 2016 FICHA CATALOGRÁFICA ELABORADA PELA SEÇÃO TÉC. AQUIS. TRATAMENTO DA INFORM. DIVISÃO TÉCNICA DE BIBLIOTECA E DOCUMENTAÇÃO - CÂMPUS DE BOTUCATU - UNESP BIBLIOTECÁRIA RESPONSÁVEL: ROSANGELA APARECIDA LOBO-CRB 8/7500 Lima, Melina Aulino Campos de. Heterogeneidade genética de Anopheles darlingi e suas implicações para epidemiologia da malária / Melina Aulino Campos de Lima. - Botucatu, 2016 Tese (doutorado) - Universidade Estadual Paulista "Júlio de Mesquita Filho", Instituto de Biociências de Botucatu Orientador: Paulo Eduardo Martins Ribolla Capes: 20202008 1. Anopheles. 2. Polimorfismo de nucleotídeo único. 3. Genetica de populações. 4. Malária. 5. Microssatélites (Genética). Palavras-chave: Anopheles darlingi; SNPs; genética de população; malária; microssatélites. “A ciência nos traz conhecimento; a vida, sabedoria.” Will Durant Agradeço e celebro primeiramente a vida, a oportunidade de existir e ser; a chance de ter conhecido pessoas incríveis que me ajudaram a crescer e amadurecer, em todos os sentidos, ao longo dos quatro anos de doutorado. Agradeço ao Paulo Ribolla, meu orientador e personagem da minha primeira inspiração no mundo científico; e a todo o grupo Pangene, em especial ao Diego Alonso. Agradeço ao apoio e oportunidades oferecidas por pesquisadores que, para mim, são grandes exemplos: Maria Anice Sallum, João Pinto, Jan Conn e Kevin Emerson. Pontuo também as experiências enriquecedoras vivenciadas e, por eles supervisionadas, em Portugal e nos Estados Unidos. Agradeço a minha família e marido, Vinícius, por mesmo de longe, apoiarem o meu sonho que parecia estar ainda mais distante de realizar-se. Agradeço ao financiamento da CAPES: BEX 9230/12-2 pela bolsa de Doutorado sanduiche em Lisboa, Portugal; A Fundação de Amparo à Pesquisa do Estado de São Paulo, FAPESP, processo: 2012/04881-9, pela bolsa de Doutorado Direto no país e bolsa estágio de pesquisa no exterior (BEPE) , processo: 2014/09461-3. Sumário 1 Introdução 14 1.1 Malária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.1.1 Malária no Brasil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.2 Localidades do estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.3 Vetores da Malária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.3.1 Anopheles (Nyssorhynchus) darlingi . . . . . . . . . . . . . . . . . . . . 19 1.4 Marcadores moleculares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.4.1 Estudos anteriores com An. darlingi . . . . . . . . . . . . . . . . . . . . 22 1.4.2 Técnicas utilizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2 Objetivos 25 3 Materiais e Métodos 26 3.1 Local do Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.2 Coleta de Anofelinos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.3 Preparação do DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.4 Genotipagem de Microssatélites . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.5 Genotipagem de SNP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.5.1 Preparação das bibliotecas . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.5.2 Sequenciamento das bibliotecas . . . . . . . . . . . . . . . . . . . . . . . 29 3.5.3 Processamento dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.6 Análises dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.6.1 Análises com microssatélites . . . . . . . . . . . . . . . . . . . . . . . . 31 3.6.2 Análises com SNPs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.6.3 Análises conduzidas para ambas técnicas . . . . . . . . . . . . . . . . . . 33 4 Resultados 35 4.1 Microssatélites versus SNPs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 1 4.1.1 Diversidade e Estrutura Genética dos microssatélites . . . . . . . . . . . 35 4.1.2 Diversidade e Estrutura Genética dos SNPs . . . . . . . . . . . . . . . . 37 4.1.3 Comparação entre as duas técnicas . . . . . . . . . . . . . . . . . . . . . 39 4.2 Geografia e Sazonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.2.1 Análise microgeográfica por mês de coleta . . . . . . . . . . . . . . . . . 41 4.2.2 Análise sazonal em Granada . . . . . . . . . . . . . . . . . . . . . . . . 43 4.2.3 Análise sazonal em Remansinho . . . . . . . . . . . . . . . . . . . . . . 43 4.2.4 Análise sazonal em ambas as localidades . . . . . . . . . . . . . . . . . 43 4.3 Comportamento Hematofágico . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3.1 Exofagia vs. Endofagia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3.2 Crepuscular vs. Matinal: Granada . . . . . . . . . . . . . . . . . . . . . 49 5 Discussão 56 6 Conclusão 63 7 Referências 64 8 Anexos 77 2 Lista de Figuras 1 Taxa global de mortalidade por malária. Porcentagem da mudança na taxa de mortalidade por malária nos 106 países com transmissão dessa doença no período de 2010-2013 (WHO, 2014). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2 Mapa de risco por município de infecção por malária. Gradiente em verde apresenta o risco de infecção por malária nos municípios do Brasil, em 2014. . . . . . 16 3 Brasil e região das coletas. (A) Mapa do Brasil destacando os Estados do Acre e Amazonas e os três locais de coletas. (B) Imagem de satélite mostrando degradação florestal de Granada (vermelho) e Remansinho (verde). Os assentamentos rurais são conectados pela rodovia BR364 (amarelo) e Rio Iquiri (azul). . . . . . . . . . . . . . 18 4 Anopheles (Nyssorhynchus) darlingi. Imagem de uma fêmea do mosquito An. darlingi durante repasto sanguíneo. . . . . . . . . . . . . . . . . . . . . . . . . . . 20 5 Distribuição prevista de An. darlingi nas Américas. Mapa das Américas mostrando a distribuição de An. darlingi no continente em probabilidade (1: vermelho, 0: azul), os pontos pretos foram 318 ocorrências de registro desse espécie (Sinka et al., 2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6 RADseq versus Dupla Digestão RADseq. (A) Restriction-Site Associated DNA Sequencing (RADseq) tradicional usa uma única enzima de restrição e fragmentação aleatória para gerar uma biblioteca de representação reduzida de todo o genoma nas regiões adjacentes ao sítio de restrição (segmentos vermelhos). (B) Dupla Digestão RADseq (ddRADseq), por outro lado, usa duas enzimas de restrição para digerir e precisa seleção de tamanho, exclui regiões muito próximas e muito distantes, a bi- blioteca portanto, consiste somente em fragmentos próximos ao sítio alvo (segmentos vermelhos). A representação da biblioteca nesse caso tende a ser correlacionada entre os indivíduos (barras amarelas e verdes). Adaptado de Peterson et al., (2012). . . . . 24 7 Fluxograma do processamento dos dados de SNPs. (A) Preparação e sequen- ciamento das bibliotecas, (B) Filtragem, alinhamento e processamento das sequências. (C) Seleção dos SNPs com o programa populations. . . . . . . . . . . . . . . . . . . 30 3 8 Análise Bayesiana (BA) e Análise de Componente Principal (PCA) de ge- nótipos de An. darlingi das três localidades. (A) Resultados da BA dos micros- satélites (K=2), cada coluna representa um indivíduo, divididos em três localidades (Granada, Remansinho e Cruzeiro do Sul) e a proporção que pertence a cada cluster (cinza e preto). (B) Resultados da BA dos SNPs (K=2). (C) PCA dos 9 marcadores microssatélites, cada ponto representa um indivíduo. (D) PCA de 1865 SNPs. (C-D) as cores correspondem as populações assinaladas: Granada, vermelho; Remansinho, verde e Cruzeiro do Sul, azul. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 9 Sumário da Análise Discriminante de Componente Principal (DAPC) e clusterização hierárquica em An. darlingi . (A) Valores do Critério de Informa- ção Bayesiana (BIC) para cada K (1-10), o melhor valor de K foi 3. (B) Três clusters que separam as localidades em um eixo, a área representa a densidade de indivíduos, nota-se uma sobreposição entre Granada (vermelho) e Remansinho (verde); Cruzeiro do Sul em azul. (C) Três clusters que separam as localidade em dois eixos.(D) Clus- terização hierárquica por Ward (1963), as cores correspondem a origem de coleta dos indivíduos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4 10 Análise de Componente Principal (PCA), Análise Bayesiana (BA) e Aná- lise Discriminante de Componente Principal (DAPC) de genótipos de An. darlingi coletados em Granada e Remansinho em três meses de 2012. (A) PCA dos espécimes genotipados em Granada (vermelhos) e Remansinho (verdes); cada formato representa um indivíduo, e os diferentes formatos correspondem ao mês de co- leta: Março (quadrados); Maio (triângulos) e Novembro (pontos). (B) Valores do Critério de Informação Bayesiana (BIC) para cada K , melhor K foi 2. (C) Dois clus- ters separaram An. darlingi de Granada (vermelho) e Remansinho (verde) apenas com informação do primeira função discriminante (DAPC), área representa a densidade de indivíduo. (D) Acima: resultado da BA, o melhor K foi 2 para todas as análises; cada coluna representa um indivíduo e sua porcentagem pertencente a determinado cluster (cinza e preto); abaixo: resultado da BA após filtragem pelo valor de FST entre as populações. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 11 Análise de Componente Principal (PCA) de genótipos de An. darlingi co- letados em Granada e Remansinho em três meses diferentes. (A) PCA dos espécimes de Granada, os formatos correspondem ao mês de coleta: Março (quadra- dos), Maio (triângulos) e Novembro (pontos). (B) PCA dos espécimes de Remansinho em três meses. (C) PCA dos espécimes coletados nos três meses nas duas localidades. 44 12 Sumário da Análise Discriminante de Componente Principal (DAPC) e clusterização hierárquica em An. darlingi coletados no primeiro e segundo semestre. (A) Valores do Critério de Informação Bayesiana (BIC) para cada K (1-10), o melhor valor de K foi 2. (B) Dois clusters que separam as localidades em um eixo, a área representa a densidade de indivíduos coletados no primeiro semestre (cinza escuro) e segundo (cinza claro). (C) Clusterização hierárquica por Ward (1963), a primeira derivação foi entre mosquitos coletados nos diferentes semestres. . . . . . . . . . . . 45 5 13 Diagrama de Venn. (A) Loci compartilhados entre a comparação semestral, ou seja, espécimes coletados no primeiro e no segundo semestre, e geográfica, sendo todos os meses de Granada vs. todos os meses de Remansinho. (B) Loci compartilhados entre a comparação de An. darlingi endofágico vs. exofágico coletados em Granada e Remansinho em Abril de 2011, e geográfica entre espécimes de ambos locais do mesmo mês. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 14 Análise de Componente Principal (PCA) de genótipos de An. darlingi endo/exofágicos de ambos assentamentos rurais. (A) PCA de An. darlingi endofágicos (pontos vermelhos preenchidos) e exofágicos (pontos vermelhos vazios) em Granada. (B) PCA de An. darlingi endofágicos (pontos verdes preenchidos) e exofágicos (pontos verdes vazios) em Remansinho. (C) PCA dos 4 grupos em (A) e (B). 48 15 Sumário da Análise Discriminante de Componente Principal (DAPC) em An. darlingi endo/exofágicos de ambos assentamentos rurais. (A) Valores de Critério de Informação Bayesiana (BIC) para cada K , o menor valor foi 3. (B) Proporção de indivíduos dos 4 grupos incluídos nos três clusters inferidos (vermelho, verde e roxo). (C) Ordem dos três clusters em dois eixos, cada ponto representa um indivíduo que pertence ao determinado cluster ; as caixas representam o eigenvalues para PCA e DA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 16 Densidade An. darlingi coletados em Granada das 6 pm até 6 am. (A) Coleta no peridomicílio. (B) Coleta no intradomicílio. Os números 1 e 2 indicam os dois picos de densidade analisados, crepúsculo e amanhecer. . . . . . . . . . . . . . 50 17 Análise de Componente Principal (PCA) com SNPs de An. darlingi exo- fágicos de Granada. (A) PCA de 175 SNPs genotipados em An. darlingi exofágicos coletados das 18-21 horas (crepúsculo) pontos verdes; e das 3-6 horas (amanhecer) pontos rosas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 6 18 Sumário da Análise Discriminante de Componente Principal (DAPC) em An. darlingi exofágicos em Granada. (A) Valores de Critério de Informação Bayesiana (BIC) para cada K , o menor valor foi 3. (B) Mesa com proporção de indivíduos dos 2 grupos incluídos nos três clusters inferidos (rosa, amarelo e verde). (C) Ordem dos três clusters, cada ponto representa um indivíduo que pertence ao determinado cluster ; as caixas representam o eigenvalues para PCA e DA. . . . . . . 51 19 Análise de Componente Principal (PCA) com SNPs de An. darlingi en- dofágicos de Granada. (A) PCA de 1.228 SNPs genotipados no intradomicílio das 18-21 horas (crepúsculo) pontos roxos; das 3-6 horas (amanhecer) pontos amarelos. . 52 20 Sumário da Análise Discriminante de Componente Principal (DAPC) em An. darlingi endofágicos em Granada. (A) Valores de Critério de Informação Bayesiana (BIC) para cada K , o menor valor foi 2. (B) Mesa com proporção de indivíduos dos 2 grupos incluídos nos dois clusters inferidos (roxo e amarelo). (C) Ordem dos dois clusters em um eixo, a área representa a densidade de indivíduos que pertencem ao determinado cluster . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 21 Análise de Componente Principal (PCA) e clusterização hierárquica de genótipos de An. darlingi endofágicos e exofágicos de Granada. (A) PCA de 557 SNPs genotipados em 96 indivíduos no intradomicílio (roxo e amarelo) e no peridomicílio (verde e rosa), nos dois picos de densidade, 18-21 horas (verde e roxo) e das 3-6 horas (rosa e amarelo). (B) Clusterização hierárquica por Ward (1963), * ramo conduzido a análise de genes ontólogos (GO). (C) Divisão dos grupos para a análise de genes ontólogos (I-IV). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 22 Esquema geral do ciclo gonotrófico de mosquitos exofágico & exofílico ou endofágico & endofílico. Os mosquitos se alimentam e descansam fora das casas são considerados exofágicos e exofílicos, respectivamente; e os mosquitos que fazem o repasto sanguíneo e descansam dentro das casas ou proximidades, são respectivamente, endofágicos e endofílicos. Figura baseada na figura 1 de Paaijmans & Thomas, 2011. . 60 7 Lista de Tabelas 1 Sequência dos primers de nove loci microssatélites padronizados para An. darlingi. . . 27 2 Sequência dos primers para ddRADseq. . . . . . . . . . . . . . . . . . . . . . . . . 28 3 Estimativas de Rs, He e FIS dos microssatélites de An. darlingi em três localidades. . 35 4 Estimativas de alelos de microssatélites privados em An. darlingi. . . . . . . . . . . . 36 5 Análise locus por locus dos microssatélites in An. darlingi. . . . . . . . . . . . . . . 37 6 Valores de FST par a par para microssatélites e SNPs genotipados em An. darlingi. . . 38 7 Sumário dos dados de 1.865 SNPs (variáveis e fixos) nas populações de An. darlingi. . 38 8 Sumário dos dados SNPs (variáveis e fixos) de An. darlingi de Granada e Remansinho em três meses diferentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 9 Sumário dos dados SNPs (variáveis e fixos) de An. darlingi endo/exofágicos de ambos os assentamentos rurais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 10 Sumário dos dados SNPs (variáveis e fixos) de An. darlingi endo/exofágicos crepuscu- lar e matinal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 8 Resumo Degradação florestal, alterações ambientais antropogênicas e mudanças climáticas são fatores que podem modificar a dinâmica populacional de anofelinos. Anopheles (Nyssorhynchus) dar- lingi é o principal vetor de malária no Brasil e em outros países na América do Sul. Estudos observaram o aumento da abundância do vetor An. darlingi e número de casos de malária após desflorestação e demais modificações ambientais antropogênicas. Além de ter ampla distribuição geográfica, essa espécie possui plasticidade comportamental e diversidade morfo- lógica, biológica e genética. Tendo em vista essa heterogeneidade, o presente estudo avaliou a diversidade genética populacional em An. darlingi ligada a distribuição geográfica, dinâmica sazonal e comportamento hematofágico, através de marcadores microssatélites e SNPs. Espé- cimes de An. darlingi foram coletados em dois assentamentos rurais próximos e, em uma área urbana à aproximadamente 600 km de distância. Além disso, as coletas foram realizadas no primeiro e segundo semestre e, dentro e fora das casas, durante o período de atividade hema- tofágica do vetor, ou seja, das 18-6 horas. Os resultados apresentaram subpopulações de An. darlingi em aspecto geográfico, em escalas macro e microgeográficas, acessadas com mais pro- fundidade com os dados dos SNPs. Além disso, o estudo corroborou o prévio achado de duas subpopulações de An. darlingi relacionadas ao regime de chuvas. Por fim, pela primeira vez, a heterogeneidade genética em populações simpátricas desse vetor foi encontrada e relacionada com o fenótipo de comportamento hematofágico, endo e exofagia. Esses achados demonstram a importância do entendimento e vigilância entomológica, pois possuem potencial impacto na transmissão de malária. Dado que cada localidade possui características ambientais peculia- res e portanto, diferentes composições populacionais dos vetores, intervenções específicas em menor escala passam a ser abordagens interessantes no controle da malária. 9 Abstract Forest degradation, human environmental alteration and climate changes are all influence anopheline populations. Anopheles darlingi is the main vector of malaria parasite in Brazil and other countries of South America. Deforestation and others anthropogenic activities have been accompanied by sharp increases in both abundance of the primary malaria vector Anopheles darlingi and numbers of malaria cases. Besides it is widely distributed, this species display great behavioral plasticity and morphological, biological and genetic diversity. The aim of this study was to analyze population genetic diversity of An. darlingi related to geographical distribution, seasonal dynamics and hematophagic behavior, using microsatellites and SNPs markers. An. darlingi specimens were collected in two close rural settlements and in an urban area about 600 km away. In addition, collections were performed in both semesters of the year and, indoor and outdoor during the biting activity period of the vector, i.e., 6pm-6am. The results showed subpopulations of An. darlingi related to geographical aspect, in a macro and micro geographic scales, better accessed with SNPs dataset. Moreover, this study corroborated with a previous finding showing two subpopulations of An. darlingi related to rainfall. Finally, for the first time, genetic heterogeneity was found in sympatric populations of this vector, and it was associated with a phenotype of hematophagic behavior, endo and exophagy. These outcomes demonstrate that genetic heterogeneity may represent an important vector phenotypic variation with potentially highly significant consequences for malaria transmission. Since each site has unique environmental characteristics and therefore, different population compositions of vectors, specific interventions on a smaller scale become interesting approaches for optimal targeted malaria transmission interventions. 10 Símbolos e Abreviaturas ° graus °C graus Celsius ’ minutos ml microlitros mM micromolar h hora min minutos ng nanogramas pb par de base ® registrado s segundos ™ marca comercial V voltz A diversidade alélica BIC critério de informação Bayesiana (Bayesian Information Criterion) BP processo biológico (Biological Process) COI citocromo c oxidase subunidade 1 DAPC Análise Discriminante de Componente Principal ddRADseq dupla digestão RADseq (Double Digest RADseq) DDT diclorodifeniltricloretano 11 DNA ácido desoxirribonucléico FIS coeficiente de endogamia FST índice de fixação (diversidade alélica) GO gene ontólogo He heterozigosidade esperada Ho heterozigosidade observada HWE Equilíbrio de Hardy-Weinberg IAM Infinite Allele Model IBGE Instituto Brasileiro de Geografia e Estatística IRS borrifação residual em ambientes internos (Indoor Residual Spray) ITN telas tratadas com inseticidas (Insecticide-treated Nets) ITS2 internal transcribed spacer 2 K número de clusters genéticos MDE Equilíbrio de Deriva Mutacional n número amostral ODM Objetivos de Desenvolvimento do Milênio ONU Organização das Nações Unidas PAD Projeto de Assentamento Dirigido PCR reação em cadeia da DNA polimerase (Polymerase Chain Reaction) PCA Análise de Componente Principal FST índice de fixação (diversidade haplotípica) 12 RADseq sequenciamento de DNA associado a sítio de restrição (Restriction-site Associate DNA sequencing) RAPD polimorfismo de DNA amplificado ao acaso (Random Amplified Polymorphic DNA) RFLP Polimorfismo de tamanho dos fragmentos de restrição (Restriction Fragment Lenght Polymorphism) Rs riqueza alélica SMM Stepwise Mutation Model SNP Polimorfismo de base única (Single Nucleotide Polymorphism) SSR sequência simple repetidas UNESP Universidade Estadual Paulista “Júlio de Mesquita Filho” vs. versus WHO Organização Mundial da Saúde (World Health Organization) 13 1 Introdução 1.1 Malária Malária é a mais importante parasitose humana em todo o mundo. Segundo o World Malaria Reports 2015, uma estimativa de 214 milhões de casos de malária foram reportados em 2014 e consequentes 438 mil mortes, sendo que 88% ocorreram no continente africano. O combate a malária faz parte dos Objetivos de Desenvolvimento do Milênio (ODM) estabelecidos pela Organização das Nações Unidas (ONU), em 2000, e outros esforços internacionais como Roll Back Malaria pela Organização Mundial da Saúde. Em 2015, 33 países alcançaram o marco de zero casos de malária reportados, e um total de 57 dos 106 países com transmissão de malária reduziram os casos em mais 75% (Figura 1) (WHO, 2015). Figura 1: Taxa global de mortalidade por malária. Porcentagem da mudança na taxa de mortalidade por malária nos 106 países com transmissão dessa doença no período de 2010-2013 (WHO, 2014). Os agentes etiológicos da malária humana pertencem ao gênero Plasmodium, sendo Plas- modium vivax, P. falciparum, P. malariae, P. knowlesi (Cox-Singh et al., 2008; Oliveira- Ferreira et al., 2010) e as sub-espécies P. ovale curtisi e P. ovale wallikeri (Sutherland et al., 14 2010), que são transmitidos por mosquitos do gênero Anopheles (Manguin et al., 2008). P. falciparum é mais prevalente no continente africano, e é o responsável pela maioria das mortes causadas por malária (WHO, 2015). P. vivax tem uma distribuição geográfica maior que P. falciparum, explicado pelo seu desenvolvimento em temperaturas mais baixas, e sobrevivência em altas altitudes. Além disso, P. vivax tem um estágio dormente no fígado, forma hipnozoíta, que pode ativar meses depois da infecção inicial, causando um reaparecimento dos sintomas, permitindo assim sua manutenção mesmo na ausência do mosquito alado (WHO, 2015). Portanto, a ecologia natural da malária envolve parasitas plasmódios infectando suces- sivamente dois tipos de hospedeiros: humanos e fêmeas de mosquitos anofelinos. Inicialmente, nos humanos, o parasita cresce e multiplica-se nas células hepáticas. Após, ocorre a passagem para o ciclo sanguíneo, desencadeando o aparecimento de sintomas, que pode ser desde febre, sudorese, náusea até anemia grave, malária cerebral e complicações que levam a óbito (CDC). 1.1.1 Malária no Brasil No histórico de malária no Brasil, a década de 1960 foi registrada com menor número de casos (Tauil & Daniel-Ribeiro, 1998). Esse marco foi conquistado devido ao programa de erradicação do Ministério de Saúde do Brasil, baseado na aplicação de DDT nas paredes internas das casas, bem como no tratamento com cloroquina dos casos febris (Loiola et al., 2002). No entanto, em meados de 1970, a região Amazônica começou um processo acelerado e sem planejamento de ocupação, gerando migração expressiva à assentamentos rurais recém formados (Marques, 1987). Esse movimento migratório levou a um progressivo aumento no número de casos reportados no país, que cresceu de 52 mil em 1970 para 578 mil em 1989 (Tauil & Daniel-Ribeiro, 1998). Malária ainda é um importante problema de saúde pública no Brasil, concentrou 42% dos 427 mil casos de malária notificados nas Américas em 2013 (WHO, 2014). Embora o principal vetor, o mosquito An. darlingi, esteja presente em ampla parte do país, atualmente a incidência da malária no Brasil é quase exclusivamente restrita à região da Bacia Amazônica (Figura 2) (Tauil & Daniel-Ribeiro, 1998; WHO, 2014). O P. vivax é responsável pela maioria 15 dos casos registrados, seguido por casos por P. falciparum e P. malariae é raramente observado (Oliveira-Ferreira et al., 2010). Embora a malária por P. vivax cause pouca mortalidade, quando comparada à malária por P. falciparum, é responsável por grande parte da morbidade e por grandes encargos à prosperidade das comunidades endêmicas (Oliveira-Ferreira et al., 2010). Figura 2: Mapa de risco por município de infecção por malária. Gradiente em verde apresenta o risco de infecção por malária nos municípios do Brasil, em 2014. 1.2 Localidades do estudo O estado do Acre está inserido no grupo que compõe a Amazônia Legal. O seu histórico de urbanização é semelhante a outras regiões do bioma Amazônico, iniciado entre o final do século XIX e o começo do século XX com o ciclo da borracha, um forte extrativismo econômico, que atraiu intensamente mão de obra (Adas, 2006). Em 1977, o Projeto de Assentamento Dirigido de Pedro Peixoto (PAD Peixoto), do Governo Federal, direcionou a migração para a região causando a segunda grande colonização do Acre (Souza, 2002). Uma grande porção 16 da região oeste deste estado, que engloba os municípios de Acrelândia, Plácido de Castro, Senador Guiomar e a capital Rio Branco foi loteada e distribuída durante o PAD Peixoto. O objetivo era instalar pequenos agricultores em lotes com menos de 100 hectares por família em meio à mata nativa da região. O resultado foi a continuidade da exploração desde os próprios recursos da mata até o extrativismo mineral e a agropecuária, causando gradativas e constantes alterações do espaço físico. Duas das três localidades do presente estudo, Granada e Remansinho, são assentamentos rurais que surgiram por incentivo deste projeto governamental. Remansinho foi inaugurado em 2007 (Barbosa et al., 2014), enquanto que Granada começou em 1982 (Vitral et al., 2014). Essa última, consequentemente, tem sofrido a mais tempo o impacto antropogênico, caracte- rizado pelo maior número de casas e áreas desflorestadas. Ambos os assentamentos nascem na rodovia BR-364 e adentram a floresta em uma estrada não-pavimentada por cerca de 30 km em Granada, e 60 km em Remansinho (Figura 3). Na Amazônia brasileira, assentamentos rurais estão associados com a chamada “malária de fronteira” que explica a maior proporção de números de casos em assentamentos rurais recentes, quando comparados com assentamen- tos antigos e urbanizados (de Castro et al., 2006; da Silva-Nunes et al., 2012). Malária de fronteira é um fenômeno biológico, ecológico e sócio-demográfico operando em três escalas es- paciais (micro/individual, comunidade, e governamental). Em linhas gerais, a primeira escala está relacionada a abundância de An. darlingi encontrada nessa área devido às transformações ecológicas favoráveis (Barros & Honório, 2015); consequente alta exposição humana à picada do mosquito; e migração de pessoas vindas de áreas livres de malária, e que portanto, possuem baixa imunidade (Castro et al., 2006; Moutinho et al., 2011). A segunda está caracterizada com o baixo nível político organizacional nos assentamentos rurais, impossibilitando o bom gerenciamento clínico de saúde; e por fim, o desenvolvimento de assentamentos rurais, não devidamente planejados pelo governo, caracteriza a terceira escala que sustenta este fenômeno (Castro et al., 2006). Cruzeiro do Sul, cidade localizada no Alto Rio Juruá, é a segunda mais populosa no Estado do Acre, com 78.444 habitantes (IBGE, 2010). Em 2010, 21.397 casos autóctones de 17 Figura 3: Brasil e região das coletas. (A) Mapa do Brasil destacando os Estados do Acre e Amazonas e os três locais de coletas. (B) Imagem de satélite mostrando degradação florestal de Granada (vermelho) e Remansinho (verde). Os assentamentos rurais são conectados pela rodovia BR364 (amarelo) e Rio Iquiri (azul). malária foram notificados na cidade, totalizando 58,5% de todas as notificações do Acre (Braz et al., 2012). O trabalho de Costa et al. (2010), realizado em Cruzeiro do Sul, observou um expressivo aumento na transmissão de malária após a escavação de 179 novos poços para criação de peixes na região em 2005. Em Mâncio Lima, cidade próxima de Cruzeiro do Sul, Reis et al. (2015) encontraram associação direta entre a abundância de larvas de An. darlingi em tanques e prevalência de malária; por conseguinte, foi sugerido que os tanques de piscicultura foram modificações antropogênicas importantes para o aumento da transmissão na região. 1.3 Vetores da Malária Diferentemente da África, onde as regiões endêmicas para malária abrangem uma variedade de nichos ecológicos, ou seja, desde a savana até floresta úmida, nas Américas Central e do Sul, as 18 regiões endêmicas estão principalmente concentradas na região Amazônica na América do Sul e florestas tropical e subtropical na América Central (Conn & Ribolla, 2015). Essa diferença pode refletir na diversidade de vetores da malária nos dois continentes, enquanto que na África, Anopheles coluzzi, Anopheles gambiae, Anopheles arabiensis, e Anopheles funestus s.l. são os principais vetores, nas Américas, a diversidade é reduzida, com An. darlingi como vetor primário na América do Sul, e Anopheles albimanus na América Central (Molina-Cruz et al., 2004; Loaiza et al., 2008). No Brasil, Anopheles aquasalis e Anopheles albitarsis s.l. foram considerados como vetores secundários da malária (Forattini, 2002; Hiwat & Bretas, 2011). 1.3.1 Anopheles (Nyssorhynchus) darlingi Anopheles (Nyssorhynchus) darlingi (Figura 4) é o principal vetor de malária na região Amazô- nica (Deane et al., 1948; Conn & da Silva-Vasconcelos, 2002; Galardo et al., 2007, da Rocha et al., 2008). Essa espécie foi inicialmente descrita por Root in 1926 e posteriormente nomeada pelo líder em doenças tropicais, Dr. Samuel Taylor Darling (1872-1925). An. darlingi está contida no gênero Anopheles, juntamente com mais de 450 espécies, porém menos de 10% são reconhe- cidas como transmissoras de malária ao homem (Harbach, 2004; Maguin et al., 2008). Esse mosquito tem ampla distribuição geográfica, desde do sul do México até o norte da Argentina, do leste das cordilheiras dos Andes até a costa do oceano Atlântico (Figura 5) (Forattini, 1987; Sinka et al., 2012). Três fatores contribuem para o papel de An. darlingi na transmissão de malária: a susceptibilidade ao agente etiológico humano, o comportamento antropofílico ou oportunístico (Zimmerman et al., 2006; Sinka et al., 2012) e a rápida adaptação às modificações ambientais (Rozendaal, 1990; Vittor et al., 2006; Hiwat & Bretas, 2011). O ciclo de vida dos anofelinos é dividido em quatro fases: ovo, larva, pupa e adulto alado, sendo que as três primeiras são aquáticas. As larvas de An. darlingi foram encontradas tanto em criadouros naturais (lagos, margens de rios, córregos e áreas alagadas) quanto artificiais (tanques de piscicultura, valas e drenos), porém normalmente em áreas sombreadas, com vegetação flutuantes, pobres em sais e matéria orgânica (Forattini, 2002; Vittor et al., 2009). 19 Figura 4: Anopheles (Nyssorhynchus) darlingi. Imagem de uma fêmea do mosquito An. darlingi durante repasto sanguíneo. Uma vez que as fêmeas necessitam de alimentação sanguínea para a maturação dos ovos, tornam-se as responsáveis pela transmissão de doenças. O padrão da atividade hematofágica de An. darlingi mostrou-se variável quanto ao local e horário, podendo ser dentro (endofágico) ou fora das casas (exofágico) (Charlwood, 1996; da Silva-Vasconcelos et al., 2002; Zimmerman et al., 2013); e a taxa de densidade de picadas uni-bi ou trimodal no intervalo das 18 horas até as 6 horas (Elliot, 1972; Loureno-de-Oliveira et al., 1989; Voorham, 2002; Hiwat & Bretas, 2011). Além disso, houve evidência de variação no repouso desse vetor, podendo ser dentro das casas (endofilia) (Roberts et al., 1987; Quinones & Suarez, 1990) ou fora das casas (exofilia), todavia, o comportamento exofílico predominou em grande parte de sua distribuição (Zimmerman et al., 2004; Hiwat & Bretas, 2011). O controle do vetor é realizado com borrifação de inseticida no interior das casas, do inglês indoor residual spray (IRS), e uso de mosquiteiros impregnados com inseticida para dormir, do inglês insecticide-treated nets (ITN) (Lourenço-de-Oliveira et al., 1989), porém ne- nhum dos dois atingem populações exofílicas/exofágicas dos vetores (Hiwat & Bretas, 2011; da Silva-Nunes et al., 2012; Orjuela et al., 2015). Ademais, a efetividade no uso dos mosquiteiros depende do padrão local de picada dos vetores. Em uma pequena comunidade na Colômbia, onde An. darlingi é o principal vetor, sua atividade é principalmente endofágica e da 00:00 à 1:00 hora, horário viável para efetiva intervenção contra o mosquito (Jiménez et al., 2014). Por 20 Figura 5: Distribuição prevista de An. darlingi nas Américas. Mapa das Américas mostrando a distribuição de An. darlingi no continente em probabilidade (1: vermelho, 0: azul), os pontos pretos foram 318 ocorrências de registro desse espécie (Sinka et al., 2010). outro lado, em uma pequena cidade também na Colômbia, espécimes de An. darlingi, tanto endofágicos quanto exofágicos, foram coletados sobretudo no começo da noite e no começo da manhã, período no qual as pessoas não estão protegidas por mosquiteiros (Jiménez et al., 2012). A densidade populacional de An. darlingi e outros anofelinos neotropicais varia sazo- nalmente e, normalmente, apresenta picos no final da estação chuvosa (Sinka, 2010; Herrera et al., 2014). Além das mudanças climáticas, a degradação florestal, bem como outras altera- ções ambientais antropogênicas são os fatores que mais influenciam a dinâmica populacional de anofelinos. Áreas desmatadas e ecologicamente alteradas tiveram aumento da presença de larvas de An. darlingi e decorrente aumento de picadas em humanos pela forma adulta dessa espécie (Vittor et al., 2006; Vittor et al., 2009). Kamdem et al. (2012) mostraram rápida adaptação de linhagens divergentes de An. gambiae aos novos nichos criados por intervenções 21 humanas. Sendo assim, o estudo do comportamento e biologia do vetor, bem como sua disper- são, adaptação e interação com humanos é de grande importância para entomologia médica, a fim de melhor direcionar medidas para o controle vetorial. 1.4 Marcadores moleculares 1.4.1 Estudos anteriores com An. darlingi Os marcadores moleculares contribuem para a entendimento da heterogeneidade genética das espécies, elucidando importantes informações sobre o vetor e sua estrutura populacional (Lou- nibos & Conn, 2000). Estudos com An. darlingi revelaram de moderada a alta heterogeneidade genética em espécimes coletados no Brasil e em outros países da América do Sul. A análise de sequências da região ITS2 ribossomal apresentou aproximadamente 5% de divergência entre populações do mosquito das regiões norte e sul do Brasil (Malafronte et al., 1999), corro- borando o polimorfismo em cromossomos politênicos encontrado por Kreutzer et al. (1972). Baseados em seqüências do DNA mitocondrial (gene COI ) e microssatélites, estudos mostra- ram uma divisão genética significativa entre os mosquitos dessa espécie da América Central e do Sul (Mirabello & Conn 2006; Mirabello et al., 2008). Conn et al. (2006) demonstraram iso- lamento por distância de populações de An. darlingi do norte e do sul do rio Amazonas através da genotipagem de microssatélites. Nas populações da América do Sul, barreiras geográficas como o citado rio Amazonas e os Andes, por exemplo, dividiram as populações de An. dar- lingi em pelo menos quatro grupos, utilizando sequenciamento do gene COI (Pedro & Sallum, 2009). Por outro lado, em um nível microgeográfico, Gutiérrez et al. (2010) mostraram baixa diferenciação genética, analisando o gene COI e microssatélites, entre populações desse vetor no noroeste da Colômbia. Em uma observação a um nível climático, com diferente regime de chuvas, marcadores microssatélites mostraram subpopulações de An. darlingi moduladas sazonalmente ao longo do rio Madeira, em Rondônia, Brasil (Angella et al., 2014). A grande distribuição geográfica, a diversidade morfológica e comportamental, junto a heterogeneidade genética são de grande importância epidemiológica, uma vez que podem refletir na capacidade vetorial das populações de An. darlingi. Ademais, conduz a hipótese da 22 existência de um complexo de espécies ao invés de uma espécie monofilética (Charlwood, 1996). Manguin et al. (1999) rejeitaram essa hipótese com base em resultados de um estudo com diversos marcadores (morfologia, isoenzimas, ITS2 e RAPD), porém Emerson et al. (2015) detectaram três clusters genéticos principais em An. darlingi, os quais foram sugeridos como três espécies putativas. 1.4.2 Técnicas utilizadas Microssatélites Os microssatélites, do inglês simple sequences repeats (SSRs), são marca- dores moleculares utilizados em uma variedade de estudos genéticos populacionais (Goldstein et al., 1999; Ndo et al., 2010; Ma et al., 2011), em sistemática (Feldman et al., 1997; Sun et al., 2009) e no mapeamento genômico (Weissenbach, 1992; Solignac et al., 2007; Jaari et al., 2009). Esses marcadores são regiões do genoma dos organismos eucariontes que possuem repetições de 2 a 6 nucleotídeos em cadeia. As repetições estão distribuídas aleatoriamente no genoma em uma densidade de aproximadamente 1 microssatélite a cada 10 a 15 mil pares de bases, dependendo da espécie (Tautz, 1989). Tem alto grau polimórfico em relação ao número de repetições (taxa de mutação estimada em 10�2 a 10�3 por locus por gameta por geração) po- dendo influenciar na expressão e funcionalidade do gene (Nelson & Warren, 1993). No campo de entomologia médica, os microssatélites vêm sendo utilizados para o estudo populacional de vários insetos. Dupla digestão RADseq Algumas abordagens moleculares tem utilizado o sequenciamento de pequenos fragmentos ancorados aos sítios de enzima de restrição. A técnica chamada “Sequenciamento do DNA Associado ao Sítio de Restrição” (RADseq), do inglês Restriction Site Associated DNA Sequencing, é uma delas, capaz de identificar milhares de polimorfismos de única base (SNP), aleatoriamente distribuídos no genoma, através do sequenciamento pela plataforma Illumina (Davey & Blaxter, 2010). A técnica utiliza fragmentação específica por uma enzima de restrição, assim RADseq analisa uma sub-amostragem do genoma total da amostra, permitindo não somente a genotipagem e descoberta de SNPs, mas também análises mais complexas como genética quantitativa e estudos filogenéticos (Davey & Blaxter, 2010; 23 Emerson et al., 2010; Hohenlohe et al., 2010). No presente estudo, foi utilizada a “Dupla Digestão RADseq”, uma adaptação de RADseq descrita por Peterson et al. (2012) (Figura 6). Figura 6: RADseq versus Dupla Digestão RADseq. (A) Restriction-Site Associated DNA Sequencing (RADseq) tradicional usa uma única enzima de restrição e fragmentação aleatória para gerar uma biblioteca de representação reduzida de todo o genoma nas regiões adjacentes ao sítio de restrição (segmentos vermelhos). (B) Dupla Digestão RADseq (ddRADseq), por outro lado, usa duas enzimas de restrição para digerir e precisa seleção de tamanho, exclui regiões muito próximas e muito distantes, a biblioteca portanto, consiste somente em fragmentos próximos ao sítio alvo (segmentos vermelhos). A representação da biblioteca nesse caso tende a ser correlacionada entre os indivíduos (barras amarelas e verdes). Adaptado de Peterson et al., (2012). Nessa abordagem a digestão do DNA é feita com duas enzimas de restrição, uma com corte frequente e outra rara, dispensando assim os passos de fragmentação aleatória e end repair necessários na técnica original. Essa técnica aumenta a eficiência e robustez enquanto diminui custo, além de necessitar de apenas 100ng ou menos de DNA genômico inicial (Peterson et al., 2012). O passo mais importante é a escolha das enzimas utilizadas para digerir o genoma, pois isso determinará o tamanho dos fragmentos, a porcentagem do genoma a ser estudado, e consequentemente, o número de marcadores SNPs. 24 2 Objetivos O estudo visou analisar a heterogeneidade genética ligada a distribuição geográfica de popula- ções de An. darlingi contrastando áreas rurais e urbana na Amazônia brasileira, bem como a dinâmica sazonal do vetor e polimorfismos genéticos relacionados aos diferentes comportamen- tos hematofágicos em populações simpátricas. Para tanto, duas metodologias de genotipagem foram utilizadas: marcadores microssatélites e polimorfismos de base única (SNPs). Além disso, foi testado o grau de discriminação genética a nível microgeográfico dessas duas meto- dologias. 25 3 Materiais e Métodos 3.1 Local do Estudo O estudo foi realizado em três localidades, dois assentamentos rurais, Granada (S9°47’; W67°05’) em Acrelândia, Acre e Remansinho (S9°31’; W66°33’) em Lábrea, Amazonas, e a cidade de Cruzeiro do Sul (S7°37’; W72°40’) também Estado do Acre (Figura 3). 3.2 Coleta de Anofelinos Foram realizadas coletadas intradomiciliar e extradomiciliar (10 metros de distâncias das ca- sas) por captura sob atração humana (grupo de pesquisa do laboratório Pangene dirigido pelo Prof. Dr. Paulo Ribolla) nos assentamentos rurais em Abril de 2011, Março, Maio e Novem- bro de 2012. Em Cruzeiro do Sul, coletas extradomiciliares foram realizados com o auxílio de armadilhas Shanon de captura com atração humana protegida, em Março de 2013, pelo grupo da Dr. Marinete Póvoa (Instituto Evandro Chagas, Belém, Pará). Todos os espécimes coletados foram morfologicamente identificados e somente os espécimes de An. darlingi foram utilizados nas análises seguintes (Consoli & Oliveira, 1994). 3.3 Preparação do DNA Duas metodologias foram utilizadas para extração e quantificação do DNA. O protocolo que utiliza a resina Chelex100® Molecular Biology Grade Resin (Bio-Rad Laboratories), a 5% e a quantificação pelo espectrofotômetro NanoDrop® (ND-1000), foram aplicados às amostras submetidas posteriormente a genotipagem de microssatélites. Já as amostras submetidas a genotipagem de SNPs foram extraídas seguindo o protocolo do kit ReliaPrep™ Blood gDNA Miniprep System (Promega) e quantificadas pelo fluorômetro Qubit® 2.0 (Life Technologies). 3.4 Genotipagem de Microssatélites O DNA de cada mosquito foi amplificado por reação de polimerização em cadeia (PCR) com a utilização dos oligonucleotídeos específicos para cada microssatélite ligados à marcadores 26 Tabela 1: Sequência dos primers de nove loci microssatélites padronizados para An. darlingi. fluorescentes nos primers reverse FAM, NED e VIC (Applied Biosystems) (Conn et al., 2001; Angella et al., 2014) (Tabela 1). Cada reação de PCR foi realizada num volume total de 20ml contendo GoTaq® Colorless Master Mix, 2X; 0,5mM de cada oligonucleotídeo e 5ng de DNA genômico. As condições da PCR para ambas etapas foram: desnaturação inicial a 94°C por 5min seguida por 30 ciclos a 94°C por 30s, 52-57°C (dependendo do locus) por 30s e 72°C por 35s e um elongamento final a 72°C por 5-10min. Todas as reações tiveram a amplificação confirmadas no gel de agarose (1,5%) corado com GelRed™ (Uniscience), submetidas a corrida de eletroforese a 90V por 50 minutos juntamente com um ladder de peso molecular 100 pb (Promega). Os fragmentos amplificados foram organizados em três grupos multiplex, a fim de otimi- zar a técnica, e separados por eletroforese capilar em sequenciadores automáticos (ABI 3500) e os seus tamanhos analisados pelo software GeneMarker (SoftGenetics, USA). Uma base de dados em Excel® (Microsoft) dos genótipos por indivíduo e locus foi organizada, contendo o tamanho dos alelos em pares de bases. 27 3.5 Genotipagem de SNP 3.5.1 Preparação das bibliotecas Para a genotipagem de SNPs foi utilizada a técnica de sequenciamento do DNA associado a dupla digestão por enzimas de restrição (ddRADseq). Inicialmente, um total de 200ng de DNA genômico foi individualmente digerido com a combinação das enzimas de restrição EcoRI (Promega) e HpaII (Promega) em um volume final de 40ml, o qual foi purificado com as beads AMPure® XP (Agencourt®), segundo o protocolo do fabricante. Um par de adaptadores (P1 e P2) foi desenhado incluindo a sequência complementar Nextera® Index Primers (Illumina), a fim de realizar a indexação com Nextera® DNA Sample Preparation Kit (Illumina) (Tabela 2). Quantidades apropriadas dos adaptadores P1 (0.3mM) e P2 (4.8mM) foram ligados com o DNA digerido pela enzima T4 DNA Ligase (Promega). Tabela 2: Sequência dos primers para ddRADseq. Depois de outra purificação com AMPure® XP , os fragmentos de DNA foram sele- cionados em um intervalo de 350-400 pares de base em gel agarose e purificados novamente. A amplificação por PCR pelo Nextera® Indexing Kit foi feito para gerar as bibliotecas de sequenciamento Illumina, segundo a seguinte condição de ciclagem: denaturação inicial a 72°C por 3min e a 95°C por 30s, seguido por 16 ciclos a 95°C por 10s, anelamento a 55°C por 30s, elongação a 72°C por 30s, e uma extensão final a 72°C por 5 minutos, e então o produto foi 28 purificado uma última vez. 3.5.2 Sequenciamento das bibliotecas Todas as amostras foram individualmente quantificadas com KAPA qPCR Library Quantifi- cation Kit (Biotik@) e combinadas com razões equimolares para compor a biblioteca final. A biblioteca foi quantificada com o mesmo método, depois normalizada e desnaturada, e fi- nalmente carregada em um cartucho de reagentes Illumina. Quatro bibliotecas, 3 com 24 amostras e uma com 15 amostras, foram sequenciadas por ambas extremidades em 150-ciclos em um Miseq Desktop Sequencer (Departamento de Genética, Universidade Estadual de São Paulo), e outras 3 bibliotecas, 2 com 96 amostras e uma com 90 amostras, foram sequenciadas nas mesmas especificações, porém em um Hiseq 2500 (Genomics and Bioinformatics Core, Universidade Estadual de Nova York, em Buffalo), portanto, um total de 369 amostras foram sequenciadas. 3.5.3 Processamento dos dados Stacks (versão 1) pipeline (Catchen et al. 2013) foi usado para identificação de SNP loci (Fi- gura 7). O primeiro programa utilizado do Stacks foi process_radtags, responsável por remover sequências errôneas dos dados brutos do Illumina, erros tais na identificação das amostras (bar- code), nos sítios de restrição das enzimas e/ou baixa qualidade das bases. Depois de filtradas, todas as sequências foram alinhadas pelo programa Bowtie2 (Langmead & Salzberg, 2012) ao genoma de referência de An. darlingi (Marinotti et al., 2013), a fim de selecionar somente as sequências oriundas dessa espécie. Os arquivos em formato SAM foram então executados com o programa ref_map.pl, o qual contem outros programas tais como o pstacks, cstacks e sstacks. O primeiro programa combinou as sequências, construiu loci considerando uma profundidade mínima de 5 cópias, e definiu os SNPs de cada indivíduo; já o programa cstacks agrupou os dados de todos os indivíduos em um catálogo único. O programa sstacks comparou cada indivíduo com o catálogo afim de identificar SNPs entre eles. Baseados nos dados obtidos, um passo de correções 29 Figura 7: Fluxograma do processamento dos dados de SNPs. (A) Preparação e sequenciamento das bibliotecas, (B) Filtragem, alinhamento e processamento das sequências. (C) Seleção dos SNPs com o programa populations. genotípicas e haplotípicas se fez necessário, feito pelo programa rxstacks. Os programas cstacks e sstacks foram executados novamente, e finalmente o programa populations foi executado, o qual identificou os SNPs presentes em um dado conjunto de indivíduos. Inicialmente, todos os indivíduos foram considerados como uma única população, a fim de evitar viés populacional na seleção dos SNPs. Além disso, os marcadores deveriam estar presente em pelo menos 50% do total de indivíduos, com a finalidade de evitar viés por falta de dados. 3.6 Análises dos dados As análises foram conduzidas em três perspectivas diferentes: 1) comparação das metodologias de genotipagem (microssatélites e SNPs); 2) geográfica e sazonal, e 3) relacionada ao compor- tamento hematofágico do vetor, quanto ao local (intra e peridomicílio) e horário (crepúsculo e amanhecer). 30 3.6.1 Análises com microssatélites Frequências alélicas As frequências alélicas foram obtidas por contagem direta através do pacote de programa Arlequin v.3.1 (Excoffier et al., 2005). Este cálculo é resultado da soma do número de indivíduos heterozigotos para um determinado alelo com duas vezes o número de indivíduos homozigotos, e divisão do resultado pelo dobro do número total de indivíduos. Diversidade alélica e riqueza alélica A diversidade alélica (A) é o número total de alelos presentes numa amostra para um dado locus. A riqueza alélica (Rs) é uma medida de diversidade alélica ajustada pelo tamanho da amostra de menor dimensão. Esta medida permite uniformizar as amostras em estudo de modo a torná-las comparáveis. Estes parâmetros foram determinados através do programa Fstat versão 2.9.3.2 (Goudet, 1995). Testes de heterozigosidade A heterozigosidade observada (Ho) é a proporção de genóti- pos heterozigóticos encontrada numa amostra de n indivíduos. A heterozigosidade esperada (He) é a proporção esperada de genótipos heterozigóticos numa população de n indivíduos. Esse parâmetro baseia-se nas frequências alélicas num dado locus, assumindo o princípio de Hardy-Weinberg (Nei, 1978). Ambos parâmetros foram determinados com auxílio do pro- grama Arlequin. Testes de heterozigosidade (Cornuet & Luikart, 1996) foram realizados para detectar desvios do equilíbrio de deriva mutacional (MDE). Estes testes comparam duas esti- mativas de heterozigosidade esperada, uma baseada nas frequências alélicas (He), assumindo as proporções de Hardy-Weinberg, e outra baseada no número de alelos e tamanho amostral (Heq), assumindo o MDE. Se a população experimenta um efeito de gargalo, os alelos raros são rapidamente perdidos e com isso o número de alelos diminuirá mais rápido do que a frequência alélica, ou seja, He>Heq, enquanto que o contrário (He