UNIVERSIDADE ESTADUAL PAULISTA - UNESP CÂMPUS DE JABOTICABAL INTERAÇÃO GENÓTIPO X AMBIENTE, ADAPTABILIDADE E ESTABILIDADE EM GENÓTIPOS DE CANA-DE-AÇÚCAR Flávio Cese Arantes Engenheiro Agrônomo 2013 UNIVERSIDADE ESTADUAL PAULISTA - UNESP CÂMPUS DE JABOTICABAL INTERAÇÃO GENÓTIPO X AMBIENTE, ADAPTABILIDADE E ESTABILIDADE EM GENÓTIPOS DE CANA-DE-AÇÚCAR Flávio Cese Arantes Orientador: Prof. Dr. Dilermando Perecin Coorientador: Dr. Marcos Guimarães de Andrade Landell Tese apresentada à Faculdade de Ciências Agrárias e Veterinárias - Unesp, Câmpus de Jaboticabal, como parte das exigências para a obtenção de título de Doutor em Agronomia (Genética e Melhoramento de Plantas). 2013 Arantes, Flávio Cese A662i Interação genótipo x ambiente, adaptabilidade e estabilidade em genótipos de cana-de-açúcar / Flávio Cese Arantes. – – Jaboticabal, 2013 xii, 94 f. ; 28 cm Tese - Universidade Estadual Paulista, Faculdade de Ciências Agrárias e Veterinárias, 2013 Orientador: Dilermando Perecin Coorientador: Marcos Guimarães de Andrade Landell Banca examinadora: Euclides Braga Malheiros, Rinaldo Cesar de Paula, Maximiliano Salles Scarpari, Ivana Marino Bárbaro Bibliografia 1. Modelos Mistos 2. Bayesiana 3. MHPRVG I. Título. II. Jaboticabal - Faculdade de Ciências Agrárias e Veterinárias. CDU 631.52:633.61 Ficha catalográfica elaborada pela Seção Técnica de Aquisição e Tratamento da Informação – Serviço Técnico de Biblioteca e Documentação - UNESP, Câmpus de Jaboticabal. IV V DADOS CURRICULARES DO AUTOR Flávio Cese Arantes, nascido em Pereira Barreto, Estado de São Paulo, Brasil, no dia 28 de janeiro de 1984. Tornou-se Engenheiro Agrônomo pela Universidade Estadual Paulista (UNESP), Câmpus de Ilha Solteira, em 2008, onde também tornou-se Mestre na área de Agronomia (Genética e Melhoramento de Plantas) em 2010. Realizou, sob financiamento da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, parte do seu Doutorado na Universidade de Wisconsin, Estados Unidos da América, durante Janeiro a Agosto de 2012, em Novembro de 2013 foi contratado pela Bayer S/A como Coordenador de Pesquisa e em Dezembro de 2013 tornou-se Doutor em Agronomia (Genética e Melhoramento de Plantas) pela UNESP, Câmpus de Jaboticabal. VI Dedico esta obra aos meus Avós José Cese (In Memoriam) e Aparecida Alves Cese Aos meus Pais Altino Arantes Junior e Genifer Aparecida Cese e Aos meus Irmãos André e Fabiano .:Numen Lumen:. VII Agradecimentos Agradeço a Deus, tudo e a Todos a cada pôr do sol. Porém gostaria de deixar tais agradecimentos por escrito nesta Tese. Agradeço: A Deus, por sempre iluminar o meu caminho. Ao meu querido Avô, José Cese (In Memoriam), que me ensinou o que é honestidade, amor e dedicação por ser o exemplo disso tudo. Minha querida Vó Cida, sempre dedicada aos netos. Aos meus Pais, Altino e Genifer, por serem o princípio de tudo aquilo que eu sou e que me tornei, pela vida, pelos ensinamentos e por infinitos motivos indescritíveis. Aos meus irmãos, André e Fabiano, por serem os parceiros da vida, mais do que amigos, o Elo de minha jornada. Ao Professor Dilermando Perecin pela serenidade, sabedoria na orientação e exemplo de pessoa e profissional para mim. Ao Pesquisador Dr. Marcos Landell pela coorientação da realização deste trabalho. Aos Professores Drs. do Depto. Ciências Exatas da UNESP/FCAV, em especial: Antônio S. Ferraudo, Danísio P. Munari e João A. de Oliveira. Aos Professores(as) Doutores(as) membros da banca do exame de qualificação: Gustavo Môro, Luciana Pinto, Rinaldo de Paula e Sandra Unêda-Trevisoli. Aos Professores(as) Doutores(as) membros da comissão examinadora da Tese: Euclides Malheiros, Ivana Bárbaro, Maximiliano Scarpari e Rinaldo de Paula. Ao Professor Guilherme Rosa pela oportunidade de realização de parte deste trabalho nos EUA. Aos amigos adquiridos ao longo dessa difícil jornada de Pós graduação: Guilherme Ferraudo, Karen Alvim, Mauro Xavier, Paolo Zancanaro, Rafael Finholdt e Sybelli Espindola. Aos Amigos(as): Karen Zancanaro, Leo Seno, Mirelle, Carol, Kelly, Salvador, Guilherme, Val, Marcão, Natália, Camilitcha, Giovanna, Priscila, Tati, Diego, Helio e Deise Junqueira, João Flávio, Danillo. À Minha querida amiga e companheira, pelo amor, carinho e serenidade: Bárbara Bonfim. An special gratefulness for those friends found along the way abroad: Afshin Samia, Ana Ruth, Andrea and Rafael Zortea, Axel Madera, Bruno Valente, Chuanyu Sun, Diogo Garcia, Fabiane Silva, Fabio Pinaff, Fernanda Lopes, Francisco Peñagaricano (Punch'o), German Muttoni and Rosina, Giovanni Baez, Huihui Duan, Leane Oliveira, Leon, Llibertat Tussell, Marcos Lagrotta, Paulino Perez, Rocha, Rocio Gambra and Cris, Saleh Shahinfar, Stella Salvo, Vivian Felipe, Yao Chen and YaoDong. E a Todos aqueles que contribuíram direta ou indiretamente para a construção do meu ser e da confecção desta Tese. Agradeço-Os. VIII "Tudo passa... Mas a Nobreza uma vez que adquirida ao longo da vida torna-se intrínseca à Alma." O Autor IX SUMÁRIO RESUMO.............................................................................................................................XI ABSTRACT........................................................................................................................XII CAPÍTULO 1 - Considerações gerais ............................................................................... 1 1. INTRODUÇÃO ................................................................................................................ 1 2. REVISÃO DE LITERATURA ........................................................................................... 2 2.1. A cana-de-açúcar (Saccharum spp.) ..................................................................................................... 2 2.2. Modelos Mistos: efeitos fixos e aleatórios, Máxima Verossimilhança Restrita (REML) e Melhor Predição Linear não-viesada (BLUP) ............................................................................................................ 3 2.2.1. Efeitos fixos e aleatórios ................................................................................................................. 3 2.2.2. Estimação de componentes de variância via Máxima Verossimilhança Restrita (REML) ............. 4 2.2.3. Melhor Predição Linear não-viesada (BLUP) ................................................................................. 7 2.3. Inferência Bayesiana de componentes de variância ........................................................................... 12 2.3.1. Amostrador de Gibbs .................................................................................................................... 14 2.4. Interação genótipo x ambiente, adaptabilidade e estabilidade ............................................................ 16 2.4.1. Regressão Linear Fenotípica Conjunta (EBERHART; RUSSELL, 1966) .................................... 18 2.4.2. Média Harmônica da Performance Relativa do Valor Genotípico (RESENDE, 2004) ................. 21 2.4.3. Norma de reação com covariáveis desconhecidas (SU et al., 2006) ........................................... 23 3.REFERÊNCIAS BIBLIOGRÁFICAS .............................................................................. 26 CAPÍTULO 2 - MATERIAL E MÉTODOS .......................................................................... 36 1. MATERIAL .................................................................................................................... 36 2. MÉTODOS ..................................................................................................................... 36 2.1. Regressão Linear Fenotípica Conjunta (EBERHART; RUSSELL, 1966) ............................................ 36 2.2. Média Harmônica da Performance Relativa do Valor Genotípico (RESENDE, 2004) ........................ 38 2.3. Norma de reação com covariáveis desconhecidas (SU et al., 2006) .................................................. 43 3. REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................. 43 CAPÍTULO 3 - Reaction norm with unknown covariates and Eberhart-Russell models to sugarcane's multi-environment trial .......................................................................... 44 ABSTRACT ....................................................................................................................... 44 1. INTRODUCTION ........................................................................................................... 44 2. MATERIAL AND METHODS ......................................................................................... 46 2.1. Sugar cane data set ............................................................................................................................. 46 2.2. Linear reaction norm model with unknown covariates ......................................................................... 47 2.3. Prior Specifications ............................................................................................................................... 47 2.4. Bayesian Inference ............................................................................................................................... 48 2.5. Variance components and Genetic parameters ................................................................................... 48 2.6. Eberhart-Russell Regression Analysis ................................................................................................. 49 2.7. Reaction norm and Breeding ............................................................................................................... 49 3. RESULTS AND DISCUSSION ...................................................................................... 50 4. CONCLUSIONS ............................................................................................................ 62 5. ACKNOWLEDGMENTS ................................................................................................ 63 6. REFERENCES .............................................................................................................. 63 X CAPÍTULO 4 - Média harmônica da performance relativa do valor genotípico em ensaios de múltiplos ambientes na cultura da cana-de-açúcar .................................. 66 1. INTRODUÇÃO .............................................................................................................. 66 2. MATERIAL E MÉTODOS .............................................................................................. 67 3. RESULTADOS E DISCUSSÕES ................................................................................... 67 3.1. Estimativa de componentes de variância, de parâmetros genéticos e Média Harmônica da Performance Relativa do Valor Genotípico (MHPRVG) via BLUP ............................................................. 67 3.1.1. Estimativa de componentes de variância e de parâmetros genéticos ......................................... 67 3.1.2. Seleção conjunta para produtividade, estabilidade e adaptabilidade via MHPRVG .................... 69 4. CONCLUSÕES ............................................................................................................. 75 5. REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................. 76 CAPÍTULO 5 - Considerações finais e conclusões ....................................................... 76 1. CONSIDERAÇÕES FINAIS .......................................................................................... 77 2. CONCLUSÕES ............................................................................................................. 83 3. REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................. 84 APÊNDICE ........................................................................................................................ 85 1. Diagnósticos de convergência ................................................................................................................ 86 XI INTERAÇÃO GENÓTIPO X AMBIENTE, ADAPTABILIDADE E ESTABILIDADE EM GENÓTIPOS DE CANA-DE-AÇÚCAR RESUMO - A cana-de-açúcar (Saccharum spp.) é a cultura mais aplicada para a produção de açúcar tanto para consumo interno quanto para exportação, além da produção de etanol e biomassa. A área de cultivo vem crescendo expressivamente, fato que leva melhoristas a buscar genótipos mais produtivos às diferentes áreas de plantio. Experimentos em multi ambientes são comumente conduzidos em programas de melhoramento de plantas principalmente para avaliação de genótipos potenciais para produção. Este estudo incluiu 16 genótipos de cana-de-açúcar em 14 locais e avaliados por quatro anos, ou seja, quatro cortes (cana planta, primeira, segunda e terceira soca). O objetivo foi investigar a adaptabilidade e estabilidade dos genótipos de cana-de-açúcar para o atributo Tonelada de Pol por Hectare (TPH) em experimentos multi ambientais a partir de três metodologias estatísticas: Regressão linear fenotípica conjunta (E-R), Norma de reação (NR) e Média harmônica da performance relativa do valor genotípico (MHPRVG). Os valores da herdabilidade média genotípica estimados via MHPRVG apresentaram-se altos, o que leva a altas acurácias na seleção genotípica (superiores a 90%). Os genótipos IACSP963076, IACSP963048 e IACSP985024, primeiro corte, IACSP963048, IACSP963076, IACSP962073 e IACSP985024, segundo corte, IACSP962073, IACSP962008 e IACSP963076, terceiro corte e IACSP963076, IACSP985024, IACSP962073 e IACSP962008, quarto corte, foram os selecionados quando se considera os atributos de estabilidade, adaptabilidade e produtividade (TPH), simultaneamente e, portanto, são os genótipos recomendados para o plantio nesta macro região estudada quando analisadas via MHPRVG. Em termos de valores médios, os genótipos recomendados pela seleção simultânea baseada na MHPRVG são os genótipos IACSP963076, IACSP962073, IACSP985024 e IACSP962008, alcançando um valor médio de 2,8% acima da média geral dos quatro cortes. A porcentagem coincidente de ordenamento a partir da E-R e NR foi de 31, 44, 50 e 56% para o primeiro (cana planta), segundo, terceiro e quarto corte, respectivamente. Ambas E-R e NR assistem a alocação de genótipos nos ambientes avaliados para plantio e na estabilização de objetivos de melhoramento. A herdabilidade para o atributo TPH estimada via NR é dependente do gradiente ambiental e aumenta conforme os cortes. Todos os métodos analisados nesta tese obtiveram bons resultados e podem ser utilizados na avaliação da interação genótipo x ambiente (GxA), adaptabilidade e estabilidade; o método E-R pode ser utilizado a princípio para uma visão geral do comportamento dos genótipos nos ambientes visto que fornece estimativas de coeficientes de regressão de valores fenotípicos; os métodos E-R e NR proporcionam uma melhor visualização gráfica da interação GxA, adaptabilidade e estabilidade; os métodos NR e MHPRVG possibilitam o uso de dados desbalanceados, utilizam o fator genótipo como aleatório, o que proporciona a estimação do valor genotípico do indivíduo e aumento na acurácia de seleção genotípica; a estimativa dos Índices Ambientais ( ) foram semelhantes para as metodologias de E-R e NR, para este conjunto de dados analisados; o método NR estima coeficientes de regressão que predizem valores genotípicos, o que permite aos melhoristas uma melhor exploração do valor genotípico do indivíduo no programa de melhoramento genético. Palavras-chave: melhoramento genético de cana-de-açúcar, MHPRVG, Norma de reação, REML/BLUP XII GENOTYPE X ENVIRONMENT INTERACTION, ADAPTABILITY AND STABILITY IN SUGARCANE GENOTYPES ABSTRACT - The sugarcane (Saccharum spp.) is the most applied crop in the sugar yielding as much as internal consumption as exportation, besides its application in yielding alcohol and biomass production. The crop area has been increased expressively leading breeders to search more yielding genotypes to the different planted areas. Multi- environment trials are commonly conducted in plant breeding programs to evaluate potential genotypes mainly to yield. This study included 16 sugarcane genotypes at 14 locations evaluated in four years, that is, four harvests (sugarcane plant, first, second and third ratoon). The objective was to investigate the sugarcane's genotype adaptability and stability to Ton of Pol per Hectare (TPH) attribute in multi-environments trials from three statistical methodologies: Joint phenotypic linear regression (E-R), Reaction norm (NR) and Harmonic average performance relative breeding values (MHPRVG). The estimated genotypic average heritabilities values via MHPRVG showed themselves as high, what lead to high accuracy in the genotypic selection ( higher than 90%). The genotypes IACSP963076, IACSP963048 and IACSP985024, first harvest, IACSP963048, IACSP963076, IACSP962073 and IACSP985024, second harvest, IACSP962073, IACSP962008 and IACSP963076, third harvest and IACSP963076, IACSP985024, IACSP962073 and IACSP962008, fourth harvest, were the selected when one considers simultaneously the stability, adaptability and productivity (TPH) attributes and thereby them are the recommended genotypes to be planted in this studied macro region when analyzed via MHPRVG. In a mean expression, the recommended genotypes by simultaneous selection based in MHPRVG are the IACSP963076, IACSP962073, IACSP985024 and IACSP962008 genotypes, reaching a average value of 2.8% higher than the four harvests overall mean. The percentage of selection ranking from both approach was 31, 44, 50 and 56% at the first (sugarcane plant), second, third and fourth harvest respectively. Both methodologies assist the allocation of the genotypes in the environments available for planting and to establish breeding objectives. In sugarcane, the TPH attribute heritability is dependent of environmental gradient and increase along the harvests. All the analyzed methods in this theses got good results e may be used in the genotypic x environment interaction (GxE) evaluation, adaptability and stability; the E-R method may be used at the beginning for the general view of the genotypes behavior along the environments once it provides estimations of the phenotypic slopes; both E-R and NR provide a better graphic view of the GxE interaction, adaptability and stability; the NR and MHPRVG methods provide the use of unbalanced data, assuming the genotypic factor as random, what leads the individual genotypic value estimation and genotypic selection accuracy increasing. The environmental index ( ) estimation had a resemblance to E-R and NR methodologies to this analyzed data set; the NR method estimates slopes that predict the genotypic values allowing the breeders a better exploration of the individual genotypic value in a breeding program. Keywords: MHPRVG, Reaction norm, REML/BLUP, Sugarcane breeding, 1 CAPÍTULO 1 - Considerações gerais 1. INTRODUÇÃO A importância socioeconômica do cultivo da cana-de-açúcar (Saccharum spp.) é um fato observado desde os tempos coloniais da implantação desta cultura no Brasil. É a cultura mais utilizada na produção de açúcar para o consumo interno e produto de exportação, além de ser utilizada para a produção de álcool e biomassa. A cana-de- açúcar também tem demonstrado importância estratégica e ambiental, pela produção do biocombustível como fonte renovável de energia, menos poluente que combustíveis derivados do petróleo, e sua captação de carbono pela alta produção de biomassa. A área cultivada de cana-de-açúcar vem crescendo significativamente no Brasil, o que leva os melhoristas a buscarem genótipos que exibam maiores produtividades nas diferentes regiões de plantio. A produção de cana-de-açúcar se concentra nas regiões Centro-Sul (RS, SC, PR, SP, RJ, MG, ES, MS, MT, GO e DF) e Norte-Nordeste do Brasil (BA, SE, AL, PE, PB, RN, CE, PI, MA, TO, PA, AP, RO, AM, AC e RR) e totaliza 588.478 mil toneladas de cana-de- açúcar na safra de 2012/2013. Segundo informações do Instituto Brasileiro de Geografia e Estatística (IBGE) a área plantada com a cultura da cana-de-açúcar no ano de 2011 foi de 9,6 milhões de hectares (UNICA, 2013). Os programas de melhoramento genético visam suprir as necessidades crescentes desse mercado, a partir do desenvolvimento de novas variedades de cana-de-açúcar mais produtivas, com maior teor de sacarose e precocidade, resistentes a pragas, doenças e estresses abióticos (MATSUOKA et al., 2005). Visto a grande extensão das áreas de produção de cana-de-açúcar e a demanda por genótipos mais produtivos e também a existência de fortes interações dos genótipos com os ambientes em que são plantados, quando se trata de características quantitativas como a produção, por exemplo, é importante, em programas de melhoramento, que se utilize métodos que explorem e capitalizem a interação genótipo por ambiente (GxA) para maximizar a produção. A resposta diferenciada dos genótipos nos vários ambientes, conhecida como interação de genótipos com ambientes – GxA (EBERHART; RUSSELL, 1966) é um fenômeno natural que faz parte da evolução das espécies. Seus efeitos permitem o 2 aparecimento de genótipos estáveis e aptos a ambientes específicos, assim como, de comportamento geral, aptos a vários ambientes. Segundo Vencovsky e Barriga (1992), a interação GxA é de natureza genética, mas não no sentido usual, e sim em decorrência de instabilidades das manifestações genotípicas entre ambientes. Dessa forma, o comportamento dos genótipos em relação ao ambiente, tem merecido especial atenção por parte dos melhoristas, pois interfere nos processos de seleção. Por essa razão, torna-se importante o conhecimento preciso dessas estimativas, bem como sua utilização na determinação da estabilidade fenotípica dos diferentes genótipos. A partir do fenômeno da interação GxA nos programas de melhoramento genético de plantas é possível executar uma seleção de genótipos com adaptação ampla ou específica (nesta tese, adaptação específica é tratada como adaptação preferencial), escolher locais de seleção, identificar o nível de estresse nos ambientes escolhidos, para as fases iniciais da seleção, e determinar o número ideal de ambientes e de genótipos a serem avaliados em cada fase da seleção (FOX et al., 1997). A interação GxA constitui-se num dos maiores desafios dos programas de melhoramento de qualquer espécie, seja na fase de seleção ou na de recomendação de variedades. Entre as alternativas para minimizar esse problema está a escolha de genótipos com ampla adaptação e boa estabilidade (CRUZ; CARNEIRO, 2003). O objetivo deste trabalho foi estimar parâmetros estatísticos e genéticos a partir de diferentes métodos, caracterização e seleção de genótipos de cana-de-açúcar quanto à produtividade, adaptabilidade e estabilidade em ensaios multi ambientais. 2. REVISÃO DE LITERATURA 2.1. A cana-de-açúcar (Saccharum spp.) A cana-de-açúcar é uma espécie vegetal de grande importância para a agricultura brasileira e mundial. Segundo Daniels and Roach (1987), trata-se de uma espécie alógama, da família Poaceae) tribo Andropogoneae, gênero Saccharum. Dentro do gênero Saccharum, ocorrem principalmente seis espécies: S. officinarum L. (2n = 80), S. robustum Brandes e Jeswiet ex Grassl (2n = 60-205), S. barberi Jeswiet (2n = 81-124), S. sinense Roxb. (2n = 111-120), S. spontaneum L. (2n = 40-128), e S. edule Hassk. (2n = 3 60-80). Como genomas de todas essas espécies podem estar participando de alguma forma das variedade modernas, considera-se que a cana-de-açúcar é uma das espécies cultivadas de maior complexidade genética. O comportamento citogenético de espécies alopoliplóides é similar ao de indivíduos diplóides, ou seja, somente são formados bivalentes de cromossomos homólogos do mesmo genoma, visto que os genomas que deram origem aos alopoliplóides, em geral, diferem muito. Em cana-de-açúcar não se pode assumir herança diplóide. Entretanto, algumas evidências sugerem herança semelhante aos diplóides, e os desvios dessas suposições seriam não significativos. Dessa forma, as abordagens biométricas apresentadas nesta Tese são válidas para espécies diplóides e alopoliplóides e os modelos genéticos, portanto, podem ser empregados diretamente na análise de genótipos de cana-de-açúcar (HOGARTH, 1977; RESENDE, 2002, p.345). Devido a alta complexidade da cana-de-açúcar, esta espécie é sujeita às interações que ocorrem entre o genótipo e o ambiente. A identificação e estudo da adaptabilidade e estabilidade dos genótipos na fase final de um programa de melhoramento de plantas, ou seja, ensaios em múltiplos ambientes, é o tema central desta tese. 2.2. Modelos Mistos: efeitos fixos e aleatórios, Máxima Verossimilhança Restrita (REML) e Melhor Predição Linear não-viesada (BLUP) 2.2.1. Efeitos fixos e aleatórios Modelos estatísticos para dados são descrições matemáticas de como os dados podem ser concebivelmente produzidos. Modelos consistem ao menos de duas partes: i) Uma fórmula relativa as respostas para todos as variáveis explanatórias (por exemplo: efeitos), e ii) uma descrição da distribuição de probabilidade assumida para caracterizar a variação aleatória que afeta a resposta observada (LITTELL et al., 2006). Há modelos de média que incluem somente uma distribuição assumida da variável resposta e uma função da média incluindo somente fatores de efeito que são tratados como constantes e esse efeitos constantes são chamados de efeitos fixos. Um efeito é chamado fixo se os níveis no estudo representam todos os possíveis níveis de um fator, 4 ou, pelo menos, todos os níveis sobre qual inferência está para ser feita. Isso também inclui modelos de regressão onde os valores observados da variável explanatória cobrem a região inteira de interesse sobre o fator que se quer inferir (LITTELL et al., 2006). Fatores são aleatórios se eles são usados no estudo para representar uma amostra (idealmente, uma amostra aleatória) de um conjunto maior de níveis em potencial. O fator de efeito correspondente ao conjunto maior de níveis constitui uma população com uma distribuição de probabilidade, ou seja, um fator é considerado aleatório se seus níveis plausivelmente representarem uma população maior com uma distribuição de probabilidade. Efeitos aleatórios, então, representam uma amostragem verdadeira e assume-se haver uma distribuição de probabilidade (LITTELL et al., 2006). Pode-se dizer que os efeitos de genótipos são considerados como aleatórios porque os genes que levaram a formação de tais genótipos são uma amostra verdadeira de todos os genes que pertencem a população e, dessa forma, têm uma distribuição de probabilidade. A decisão de que um fator é aleatório ou fixo nem sempre é fácil e pode haver controvérsias. O efeito de blocos e locais ilustram esse ponto. O uso de blocos em experimentos agrícolas frequentemente reflete variação em um campo, assim como num declive com um bloco numa faixa situada no topo dele, um bloco numa faixa logo abaixo e assim por diante até o fim deste declive. Pode-se argumentar que não há nada de aleatório sobre esses blocos. Porém, uma característica adicional de efeitos aleatórios é a permutabilidade (LITTELL et al., 2006). 2.2.2. Estimação de componentes de variância via Máxima Verossimilhança Restrita (REML) O método REML foi desenvolvido por Patterson and Thompson (1971, APUD RESENDE, 2007; SORENSEN; GIANOLA, 2002), que apresentaram uma correção ao ML, eliminando o seu vício. No método REML, somente a porção da verossimilhança que é invariante aos efeitos fixos é maximizada. Assim, o REML mantém as demais propriedades do ML, é não viciado e permite também a imposição de restrições de não negatividade. Dessa forma, o REML é o procedimento ideal de estimação de componentes de variância com dados desbalanceados. Também Robertson (1962, APUD RESENDE, 2007), considerando a estimação de componentes de variância a partir de dados desbalanceados em modelos de classificação simples (única), derivou pesos ótimos para médias de família, os quais são, efetivamente, aqueles usados na estimação 5 REML. O procedimento REML é também denominado máxima verossimilhança marginal e, na Europa, por máxima verossimilhança residual. Sorensen and Gianola (2002, p. 127-128) elucidaram o REML proposto por Patterson and Thompson (1971) e o colocaram da seguinte forma: Com uma amostra de observações independentes n, segue-se a partir da equação Onde na equação 1: A log-verossimilhança pode ser expressada como: Maximizando (2) com relação ao m é equivalente a minimização da soma de desvios quadrados , então há uma relação com o critério dos quadrados mínimos neste caso. Levando a derivada de (2) com relação ao m, proporciona-se a forma linear de m: Igualando-se a equação 3 a zero e resolvendo para m, obtém-se, como máxima verossimilhança (ML) de m, Consequentemente, o estimador de ML do valor esperado de uma distribuição normal com variância conhecida é a média aritmética das observações (o estimador teria sido o mesmo se a variância tivesse sido desconhecida, como demonstra-se mais tarde). Este é também o estimador de quadrados mínimos, mas há uma coincidência com a ML de m somente quando a normalidade é assumida, como neste exemplo. Diferenciando 3 em relação a m obtém-se . Devido a esta derivada ser negativa, segue-se que é um máximo. Suponha-se, temporariamente, que m é uma variável aleatória real, e que é um parâmetro desconhecido. Agora, integrando 6 em relação a m obtém-se, para uma amostra de tamanho n, que, dado os dados, é a função de somente. (Os limites da integração são ±∞, mas isso é geralmente omitido a não ser que o contexto dite ao contrário). A expressão (6) é chamada de verossimilhança marginal ou integrada e tem a mesma forma da chamada verossimilhança restrita, proposta por Patterson and Thompson (1971). De fato, quando é um parâmetro desconhecido, a maximização de (6) em relação a produz que é o estimador da Máxima Verossimilhança Restrita (REML) de (SORENSEN; GIANOLA, 2002). Os métodos ML e REML requerem solução iterativa, pela não linearidade das equações, fato que dificulta a derivação de estimadores explícitos. Assim, os componentes de variância iteragem nas equações de modelo misto do BLUP até convergência para um valor adequado. Na maioria das vezes, a estimação dos componentes de variância e a predição de valores genéticos são realizados, simultaneamente, pelo procedimento REML/BLUP. Neste caso, o procedimento BLUP é denominado BLUP empírico (RESENDE, 2007). Os métodos de máxima verossimilhança permitem, sob certas condições, levar em conta os efeitos da seleção. É necessário que todas as informações que tenham contribuído para a seleção sejam incluídas na análise (bem como o parentesco entre os indivíduos), exceto se essas informações não forem correlacionadas com o caráter sob análise (MEYER, 1989). De maneira geral, argumentos e evidências indicam que inferências pontuais realizadas a partir de funções de verossimilhança não são afetadas por algumas formas de seleção (GIANOLA et al., 1989). Essa propriedade fez com que o método REML se tornasse padrão para a estimação de componentes de variância em programas de melhoramento genético. Kennedy and Sorensen (1988) mostram também que o método REML elimina o 7 vício devido a mudanças nas frequências alélicas pela seleção, pelo uso da matriz de parentesco completa (A) quando se trabalha com ela. Assim, torna-se possível a obtenção de componentes de variância para uma população base não selecionada e a predição de valores genéticos de indivíduos de quaisquer gerações é realizada com precisão. O uso da matriz A completa leva em consideração as alterações na variância genética devidas à endogamia e ao desequilíbrio de ligação, as quais resultam da seleção e, considera também, a tendência genética ou ganho genético realizado. Os métodos REML e ML exigem normalidade para que os estimadores tenham propriedades desejáveis. Entretanto, tais estimadores podem ser robustos aos desvios da normalidade, gerando estimativas razoáveis mesmo quando a forma da distribuição não é especificada (HARVILLE, 1977). Para dados balanceados, o estimador REML (negligenciando a suposição de normalidade e a restrição de estimativas REML ao espaço paramétrico) é idêntico ao estimador LS (análise de variância), o qual apresenta as propriedades desejáveis BUE (melhor estimador não viciado) e BQUE (melhor estimador quadrático não viciado) sob normalidade (SEARLE et al., 1992). Diferentemente de estimadores de ML, os estimadores REML maximizam somente a porção da verossimilhança que não depende dos efeitos fixos. Neste sentido, o REML é uma versão restrita da ML. A eliminação do viés pelo REML é análoga à remoção do viés que surge na estimativa do componente de variância quando o desvio quadrado médio é dividido pelos grau de liberdade ao invés de pelo tamanho amostral. O REML nem sempre elimina todos os vieses na estimação de parâmetros, uma vez que muitos métodos para obtenção de estimativas de REML não podem retornar estimativas negativas de um componente de variância. Porém, esta fonte de viés também existe com ML, então o REML é claramente o método preferido para analisar grandes conjuntos de dados com estruturas complexas. No caso ideal de um delineamento inteiramente balanceado, o REML produz componentes de estimativas de variância que são idênticos àqueles obtidos pelo análise clássica de variância (LYNCH; WALSH, 1998). 2.2.3. Melhor Predição Linear não-viesada (BLUP) Um modelo misto contém efeitos tanto fixos quanto efeitos aleatórios. Uma das principais características que distingue esta metodologia de métodos de modelos lineares convencionais é a habilidade para estimar "valores reais de variáveis aleatórias", ou seja, 8 efeitos aleatórios específicos ou funções lineares de efeitos aleatórios (LITTELL et al., 2006). Por exemplo, Henderson (1963) desenvolveu um procedimento para predição de valores genéticos de touros em experimentos genéticos com animais. Para fazê-lo, ele usou estimativas de efeitos aleatórios de touros em um modelo misto. Henderson chamou este procedimento de "Best Linear Unbiased Predicion", ou BLUP. Harville (1976) mostrou que o procedimento de Henderson tinha uma base teórica válida: Ela podia ser justificada como uma extensão do Teorema de Gauss-Markov. Mais recentemente, o uso de preditores baseado em efeitos aleatórios estimados ganhou ampla aceitação e tem sido aplicado em muitos problemas estatísticos. Tem-se alguns exemplos sobre a adoção do BLUP como estimativa de valores genéticos em culturas perenes, semi-perenes e anuais, tais como: Bernardo (1996); Souza et al. (2000); Paiva et al. (2002); Eagles and Moody (2004); Missio et al. (2004, 2005); Reis et al. (2005); Sebolai et al. (2005); Bauer et al. (2006); Crossa et al. (2006); Flachenecker et al. (2006a e 2006b); Bastos et al. (2007); Piepho et al. (2008); Nunes et al. (2008); Farias Neto et al. (2009); Pedrozo et al. (2009); Verardi et al. (2009); Arantes et al. (2010); Borges et al. (2010a); Viana et al. (2010a e 2010b); Mi et al. (2011), Arantes et al. (2013) e etc. Segundo Piepho et al. (2008), tanto o desenvolvimento de novas variedades quanto as suas recomendações de lançamento exigem uma seleção para ser feita entre um conjunto maior de genótipos candidatos, então a estimação de valores genéticos está no centro de qualquer esforço para o melhoramento. Valor genético refere-se a decomposição do valor genotípico para efeitos de componentes com uma interpretação genética, decompondo-se em efeitos aditivos e não aditivos (Dominância, Epistasia). O ponto final do objetivo de um programa de melhoramento genético geralmente é a predição dos valores genotípicos de um genótipo candidato. Bernardo (2010) afirma que dados de desempenho de estágios iniciais de seleção em uma população de melhoramento são geralmente balanceados. Isso significa que famílias, linhagens, test-crosses, ou híbridos são avaliados no mesmo grupo de locais e anos. Ter dados balanceados simplifica altamente a tarefa de selecionar os melhores genótipos numa população de melhoramento. Suponha que um melhorista de soja desenvolva 20 linhagens (inbred) recombinantes da população 1 e 15 linhagens recombinantes da população 2. As 20 linhagens recombinantes da população 1 são avaliadas em quatro locais, enquanto que as 15 linhagens recombinantes da população 2 são avaliadas em seis diferentes locais. As melhores linhagens de cada população 9 podem ser selecionadas com base em seus desempenhos médios nos respectivos testes de performance. Mas suponha que o melhorista agora deseja comparar as 20 linhagens recombinantes da população 1 com as 15 da população 2. Um problema com esta comparações é que os dados agora estão desbalanceados: nem todos as 35 linhagens foram avaliadas em todos os 10 locais. Diferenças entre grupo de ambientes são confundidos com diferenças entre grupos de linhagens recombinantes. Uma comparação direta, portanto, não pode ser feita baseando-se em médias simples das linhagens (BERNARDO, 2010). De acordo com Bernardo (2010), BLUP é um procedimento geral que permite comparações entre genótipos desenvolvidos de diferentes populações de melhoramento e avaliados em diferentes conjuntos de ambientes. O procedimento BLUP é útil por duas razões: 1) Permite a análise de dados desbalanceados acumulados de testes de performance. Mais dados se tornam disponíveis para os melhores genótipos porque são testados mais amplamente enquanto os genótipos menos superiores são descartados. O procedimento de BLUP lida com dados desbalanceados enquanto considera as diferenças na quantidade de dados disponíveis para cada genótipo. 2) O procedimento de BLUP explora informações de parentes, por meio disso, maximiza o uso dos dados disponíveis quando compara os genótipos. Suponha que um melhorista deseja comparar duas linhagens, A e B. Esta comparação pode ser feita baseando-se no desempenho de A e B sozinhos. Porém, esta comparação se torna mais precisa quando a performance dos parentes de A e dos parentes de B também são consideradas. O conceito da informação dos parentes é talvez melhor percebido com um exemplo de gado leiteiro. Touros carregam genes que afetam a produção de leite mas por razões óbvias um touro não pode ser diretamente avaliado por sua produção de leite. O valor genético de um touro para produção de leite, porém, pode ser predito da produção de leite do seu parente feminino (FALCONER; MACKAY, 1996). Informações do parental da cultura a partir do pedigree é altamente importante e facilmente obtida em programas de melhoramento. C.R. Henderson começou seu trabalho pioneiro no BLUP em meados de 1940 (HENDERSON et al., 1959; HENDERSON, 1963, 1975). O procedimento BLUP primeiro usado em 1970 para avaliar cerca de 1200 touros num programa de inseminação artificial (FREEMAN; HENDERSON, 1991; SCHAEFFER; HENDERSON, 1991). Desde então o 10 BLUP tem sido usado rotineiramente no melhoramento animal. O procedimento BLUP não foi usado em plantas até meados dos anos de 1990 (BERNARDO, 1994; PANTER; ALLEN, 1995). O nosso uso do termo BLUP na verdade refere-se à junção do uso de ambos BLUP e "Best Linear Unbiased Estimation", ou BLUE. Estes dois procedimentos diferem em que efeitos são considerados fixos no BLUE e aleatórios no BLUP: 1) Efeitos fixos são estimados no BLUE. Estes efeitos fixos são constantes ao invés de variáveis aleatórias. Exemplos de efeitos fixos são média geral, efeitos de diferentes tipos de solos ou de um transgene. Em melhoramento de plantas um ambiente individual é considerado aleatório mas a média de um grupo de ambientes usada, no caso de testes de performance, é considerada um efeito fixo (BERNARDO, 1996). Diferenças entre as médias dos conjuntos de ambientes são tratadas como fatores de impedimento que precisam ser levados em consideração antes de comparar genótipos. No nosso exemplo com soja, suponhamos quatro locais nos quais as linhagens da população 1 foram avaliadas havendo menos precipitação do que nos seis locais nos quais as linhagens da população 2 foram avaliadas. As observações precisam ser corrigidas para quaisquer efeitos de precipitação antes de comparar a performance de uma linhagem da população 1 e uma linhagem da população 2. 2) Efeitos Aleatórios são preditos por BLUP. Efeitos aleatórios tem uma estrutura de covariância enquanto que efeitos fixos não a tem. Por exemplo, um parental passa metade do valor genético para suas progênies, que causa uma covariância ou correlação entre os dois. Efeitos genéticos tais como: valores genéticos e desvio de dominância, efeitos de testcross, e o efeito de habilidade de combinação geral e específica no melhoramento de populações tem uma estrutura de covariância e são, portanto, considerados aleatórios. A presença de ambos os efeitos fixos e aleatórios leva-nos aos modelos mistos. BLUP e BLUE, considerados procedimentos, são, na verdade, propriedades estatísticas de predição e estimação. "Best" indica que a variância da amostra do que está sendo estimado ou predito é minimizada. "Linear" significa que as estimativas ou predições são funções lineares das observações. "Unbiased" no BLUE indica que os valores esperados das estimativas são iguais aos seus valores verdadeiros. Efeitos genéticos são definidos como tendo média zero, e "Unbiased" no BLUP indica que as predições tem uma expectativa de zero. O conhecimento dos valores verdadeiros das variâncias e covariâncias dos efeitos aleatórios é exigido no BLUP. Mas os valores verdadeiros das variâncias genéticas e não 11 genéticas são desconhecidas, então qualquer implementação do BLUP usando estimativas destas variâncias é uma aproximação. Na prática, BLUP em programas de melhoramento genético frequentemente envolve a predição simultânea de efeitos genéticos e a estimação de variâncias genéticas e não genéticas. Com exceção de delineamento experimental de um fator, delineamentos de cruzamento são raramente usados por melhoristas porque exigem experimentos para tal. A metodologia de BLUP permite a estimação de variâncias genéticas dos mesmos dados que são rotineiramente gerados nos programas de melhoramento, por isso evita-se a necessidade por delineamentos de cruzamento (BERNARDO, 2010). Uma propriedade principal do BLUP é o encolhimento em direção a média. Este encolhimento é mais encontrado como "shrinkage", do termo em inglês, mesmo em trabalhos em português e será tratado dessa forma nesta tese. Littell et al. (2006) definiram que o shrinkage para a variável resposta para um dado nível de um fator aleatório é a combinação ponderada da média geral, baseado nos efeitos fixos e na média ordinária para o nível do fator aleatório. O shrinkage depende da variância entre os níveis do fator aleatório e da variância dos valores da variável observada para cada nível do fator aleatório. No caso dos modelos de componentes de variância, pode-se escrever: (1) Tem-se a seguinte notação da equação acima: : shrinkage médio para o nível i do fator aleatório; : fator ponderado do nível i calculado por ; : variância para o nível i do fator aleatório, calculado por ; : variância dos efeitos aleatórios associada ao fator aleatório; µ: média geral dos valores das respostas; : média dos valores das respostas para o nível i do fator aleatório. Quando calcula-se o shrinkage médio, percebe-se o uso das estimativas da amostra para as quantidades na equação 1. Esta equação mostra como a quantidade do shrinkage nos BLUPs é uma função da variância dos valores da resposta observada dentro de um nível do fator aleatório e a variância dos efeitos aleatórios. Em casos extremos em que não haja variância entre os níveis do efeito aleatório ( ), há um shrinkage total, e a estimativa da média do shrinkage para cada nível do fator aleatório é igual a média geral. Ou seja, não há diferença na predição média para cada 12 nível do fator aleatório. Como a equação 1 mostra, a quantidade de "shrinkage" será uma função da variância do efeito aleatório e da variância total dos dados observados para um dado nível do fator aleatório. Se houver muita variabilidade entre as médias da variável resposta para os diferentes níveis do fator aleatório, haverá menos shrinkage do que se houvesse menos variabilidade. No caso extremos quando , o efeito estimado de cada nível do fator aleatório será também zero. No caso onde , a extensão para qual o BLUP para um particular efeito aleatório é "shrunken" (encolhido) depende da quantidade de informação disponível para predição daquele efeito aleatório. Por exemplo, se predizer BLUPs para grupos amostrados aleatoriamente, a predição do efeito do grupo aleatório será encolhido menos por grupos com tamanhos amostrais grandes do que para grupos com tamanhos amostrais menores, porque não tem-se mais informação sobre grupos maiores. Finalmente, segundo Searle et al. (1992), sob certas hipóteses bastantes gerais, BLUP maximiza a correlação dos valores genotípicos reais e os valores genotípicos preditos. Segundo Piepho et al. (2008), BLUP parece não ter ganhado a mesma popularidade como no melhoramento genético animal, onde este é um procedimento padrão. Uma razão pode ser que nos programas de melhoramento genético de plantas geralmente produzem relativamente uma grande quantidade de dados fenotípicos por genótipo a partir de uma sucessão de experimentos, então BLUE e BLUP frequentemente fornecem resultados semelhantes. Isto pode levar a uma falsa impressão que a escolha do estimador não é importante. 2.3. Inferência Bayesiana de componentes de variância A inferência Bayesiana, ao contrário da inferência clássica, ou seja, a frequentista, leva em conta o conceito de probabilidade. Na prática, a maior diferença é tentar medir o grau de incerteza que se tem sobre a ocorrência de um determinado evento do espaço amostral, utilizando distribuições de probabilidades a priori e a amostral (verossimilhança). Na inferência Bayesiana, a incerteza sobre os parâmetros desconhecidos associa-se uma distribuição de probabilidade (GIANOLA; FERNANDO, 1986), enquanto que, na inferência frequentista, os parâmetros são valores fixos ou constantes, aos quais não se associam a qualquer distribuição (BLASCO, 2001). Sob o enfoque Bayesiano, os efeitos de 13 tratamentos são sempre considerados aleatórios, de forma que estimadores que promovem "shrinkage" são sempre utilizados, mesmo com números de tratamentos menores que 10 (RESENDE, 2004). Segundo Resende (2000 e 2007), a inferência estatística Bayesiana baseia-se na distribuição condicional do parâmetro () dado o vetor de dados (y), ou seja, na distribuição a posteriori do parâmetro dadas as observações fenotípicas. O Teorema de Bayes, definido em termos de densidades de probabilidade, tem a seguinte formulação para a distribuição de uma variável aleatória contínua:       : Vetor de parâmetros y: Vetor de dados ou de informações obtidas por amostragem  : distribuição condicional de  dado y, ou distribuição a posteriori (que é a base da estimação e predição bayesiana).  : função desidade de probabilidade da distribuição condicional de uma observação (y) dado  (denominada função de verossimilhança ou modelo para os dados).  : função densidade de probabilidade da distribuição a priori, que é também a densidade marginal de . Esta função denota o grau de conhecimento acumulado sobre , antes da observação de y.   : função densidade conjunta de y e . : distribuição marginal ou preditiva de y com respeito a , onde R é a amplitude da distribuição de . significa esperança com respeito à distribuição de . (A integração da distribuição conjunta, no espaço paramétrico, produz a marginal de y). Verifica-se, então, que a distribuição a posteriori é proporcional à verossimilhança x priori, ou seja, a função de verossimilhança conecta a priori a posteriori usando para isto os dados do experimento (observações). Dessa forma, a distribuição a posteriori contempla o grau de conhecimento prévio sobre o parâmetro ( ) e também as informações adicionais propiciadas pelo experimento (y) (RESENDE, 2000 e 2007). Segundo RESENDE (1997), componentes de variância são estimados pelo método 14 REML e utilizados na predição de valores genéticos e cálculo do ganho genético. Entretanto, através deste procedimento, a distribuição e variância dos estimadores não são conhecidas e, assim, questões referentes à efetividade da seleção não podem ser respondidas com rigor. O método bayesiano de estimação dos componentes de variância, implementado via simulação estocástica, como por exemplo através do procedimento denominado amostrador de Gibbs, propicia uma descrição mais completa sobre a confiabilidade dos parâmetros genéticos do que o método REML. A abordagem bayesiana (conhecimento da distribuição a posteriori dos parâmetros) possibilita a construção de intervalos de confiança (ou de probabilidade) exatos para as estimativas dos parâmetros genéticos, estando a confiabilidade (precisão) dos parâmetros associadas com a quantidade e precisão das informações utilizadas. Dessa forma o método amostrador de Gibbs propicia estimativas mais precisas de componentes de variância, parâmetros genéticos, valores genéticos, ganhos genéticos e menores desvios padrões que o método REML. 2.3.1. Amostrador de Gibbs Em genética quantitativa, para implementação prática da análise bayesiana, uma das maiores dificuldades técnicas é a marginalização. A obtenção de distribuições marginais por processos analíticos é praticamente impossível (SORENSEN, 1996). Assim, a obtenção da distribuição marginal a posteriori (marginalização da distribuição conjunta a posteriori) tem sido obtida pelo método da amostragem de Gibbs através da amostragem e atualização das distribuições condicionais (RESENDE, 2004). Casella and George (1992) ilustram o amostrador de Gibbs da seguinte forma: Suponha que tem-se uma densidade conjunta dada como , e há interesse na obtenção de características da densidade marginal çã assim como a média ou variância. Talvez a mais natural e simples abordagem seria calcular e usá-la para obter a característica desejada. Porém, há muitos casos onde as integrações na equação 2 são extremamente difíceis de se obter, tanto quanto analiticamente quanto numericamente. Em tais casos o amostrador de Gibbs propicia um método alternativo para obter a , ou seja, a função de densidade marginal. 15 Ao invés de computar ou aproximar a diretamente, o amostrador de Gibbs permite efetivamente gerar uma amostra sem requerer a função de densidade marginal . Pela simulação de uma grande amostragem suficiente, a média, variância, ou qualquer outra característica de pode ser calculada para o grau desejado de acurácia. É importante perceber que, no efeito, o resultado final de quaisquer cálculos, embora baseados em simulação, são quantidades da população. Por exemplo, para calcular a média de , pode-se usar , e o fato que ∞ ∞ ∞ Portanto, pegando uma quantidade suficiente de m, qualquer característica da população, até mesmo a densidade, pode ser obtida para qualquer grau de acurácia (CASELLA; GEORGE, 1992). Após a obtenção de uma grande quantidade m de amostras, consequentemente após um grande número de iterações, a sequência de valores gerados pelo amostrador de Gibbs converge para uma distribuição estacionária igual a , sendo que cada valor de , obtido pelo amostrador de Gibbs após a convergência, é um valor simulado da distribuição conjunta de seus elementos (GEMAN; GEMAN, 1984). Desse modo, a sequência de valores gerados das amostras aleatórias, extraídas das condicionais, se aproxima da distribuição de equilíbrio, ou seja, são equivalentes às amostras aleatórias da distribuição conjunta e/ou marginal a posteriori (CASELLA; GEORGE, 1992). O amostrador de Gibbs é um processo iterativo de amostragem de uma cadeia de Markov. Tais cadeias estão inseridas no contexto da teoria dos processos estocásticos definido como a parte dinâmica da teoria de probabilidades, onde se estuda uma coleção de variáveis aleatórias, com respeito a sua interdependência e comportamento limite. Para a inferência bayesiana, é de maior relevância o estudo do comportamento assintótico da cadeia, quando o número de iterações tende a ∞, uma vez que a inferência deve ser baseada na distribuição (a posteriori) estacionária, ou seja, em equilíbrio (GAMERMAN, 1997 apud RESENDE, 2004). Há diferentes formas para se analisar o comportamento assintótico da cadeia de Markov, ou seja, detectar a convergência da cadeia de Gibbs, assim, vários testes, os quais verificam a estacionalidade da cadeia, o descarte inicial "burn-in", o tamanho efetivo da amostra, entre outros, são descritos em diversas literaturas (GELMAN; RUBIN, 1992; 16 GEWEKE, 1992; RAFTERY; LEWIS 1992a,b). 2.4. Interação genótipo x ambiente, adaptabilidade e estabilidade Caracteres quantitativos, especialmente aqueles que são controlados por muitos genes, são em geral altamente influenciados por fatores ambientais e demonstram uma variação contínua. A maior parte das características agronomicamente e economicamente importante, tal como a produção de grãos e produção de carne, são quantitativos ou multigênicos na natureza. Devida a presença universal da interação genótipo x ambiente (GxA) de características quantitativas, avaliações genotípicas em, pelo menos, estágios avançados de melhoramento de plantas são executados em ambientes múltiplos em experimentos planejados. Os principais objetivos destes experimentos são (1) comparar a performance genotípica em duas inferências básicas - por exemplo: ampla inferência, a performance geral de um genótipo (através dos ambientes), e ambiente específico ou inferência restrita, a performance de um genótipo dentro de um ambiente específico; (2) estimar o componente de interação GxA para calibrar a herdabilidade e seu impacto na seleção, selecionar sites testes e macro-ambientes, identificar genótipos especificamente adaptados para ambientes alvos, e estabelecer objetivos de melhoramento genético (YAN; KANG, 2003). Há várias técnicas para se avaliar a interação genótipo x ambiente. Entre as mais utilizadas, destacam-se as que procuram relacionar a produção (Y) de um genótipo em função de um índice ambientais (X). Teoricamente, demonstra-se que se X e Y são binormais, o valor esperado de Y em função dos observados valores de X é uma reta, cujo coeficiente angular depende da correlação entre X e Y e dos respectivos desvios padrões (HOGG; CRAIG, 1965). Diferentes metodologias para avaliar a adaptabilidade e a estabilidade tem sido desenvolvidas e, ou, aprimoradas. Tais procedimentos se baseiam em análise de variância, regressão linear, regressão não linear, análises multivariadas e estatísticas não paramétricas (BASTOS et al., 2007). A estabilidade refere-se à capacidade de os genótipos mostrarem um comportamento constante (estabilidade fenotípica). Adaptabilidade é a capacidade de responder positivamente aos estímulos dos ambientes. Em Bernardo (2010) este conceito é também chamado de estabilidade 17 dinâmica. Quando um genótipo não possui um comportamento previsível em função dos ambientes ele pode eventualmente ter resposta favorável a ambientes específicos (adaptabilidade preferencial ou específica para determinados ambientes); o que sugere, para esse caso, seleção regional ou para locais específicos. Por essas definições, necessariamente os desvios em relação ao modelo proposto (linear ou não) devem ser não significativos. No caso contrário (desvios do modelo significativos), há falta de adaptabilidade geral aos ambientes. O método de Lin and Binns (1988) é bastante usado para estudar a interação GxA e baseia-se em análise não paramétrica. Nesta metodologia o desempenho dos acessos é quantificada pelo índice de estabilidade Pi, que corresponde ao quadrado médio da distância entre a média de um acesso para um dado ambiente e a resposta máxima para o mesmo ambiente, em todos os ambientes avaliados. Dessa forma, o quadrado médio menor indica uma superioridade geral do genótipo em questão, pois quanto menor o valor de Pi, menor será o desvio em torno da produtividade máxima; assim, maior estabilidade está relacionada, obrigatoriamente, com alta produtividade (DAHER et al., 2003). O método de Eberhart and Russell (1966), baseado em regressão linear, é um dos métodos mais utilizados para estudar a adaptabilidade e estabilidade dos genótipos. Neste processo um índice ambiental é calculado através da subtração entre a média do ambiente (média de todos os genótipos neste ambiente) menos a média geral (média geral de todos os genótipos em todos os ambientes). Usando o índice ambiental como abscissa X e o valor observado do genótipo em determinado ambiente como ordenada Y, utiliza-se uma regressão linear para cada genótipo testado ( . O valor de b (ângulo) estima a adaptabilidade do genótipo. Quando b<1, pode-se afirmar que o genótipo responde pouco à melhoria ambiental, b=1 corresponde a genótipos que respondem de forma mediana à melhoria ambiental e b>1 corresponde a genótipos que respondem de forma acentuada à melhoria de ambiente e são mais indicados para ambientes superiores. Neste método, a estabilidade é estimada pelo somatório dos desvios (MS- ), da resposta em relação ao predito pela reta. No contexto dos modelos mistos, um método para ordenamento de genótipos simultaneamente por seus valores genéticos (produtividade) e estabilidade, refere-se ao procedimento BLUP sob médias harmônicas (RESENDE, 2002). Neste caso, o vetor de dados (y) deve ser trabalhado como a recíproca dos dados observados, ou seja, (1/y). Isto produz resultados que são funções (1/H) da média harmônica (H) dos dados. Quanto 18 menor for o desvio padrão do comportamento genotípico através dos locais, maior será a média harmônica de seus valores genotípicos através dos locais. Assim, a seleção pelos maiores valores da média harmônica dos valores genotípicos (MHVG) implica simultaneamente seleção para produtividade e estabilidade. Adicionalmente, o uso da transformação 1/y considera também a instabilidade dentro dos locais. A seleção considerando simultaneamente a produtividade, estabilidade e adaptabilidade, no contexto dos modelos mistos, pode ser feita por meio da estatística da Média Harmônica da Performance Relativa dos Valores Genotípicos (MHPRVG) preditos, apresentando as seguintes vantagens, quando comparado com outros métodos, segundo Resende (2004): (i) considera os efeitos genotípicos como aleatórios; (ii) permite lidar com heterogeneidade de variâncias; (iii) permite lidar com dados não balanceados; (iv) permite lidar com delineamentos não ortogonais; (v) considera os erros correlacionados dentro de locais; (vi) fornece valores genéticos já descontados da instabilidade; e (vii) gera resultados na própria grandeza ou escala do caráter avaliado. 2.4.1. Regressão Linear Fenotípica Conjunta (EBERHART; RUSSELL, 1966) A Regressão Linear Fenotípica Conjunta proposta por Eberhart and Russell (1966) é uma metodologia de análise de estabilidade bastante utilizada em programas de melhoramento de plantas. Este tipo de análise visa examinar a reação de um genótipo, relativa aos outros genótipos, para diferentes ambientes. A análise de estabilidade permite a identificação de genótipos que são estáveis ou instáveis (BERNARDO, 2010). O conceito de estabilidade implica que alguma medida que distingue um ambiente do outro seja necessária, um índice que possa representar o ambiente. Idealmente este Índice Ambiental ( ) deveria ser baseado em fatores ambientais que afetam a performance dos genótipos, tais como propriedades do solo, fatores climáticos, ou estresses bióticos ou abióticos (EBERHART; RUSSELL, 1966; LIN et al., 1986 APUD BERNARDO, 2010). Mas até que tais índices são desenvolvidos, o efeito de j-ésimo ambiente pode servir como um útil na análise de estabilidade de genótipos. Entretanto os genótipos devem ser cultivados numa grande variação de ambientes e estes ambientes devem ser distribuídos uniformemente nesta variação. De acordo com Bernardo (2010) a análise de estabilidade é menos significativa se, por exemplo, altos e baixos valores do efeito ambiental estão presentes mas valores intermediários destes 19 efeitos estão ausentes. O uso da regressão linear para identificar genótipos estáveis foi primeiramente proposto por Yates and Cochran (1938) que tiveram a ideia de divisão das interações genótipo específicas em um componente explicado pela performance da média da população e um componente residual. Esta abordagem, que tornou-se a análise de regressão conjunta, possui algumas dificuldades estatísticas e foi bastante omitida até o uso por Finlay and Wilkinson em 1963, aplicando-a a variedades de cevada. Três anos depois Eberhart and Russell (1966) propuseram o mesmo método mas a regressão fora baseada em um Índice Ambiental calculado ao invés de se usar a performance média dos genótipos no ambiente. Desde então tem sido utilizada amplamente na análise de cultivo de variedades em vários experimentos (BERNARDO, 2010; LYNCH; WALSH, 1998). Há muitos métodos que são propostos para análise estatística da interação genótipo x ambiente (GxA), e muitos trabalhos tem sido feitos tanto por estatísticos interessados na não aditividade, em geral, quanto para agrônomos, melhoristas e geneticistas, que estão interessados nas interações genótipo x ambiente. Uma grande quantidade de trabalhos foram publicados e nesta tese há uma tentativa de incluí-los numa breve revisão. Fisher and Mackenzie (1923) publicaram um artigo de importância histórica que deu uma ideia indiretamente da interação GxA e citaram que as produções de diferentes variedades sob tratamento de adubações diferentes são melhores ajustadas pelo produto da fórmula do que pela soma da fórmula. Porém este trabalho permaneceu ignorado por muito tempo. A técnica de componente de variância foi seguida por muitos, por exemplo, Miller, Williams e Robinson (1959) que consideraram a ideia para discutir a interação GxA na cultura do algodão. Alguns trabalhos aplicaram a transformação de dados para uma escala de produção sem interação. Bartlett (1947) e Tukey (1949) sugeriram tal procedimento estatístico que foi aplicado para superar os problemas levantados pela presença da interação GxA. Uma outra abordagem, usada por geneticistas, foi entender a causa da interação GxA em termos de parâmetros genéticos biométricos. A abordagem foi então inteiramente diferente daquela dos melhoristas e agrônomos, os geneticistas gostariam de minimizar os efeitos da interação GxA nos seus campos. Em estudos genéticos, Morely and Mather (1958) discutiram como a interação GxA influencia as variâncias e co-variâncias. Baseados nos estudos de Yates e Cochran (1938), Finlay e Wilkinson (1963) redescobriram um método similar e propuseram que a performance dos genótipos em 20 ambientes diferentes pode ser calculada para uma grande amplitude pela suas regressões sobre o índice do ambiente. Foi ainda estendido por Eberhart and Russell (1966) e Perkins and Jinks (1968a,b). Principalmente cinco abordagens de regressão tem sido utilizadas para descrever e analisar a interação GxA. A primeira abordagem, adotada por Finlay e Wilkinson (1963), Row and Andrew (1964), Eberhart and Russell (1966), Bucio Alanis (1966), Bucio Alanis and Hill (1966) e Breese (1969), é puramente estatística, que envolve o uso inválido estatisticamente das estimativas de não independência das variáveis. A segunda abordagem, adotada por Perkins and Jinks (1968a,b) e Baker (1969), e a terceira abordagem, derivada pelo Freeman and Perkins (1971), relatam os componentes na análise de regressão para o modelo genético biométrico básico. A quarta abordagem por Shukla (1972), e a quinta abordagem por Hardwick and Wood (1972), Perkins (1972) e Shukla (1983), são baseadas no conceito de regressão múltipla sobre variáveis externas como meios de encontrar as causas fisiológicas envolvidas da regressão observada sobre a média ambiental. Entretanto, em todas essas abordagens de procedimentos de estimação foram derivadas do uso do princípio dos Quadrados Mínimos. A primeira abordagem no qual o valor fenotípico é regressado sobre o Índice Ambiental proporciona duas medidas de sensibilidade para mudança no ambiente em termos do coeficiente de regressão e o desvio quadrado da média da regressão linear. Medidas similares são derivadas na segunda abordagem pela regressão do componente GxA sobre o componente ambiental aditivo. O modelo de Eberhart and Russell é idêntico ao de Finlay e Wilkinson, no qual os coeficientes de regressão médio entre todos os genótipos são igual a um, ou seja, a esperança do coeficiente de regressão é igual a um. Segundo Lynch and Walsh (1998) a aplicação da equação do modelo de Eberhart and Russell (1966), , para todos os genótipos em uma análise de interação genótipo x ambiente proporciona uma base para ordenar os genótipos com repeito às suas responsividades à mudança ambiental. implica que a resposta média do genótipo i para o ambiente é a mesma que a resposta média da população de genótipos na análise. implica em uma resposta média mais forte, enquanto que implica que o genótipo tende a responder à mudança ambiental numa direção contrária à média dos genótipos na população. É importante notar que é somente uma medida de uma tendência do genótipo 21 para responder à mudança ambiental de maneira paralela à média da população. Dois genótipos com idênticos coeficientes podem, de fato, ter um conjunto de ambientes ( ) bastante diferentes (LYNCH; WALSH, 1998). 2.4.2. Média Harmônica da Performance Relativa do Valor Genotípico (RESENDE, 2004) Os procedimentos de análise de interação genótipo x ambiente evoluíram da tradicional ANOVA conjunta de experimentos, passando pelos métodos de estudo da estabilidade e adaptabilidade fenotípica baseados em análise de regressão, pelos métodos não paramétricos para estabilidade e adaptabilidade e pelos modelos multiplicativos (AMMI) para os efeitos de interação. Tais procedimentos apresentam limitações para lidar com dados desbalanceados, delineamentos experimentais não ortogonais (blocos incompletos) e com a heterogeneidade de variâncias entre os vários locais de experimentação, situações estas corriqueiras na experimentação de campo. Além do mais, tais metodologias assumem, em geral, que os efeitos de tratamentos genéticos são fixos, o que é desvantajoso e incoerente com a prática simultânea da estimação de componentes de variância e parâmetros genéticos (tais quais a herdabilidade) realizada com base nestes experimentos (RESENDE, 2007). Outro aspecto, ainda segundo Resende (2007), refere-se à escolha do procedimento a ser aplicado, dentre os vários disponíveis. Alguns procedimentos conduzem a resultados similares, outros possuem propriedades estatísticas superiores e alguns permitem interpretações mais simples dos resultados. Assim, a escolha a priori do método a aplicar é tarefa difícil devido a vários métodos não serem prontamente comparáveis, pelo menos formalmente, pois envolvem conceitos diferentes. Neste sentido, Piepho (1999 APUD RESENDE, 2007) propôs o uso da metodologia de modelos mistos via REML para a comparação entre os vários procedimentos, tais quais o de Finlay e Wilkinson, o de Eberhart and Russell, o de Shukla, o de Lin et al. e uma versão AMMI considerando os efeitos de locais como aleatórios. Segundo Piepho (1999 APUD RESENDE, 2007), a maioria das medidas tradicionais de estabilidade podem ser enquadradas na metodologia de modelos mistos, assumindo os efeitos de genótipos como fixos e os efeitos de locais como aleatórios. O método REML é então aplicado na estimação de parâmetros, fato que é vantajoso devido à sua aplicabilidade para a situação de dados desbalanceados e de heterogeneidade de variâncias. 22 Atualmente, procedimentos de interpretação mais simples têm tido apelo para a análise de estabilidade e adaptabilidade. Neste sentido, medidas que incorporam ambos (estabilidade e adaptabilidade) em uma única estatística, tais quais os métodos de Annicchiarico (1992) e Lin e Binns (1988) e modificações, têm sido enfatizados (CRUZ e CARNEIRO, 2003). No contexto dos modelos mistos, um método para ordenamento de genótipos simultaneamente por seus valores genéticos (produtividade) e estabilidade, refere-se ao procedimento BLUP sob médias harmônicas (RESENDE, 2004). Neste caso, o vetor de dados (y) deve ser trabalhado como a recíproca dos dados observados, ou seja, (1/y). Isto produz resultados que são função (1/H) da média harmônica dos dados. Quanto menor for o desvio padrão do comportamento genotípico através dos locais, maior será a média harmônica de seus valores genotípicos através dos locais. Assim a seleção pelos maiores valores da média harmônica do valor genotípico (MHVG) implica simultaneamente na seleção para produtividade e estabilidade. Adicionalmente, o uso da transformação 1/y considera também a instabilidade dentro dos locais. Em termos de adaptabilidade, uma medida simples e eficiente no contexto dos modelos mistos refere-se à performance relativa dos valores genotípicos (PRVG) através dos ambientes. Neste caso, os valores genotípicos preditos (ou os dados originais) são expressos como proporção da média geral de cada local e, posteriormente, obtém-se o valor médio desta proporção através dos locais. Genericamente, a performance relativa tem sido usada há um longo tempo (WRIGHT et al. 1966, apud RESENDE, 2007) em termos de dados fenotípicos, e constitui a base do método de Annicchiarico (1992 APUD RESENDE, 2007). A seleção simultânea por produtividade, estabilidade e adaptabilidade, no contexto de modelos mistos, pode ser realizada pelo método da média harmônica da performance relativa do valor genotípico (MHPRVG) predito, proposto por Resende (2004). De acordo com Resende (2007), este método permite selecionar simultaneamente pelos três atributos mencionados e apresenta as seguintes vantagens: (i) considera os efeitos genotípicos como aleatórios e portanto fornece a estabilidade e adaptabilidade genotípica e não fenotípica; (ii) permite lidar com desbalanceamento; (iii) permite lidar com delineamentos não ortogonais; (iv) permite lidar com heterogeneidade de variâncias; (v) permite considerar erros correlacionados dentro de locais; (vi) fornece valores genéticos já descontados (penalizados) da instabilidade; (vii) pode ser aplicado com qualquer número de ambientes; (viii) permite considerar a estabilidade e adaptabilidade na seleção de indivíduos dentro de progênies; (ix) não depende da estimação e 23 interpretação de outros parâmetros tais quais coeficientes de regressão; (x) elimina os ruídos da interação genótipos x ambientes pois considera a herdabilidade desses efeitos; (xi) gera resultados na própria grandeza ou escala do caráter avaliado; (xii) permite computar o ganho genético com a seleção pelos três atributos simultaneamente. Estes dois últimos fatores são bastante importantes. Outros métodos como o de Lin e Binns fornecem resultados que não são interpretados diretamente como valores genéticos e então não permitem computar o ganho genético no caráter composto pela produtividade, estabilidade e adaptabilidade. O método Annicchiarico depende, adicionalmente, de suposições de valores de α associados a , que refere-se ao percentil da função distribuição normal padrão associado a determinado nível de significância α. Oliveira et al. (2005), Sturion e Resende (2005) e Carbonell et al. (2007) avaliaram a produtividade, adaptabilidade e estabilidade pelo método da MHPRVG. Estes trabalhos mostraram que os métodos de Annicchiarico (1992), Lins e Binns (1988) e MHPRVG obtiveram, praticamente, o mesmo ranking de indivíduos selecionados ao serem comparados. Contudo, corroboraram que o método MHPRVG apresenta a vantagem de fornecer resultados na própria escala e medição do caráter avaliado, os quais podem ser interpretados diretamente como valores genéticos. Trabalhos, como os de Pinto Jr. et al. (2006), Bastos et al. (2007), Zeni Neto et al. (2008), Maia et al. (2009), Verardi et al. (2009), Moraes et al. (2012), Pastrana Vargas et al. (2012), Rosado et al. (2012), Arantes et al. (2013), têm mostrado as vantagens de se utilizar a MHPRVG na seleção de plantas visando, simultaneamente, a produtividade, estabilidade e adaptabilidade em culturas perenes e semi-perenes, tais como: a seringueira, eucalipto, cajueiro, aroeira, Acacia mangium, cana-de-açúcar e etc. A aplicação em culturas anuais também já foi realizada por Borges et al. (2010b) e Regitano Neto (2013) em arroz de terras altas e em milho por Mendes et al. (2012). 2.4.3. Norma de reação com covariáveis desconhecidas (SU et al., 2006) A interação genótipo x ambiente (GxA) refere-se ao diferencial de respostas de diferentes genótipos através de uma variação de ambientes (KANG, 2004). Falconer and Mackay (1996) citam que a interação GxA é quando diferentes genótipos respondem diferentemente a mudanças em seus ambientes e chama-a, também, de diferenças na sensibilidade ambiental dos genótipos. Para análises de tal sensibilidade ambiental a 24 performance do genótipo (valor genotípico) é regredida sobre a performance média da população em cada ambiente. Uma variação de fenótipos pode resultar de um genótipo quando este é exposto em diferentes ambientes. Este fenômeno é chamado de norma de reação, ou plasticidade fenotípica. Norma de reação representa a expressão da variabilidade de um fenótipo em indivíduos de um único genótipo (SAXTON, 2004). O valor genotípico estimado de um indivíduo, que é dividido numa dependente e independente parte ambiental, é também chamado norma de reação (FALCONER; MACKAY, 1996). Para Scheiner (1993) a norma de reação representa a direção das respostas plásticas e a variabilidade entre os genótipos quanto ao grau de plasticidade, ou seja, descreve a expressão fenotípica pela genotípica como uma função do ambiente. A abordagem por norma de reação é usada quando fenótipos mudam gradualmente e continuamente sobre um gradiente ambiental (DE JONG, 1995). Uma vez que os ambientes não são classificados em grupos, um método comum utilizado na norma de reação é a regressão da performance do genótipo (valor genotípico) em cada ambiente sobre o gradiente ambiental. Que seria, basicamente, o cálculo da média fenotípica de cada ambiente em que o genótipo foi avaliado e a utilização dessa média fenotípica ambiental como um índice ambiental e utilizá-lo como regressor na análise. Van der Werf et al. (1998) utilizaram a análise de covariância na tentativa de captar a interação GxA realizando, num primeiro passo, o cálculo das médias fenotípicas e posteriormente, num segundo passo, a análise de regressão considerando estas médias fenotípicas ambientais como covariáveis na regressão. A utilização de covariáveis para a captação da interação GxA praticamente começou com Kolmodin et al. (2002) que perceberam que apesar da desvantagem de incluir informação da variável dependente na variável explanatória, o método do cálculo de médias fenotípicas ambientais e utilização de tais médias como covariável (aqui chamado de procedimento de dois passos) provou-se utilizável. A maior vantagem deste procedimento foi que o ambiente pode ser pontuado como mais ou menos favorável. Calus and Veerkamp (2003) citaram que o uso de um parâmetro ambiental numa função de covariância tem a vantagem de que os ambientes são tratados como um contínuo, ao invés de um conjunto de grupos definidos arbitrariamente pelos dados. Depois dessa introdução de análise por Kolmodin et al. (2002) houveram diversas pesquisas, tais como de Calus et al. (2002), Calus and Veerkamp (2003), Kolmodin and 25 Bijma (2004), Calus et al. (2004), Pollott and Greeff (2004), Calus et al. (2005), Pegolo et al. (2009), Corrêa et al. (2009), Corrêa et al. (2010) e Pegolo et al. (2011) que utilizaram da performance da média fenotípica do genótipo no ambiente e usam tal média no modelo como covariável desconhecida, ou seja, pelo procedimento de dois passos. Calus et al. (2004) propuseram estimar os valores ambientais por um procedimento iterativo do qual o efeito ambiental estimado numa dada iteração substitui o valor da covariável na próxima. Utilizando simulação computacional, os autores observaram uma redução insignificante no viés das estimativas dos componentes de variância por essa abordagem quando comparado com o procedimento padrão de substituir covariáveis com médias fenotípicas. Eles sugeriram substituir os valores ambientais com estimativas dos efeitos de rebanhos obtidos de um grande número de animais por rebanho, ao invés de rebanho-anos, tendo o custo da perda de informação na Interação Genótipo x Ambiente. Posteriormente ao início da utilização do procedimento de dois passos uma outra abordagem foi realizada e a utilização da média fenotípica do genótipo no ambiente como uma covariável no modelo já começou a ser provada que estavam ocorrendo perdas de informações na análise de interação GxA. Su et al. (2006) então afirmaram que é claramente insatisfatório incluir uma função dos dados como uma covariável no modelo amostral e que, além da atenuação da incerteza devido ao tratamento de médias fenotípicas como parâmetros conhecidos, pode-se imaginar situações que resultariam em representações enganosas dos valores ambientais. Para superar essa limitação, Su et al. (2006) propuseram uma abordagem Bayesiana que infere conjuntamente os valores ambientais com todos os parâmetros desconhecidos na norma de reação, sem a necessidade de usar resultados de análise prévia (ou seja, um procedimento com um passo). O método foi testado utilizando-se dados simulados e conduziu para estimativas de parâmetros sem viés detectável e com um menor erro do quadrado médio do que os métodos convencionais de obtenção dos parâmetros ambientais. Mais tarde foi demonstrado também por Shariati et al. (2007), Mattar et al. (2011) e Cardoso and Tempelman (2012) os benefícios de se estimar conjuntamente os parâmetros por esse tipo de abordagem em que consideram-se as covariáveis desconhecidas. Shariati et al. (2007) estudaram a interação genótipo x ambiente em vacas dinamarquesas para diversas características de produção de leite a partir de modelos de norma de reação com covariáveis desconhecidas, utilizando-se a variância residual 26 homogênea e também variâncias residuais heterogêneas. Os autores concluíram que mesmo em um país pequeno como a Dinamarca a interação genótipo x ambiente pode ser detectada pelo modelo de norma de reação e sugeriu que a variância residual heterogênea deveria ser levada em consideração na análise de GxA. O uso da variância residual heterogênea na análise da norma de reação evitou o confundimento entre a variação do coeficiente de regressão genético e a variação dos efeitos ambientais dentro do sistema de produção. 3.REFERÊNCIAS BIBLIOGRÁFICAS ANNICCHIARICO, P. Cultivar adaptation and recomendation from alfafa trials in Northern Italy. Journal of Genetics & Breeding, Berlin, v. 46, n. 1, p. 269-278, 1992. ARANTES, F.C.; GONÇALVES, P.S.; SCALOPPI Junior, E.J.; MORAES, M.L.T.; RESENDE, M.D.V. Ganho genético com base no tamanho efetivo populacional de progênies de seringueira. Pesquisa Agropecuária Brasileira, Brasília, v. 45, n. 12, p. 1419-1424, 2010. ARANTES, F.C.; SCALOPPI Jr., E.J.; GONÇALVES, P.S.; MORAES, M.L.T.; GONÇALVES, E.C.P.; RESENDE, M.D.V. Adaptability and stability in rubber tree progenies under different environmental conditions, Pesquisa Florestal Brasileira, Colombo, v. 33, n. 73, 2013. BAKER, R.J. Genotype-environment interaction in yield of wheat. Can. J. Plant Sci. 49, 743-751, 1969. BARTLETT, M. S. The use of transformations. Biometrics, 3, 39-57, 1947 BASTOS, I. T.; BARBOSA, M. H. P.; RESENDE, M. D. V.; PETERNELLI, L.A.; SILVEIRA, L.C.I.; DONDA, L.R.; FORTUNATO, A. A.; COSTA, P. M. A.; FIGUEIREDO, I. C. R. Avaliação da interação genótipo x ambiente em cana-de-açúcar via modelos mistos. Pesquisa Agropecuária Tropical, v. 37, n. 4, 2007. BAUER, A.M.; REETZ, T.C.; LÉON, J. Estimation of breeding values of inbred lines using best linear unbiased prediction (BLUP) and genetic similarities. Crop Science v. 46, p. 2685 – 2691, 2006. BERNARDO, R. Best linear unbiased prediction maize single-cross performance. Crop Science, 36:50–56, 1996. BERNARDO, R. Breeding for quantitative traits in plants, 2nd edition, Minnesota, 390 p., 2010. BERNARDO, R. Prediction of maize single-cross performance using RFLPs and information from related hybrids. Crop Science, 34:20-25, 1994. 27 BLASCO, A. The Bayesian controversy in animal breeding. Journal of Animal Science, 79, 2023–2046. 2001. BORGES, V.; FERREIRA, P.V.; SOARES, L.; SANTOS, G.M.; SANTOS, A.M.M. Seleção de clones de batata-doce pelo procedimento REML/BLUP. Acta Scientiarum Agronomy, Maringá, V. 32, n. 4, p. 643-649, 2010a. DOI: 10.4025/actasciagron.v32i4.4837 BORGES, V.; SOARES, A.A.; REIS, M.S.; RESENDE, M.D.V.; CORNÉLIO, V.M.O.; LEITE, N.A.; VIEIRA, A.R.; Desempenho genotípico de linhagens de arroz de terras altas utilizando metodologia de modelos mistos. Bragantia, Campinas, v. 69, n. 4, p. 833-841, 2010b. BREESE, E.L. The measurement and significance of genotype-environment interactions in grasses. Heredity, 24, 27-44, 1969. BUCIO ALANIS, L. Environmental and genotype-environment components of variability I- Inbred Lines. Heredity, 31, 387-397, 1966. BUCIO ALANIS, L.; HILL, J. Environmental and genotype environmental components of variability II. Heterozygotes. Heredity, 21, 399-405, 1966. CALUS, M. P. L.; BIJMA, P.; VEERKAMP, R. F. Effects of data structure on the estimation of covariance functions to describe genotype by environment interaction in a reaction norm model. Genet. Sel. Evol. v. 36, p. 489–507, 2004. CALUS, M. P. L.; GROEN, A. F.; DE JONG, G. Genotype ×environment interaction for protein yield in Dutch dairy cattle as quantified by different models. Journal of Dairy Science. v. 85, p. 3115–3123, 2002 CALUS, M. P. L.; VEERKAMP, R. F. Estimation of environmental sensitivity of genetic merit for milk production traits using a random regression model. Journal of Dairy Science, v. 86, p. 3756–3764, 2003. CALUS, M.P.L.; CARRICK, M.J.; VEERKAMP, R.F.; GODDARD, M.E. Estimation of genetic parameters for milk fat depression in dairy cattle. Journal of Dairy Science, Champaign, v. 88, p. 1166-1177, 2005. CARBONELL, S. A. M.; CHIORATO, A. F.; RESENDE, M. D. V.; DIAS, L. A. S.; BERALDO, A. L. A.; PERINA, E. F. Estabilidade de cultivares e linhagens de feijoeiro em diferentes ambientes no estado de São Paulo. Bragantia, Campinas, v. 66, n. 2, p.193-201, 2007. CARDOSO, F.F.; TEMPELMAN, R.J. Linear reaction norm models for genetic merit prediction of Angus cattle under genotype by environment interaction. Journal of Animal Science, v. 90, p. 2130-2141, 2012. CASELLA, G.; GEORGE, E.I. Explaining the Gibbs Sampler. The American Statistician, v. 46, n. 3, p. 167-174, 1992. CORRÊA, M.B.B.; DIONELLO, N.J.L.; CARDOSO, F.F. Caracterização da interação genótipo-ambiente e comparação entre modelos para ajuste do ganho pós- 28 demama de bovinos Devon via normas de reação. Revista Brasileira de Zootecnia, v.38, n.8, p.1468-1477, 2009. CORRÊA, M.B.B.; DIONELLO, N.J.L.; CARDOSO, F.F. Genetic evaluation of Devon Cattle using a reaction norms model. Revista Brasileira de Zootecnia, v.39, n.1, p.128-133, 2010. CROSSA, J.; BURGUENO, J.; CORNELIUS, P.L.; MCLAREN, G.; TRETHOWAN, R.; KRISHNAMACHARI, A. Modeling genotype x environment interaction using additive genetic covariances of relatives for predicting breeding values of wheat genotypes. Crop Sci 46:1722–1733, 2006. CRUZ, C.D.; CARNEIRO, P.C.S.; Modelos biométricos aplicados ao melhoramento genético. Viçosa: UFV, 2 ed., v. 2, 2003. 585p. DAHER, R. F.; PEREIRA, M. G.; AMARAL JR., A. T.; PEREIRA, A. V.; LÉDO, F. J. S.; DAROS, M. Estabilidade da produção forrageira em clones de capim-elefante (Pennisetum purpureum Schum.). Ciência Agrotecnologia, v. 27, n. 4, p. 788- 797, 2003. DANIELS, J.; ROACH, B.T. Taxonomy and evolution. p.7-84. In Heinz, D.J. (ed.) Sugarcane improvement through breeding. Elsevier Press, Amsterdam. 1987. DE JONG, G. Phenotypic plasticity as a product of selection in a variable environment. The American Naturalist, Chicago-IL, V. 145, 493-512, 1995. EAGLES, H.A.; MOODY, D.B. Using unbalanced data from a barley breeding program to estimate gene effects: Ha2, Ha4, and sdw1 genes. Australian Journal of Agricultural Research, v. 55, p. 379–387, 2004. EBERHART, S. A.; RUSSELL, W. A. Stability parameters for comparing varieties. Crop Science, Madison, v. 6, n. 1, p. 36-40, 1966. FALCONER, D.S.; MACKAY, T.F.C. Introduction to quantitative genetics, 4 th ed. Longman Group, Essex, 464 p. 1996. FARIAS NETO, J.T.; LINS, P.M.P.; RESENDE, M.D.V.; MULLER, A.A. Seleção genética em progênies híbridas de coqueiro. Revista Brasileira de Fruticultura, v. 31, p. 190-196, 2009. FINLAY, K.W.; WILKINSON, G.N. The analysis of adaptation in a plant breeding 24 programme. Aust. J. Agri. Res., 14, 742-754, 1963. FISHER, R.A.; MACKENZIE, W.A. Studies in crop variation II. The response of different potato varieties. J. Agric. Sci., Camb., 13, 311-320, 1923. FLACHENECKER, C.; FRISCH, M.; FALKE, K.C.; MELCHINGER, A.E. Modified full-sib selection and best linear unbiased prediction of progeny performance in a European F2 maize population. Plant Breed 125:248–253, 2006a. FLACHENECKER, C.; FRISCH, M.; FALKE, K.C.; MELCHINGER, A.E. Trends in population parameters and best linear unbiased prediction of progeny performance in a European F2 maize population under modified recurrent full-sib http://lattes.cnpq.br/3837868873609532 29 selection. Theor Appl Genet 112:483–491, 2006b. FOX, P.N.; CROSSA, J.; ROMAGOSA, I. Multi-environment testing and genotype x environment interaction. In: KEMPTON, R.A.; FOX, P.N. (Ed.). Statistical methods for plant variety evaluation. New York: Chapman and Hall, Cap. 8, p. 117-138, 1997. FREEMAN, A.E; HENDERSON, C.R. Contributions to the dairy industry. Journal of Dairy Science. 74: 4045-4051, 1991. FREEMAN, G.H.; PERKINS, J.M. Environmental and genotype-environmental components of variability VIII. Relation between genotype grown in different environments and measurement of these environments. Heredity, 27, 15-23, 1971. GAMERMAN, D. Markov chain Monte Carlo: Stochastic simulation for bayesian inference. CRC Press, 1997. 230 p. GELMAN, A.; RUBIN, D.B. Inference from iterative simulation using multiple sequence. Statistical Science, Hayward, v.7, n.4, p.457-511, 1992. GEMAN, S.; GEMAN. D. Stochastic relaxation, Gibbs distribution and Bayesian restoration of images. IEE Transactions on Pattern Analysis and Machine Intelligence, v. 6, p. 721–741, 1984. GEWEKE, J. Evaluating the accuracy of sampling-based approaches to the calculation of posterior moments. In, Bayesian Statistics 4, J. M. Bernardo, J. O. Berger, A. P. Dawid,; A. F. M. Smith (eds.), pp. 169-193. Oxford University Press. 1992. GIANOLA, D.; FERNANDO, R.L. Bayesian methods in animal breeding theory. Journal of Animal Science, v. 63, p. 217-244, 1986. GIANOLA, D.; FERNANDO, R.L.; IM, S.; FOULLEY, J.L. Likelihood estimation of quantitative genetic parameters when selection occurs: models and problems. Genome, Ottawa, v. 31, p. 768-777, 1989. HARDWICK, R.C.; WOOD, J.T. Regression methods for studying genotype- environment interactions. Heredity, 28, 209-222, 1972. HARVILLE, D. A. “Extension of the Gauss-Markov Theorem to Include the Estimation of Random Effects.” Annals of Statistics 2:384–395, 1976. HARVILLE, D.A. Maximum likelihood approaches to variance component estimation and to related problems. Journal of the American Statistical Association, Washington, v. 72, p. 320-328, 1977. HENDERSON, C. R. Selection Index and Expected Genetic Advance. In: Statistical Genetics and Plant Breeding, ed. W. D. Hanson and H. F. Robinson, 141–163. Washington, DC: National Academy of Sciences and National Research Council, Publication No. 982, 1963. HENDERSON, C.R. Best linear unbiased estimation and prediction under a selection 30 model. Biometrics 31: 423-447, 1975. HENDERSON, C.R.; KEMPTHORNE, O.; SEARLE, S.R.; VON KROSIGK, C.M. The estimation of environmental and genetic trends from records subject to culling. Biometrics 15: 192-218, 1959. HOGARTH, D.M. Quantitative inheritance studies in sugarcane. I. Estimation of competition and violation of genetic assumptions on estimation of genetic variance components. Australian Journal of Agricultural Research, v. 28, p. 257-268. 1977. HOGG, R.V.; CRAIG, A.T. Introduction to mathematical statistics, 2ª ed., New York, Macmillan Co., 1965. 388 p. KANG, M.S. 2004. Breeding: Genotype by environment interaction. In Encyclopedia of Plant and Crop Science, ed. R.M. Goodman. New York: Marcel Dekker. KENNEDY, B. W.; SORENSEN, D.A. Properties of mixed model methods for prediction of genetic merit under different genetic models in selected and unselected populations. In: WEIR, B.: GOODMAN, M.M.; NAMKOONG, G. (Ed.). Second International Conference on Quantitative Genetics, Raleigh, 1988. Raleigh: North Carolina State University, 1988. p. 91-103. KOLMODIN, R., E. STRANDBERG, MADSEN, P., JENSEN, J. ; JORJANI, H. Genotype by environment interaction in Nordic dairy cattle studied using reaction norms. Acta Agriculturae, Scandinavica, Section A: Animal. Science. 52:11–24, 2002. KOLMODIN, R.; BIJMA, P. Response to mass selection when the genotype by environment interaction is modeled as a linear reaction norm. Genet. Sel. Evol. v. 36, p. 435-454, 2004. LIN, C.S.; BINNS, M.R. A method of analysing cultivars x location x year experiments: a new stability parameter. Theoretical Applied Genetics, Berlim, v.76, p.425-430, 1988. LITTELL, RAMON C., GEORGE A. MILLIKEN, WALTER W. STROUP, RUSSELL D. WOLFINGER, OLIVER SCHABENBERGER. SAS® for Mixed Models, Second Edition. Cary, NC: SAS Institute Inc, 2006. LYNCH, M.; WALSH, B. Genetics and analysis of quantitative traits. Sunderland: Sinauer Associates, Inc., 1998, 980p. MAIA, M.C.C.; RESENDE, M.D.V.; PAIVA, J.R. de; CAVALCANTI, J.J.V.; BARROS, L. de M.B. Seleção simultânea para produção, adaptabilidade e estabilidade genotípicas em clones de cajueiro, via modelos mistos. Pesquisa Agropecuária Tropical, v.39, p.43-50, 2009. MATSUOKA, S.; GARCIA, A.A.F.; ARIZONO, H. Melhoramento da cana-de-açúcar. In: BOREM, A. (Ed.). Melhoramento de espécies cultivadas. Viçosa: Editora UFV, 2005. p. 225-274. MATTAR, M.; SILVA, L.O.C.; ALENCAR, M.M. ; CARDOSO, F.F.; Genotype by 31 environment interaction for long-yearling weight in Canchim cattle quantified by reaction norm analysis. Journal of Animal Science. v. 89, p. 2349-2355, 2011. MENDES, F.F.; GUIMARÃES, L.J.M.; SOUZA, J.C.; GUIMARÃES, P.E.O.; PACHECO, C.A.P.; MACHADO, J.R.A.; MEIRELLES, W.F.; SILVA, A.R.; PARENTONI, S.N. Adaptability and stability of maize varieties using mixed model methodology. Crop Breeding and Applied Biotechnology, v. 12, p. 111-117, 2012. MEYER, K. Estimation of genetic parameters. In: HILL, W.G.; MACKAY, T.F.C. Evolution and animal breeding, Wallingford: CAB International, 1989. p. 161-167. MI, X.; WEGENAST T.; UTZ, H.F., DHILLON, B.S.; MELCHINGER, A.E. Best linear unbiased prediction and optimum allocation of test resources in maize breeding with doubled haploids. Theoretical and Applied Genetics 123:1-10, 2011. MILLER, P.A.; WILLIAMS, J.C.; ROBINSON, H.F. Variety x environment interactions in cotton variety tests and their implications on testing methods. Agron. J., 51, 132- 134, 1959. MISSIO, R.F.; DIAS, L.A.S.; MORAES, M.L.T.; RESENDE, M.D.V. Selection of Pinus caribaea var. bahamensis progênies based on the predicted genetic value. Crop Breeding and Applied Biotechnology, v. 4, p. 399-407, 2004. MISSIO, R.F.; SILVA, A.M.; DIAS, L.A.S.; MORAES, M.L.T.; RESENDE, M.D.V. Estimates of genetic parameters and prediction of additive genetic values in Pinus kesya progenies. Crop Breeding and Applied Biotechnology, v. 5, p. 394-401, 2005. MORAES, M.A.; VALÉRIO FILHO, W.V.; RESENDE, M.D.V.; SILVA, A.M.; MANOEL, R.O.; FREITAS, M.L.M.; MORAES, M.L.T.; SEBBENN, A.M. Produtividade, estabilidade e adaptabilidade em progênies de Myracrodruon urundeuva F.F. & M.F. Allemão - Anacardiaceae. Scientia Forestalis, Piracicaba, v. 40, n. 93, p. 069-076, 2012. MORELY, J.R.; MATHER, K. Interaction of genotype and environment in continuous variation II. Analysis. Biometric., 14, 481-488, 1958. NUNES, J.A.R.; RAMALHO, M.A.P.; FERREIRA, D.F. Inclusion of genetic relationship information in the pedigree selection method using mixed models. Genet Mol Biol 31:73–78, 2008. OLIVEIRA, R.; RESENDE, M. D. V. ; DAROS, E. ; BESPALHOK FILHO, J. C.; ZAMBON, J. L.; IDO, O.; KOEHLER, Henrique . Genotypic evaluation and selection of sugarcane clones in three environments in the state of Paraná. Crop breeding and applied biotechnology, Viçosa, v. 5, n. 4, p. 426-434, 2005. PAIVA, J.R.; RESENDE, M.D.V.; CORDEIRO, E.R. Índice multiefeitos e estimativas de parâmetros genéticos aplicados ao melhoramento da acerola. Pesquisa Agropecuária Brasileira, v. 37, p. 799 – 807, 2002. PANTER, D.M.; ALLEN, F.L. Using best linear unbiased predictions to enhance breeding for yield in soybean: I Choosing parents. Crop Science, 35:397-405, 1995. PASTRANA VARGAS, I.J.; ESPÍTIA, C.M.; MURILLO, G.O. Evaluación del potencial de 32 mejoramiento genético en el crecimiento en altura de Acacia mangium Willd. Acta Agronómica, v. 61, n. 2, 2012. PATTERSON, H.D.; THOMPSON, R. Recovery of inter-block information when block sizes are unequal. Biometrika 58: 545-554, 1971. PEDROZO, C.A.; BENITES, F.R.G.; BARBOSA, M.H.P.; RESENDE, M.D.V.; SILVA, F.L. Eficiência de índices de seleção utilizando a metodologia REML/BLUP no melhoramento da cana-de-açúcar. Scientia Agraria, v. 10, p. 31-36, 2009. PEGOLO, N.T.; ALBUQUERQUE, L.G.; LÔBO, R.B.; OLIVEIRA, H.N. Effects of sex and age on genotype x environment interaction for beef cattle weight studied using reaction norm models. Journal of Animal Science, v. 89, p. 3410-3425, 2011. PEGOLO, N.T.; OLIVEIRA, H.N.; ALBUQUERQUE, L.G.; BEZERRA, L.A.F.; LÔBO, R.B. Genotype by environment interaction for 450-day weight of Nelore cattle analyzed by reaction norm models. Genetic and Molecular Biology, v. 32, n.2, p. 281-287, 2009. PERKINS, J. M. The principal component analysis of interactions and physical measures of the environment. Heredity, 29, 51-70, 1972. PERKINS, J. M.; JINKS, J. L. Environmental and GE components of variability, IV. Non- linear interactions for multiple inbred lines. Heredity, 23, 525-535, 1968b. PERKINS, J. M.; JINKS, J. L. Environmental and genotype environmental components of variability, III. Multiple lines and crosses. Heredity, 23, 339-356. 1968a. PIEPHO HP, MOHRING J, MELCHINGER AE, BUCHSE A. BLUP for phenotypic selection in plant breeding and variety testing. Euphytica 161:209–228, 2008. PIEPHO, H.P. Stability analysis using SAS, Agronomy Journal, v. 91, p. 154-160, 1999. PINTO Jr, J.E.; STURION, J.A.; RESENDE, M.D.V.; RONZELLI Jr, P.R.; Avaliação simultânea de produtividade, adaptabilidade e estabilidade genotípica de Eucalyptus grandis em distintos ambientes do Estado de São Paulo. Boletim de Pesquisa Florestal, Colombo, n. 53, p. 79-108, 2006. POLLOTT, G.E.; GREEFF, J.C. Genotype x environment interactions and genetic parameters for fecal egg count and production traits of Merino sheep. Journal of Animal Science, Champaign, v. 82, p. 2840-2851, 2004. RAFTERY, A.E.; LEWIS, S.M. Comment: One long run with diagnostics: Implementation strategies for Markov Chain Monte Carlo. Stat. Sci., v. 7, p. 493–497, 1992a. RAFTERY, A.E.; LEWIS, S.M. How many iterations in the Gibbs sampler? In: Bayesian Statistics 4, J. M. Bernardo, J. O. Berger, A. P. Dawid, ; A. F. M. Smith (eds.), p. 763–773. Oxford Univers