Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos

Carregando...
Imagem de Miniatura

Data

2021-05-27

Autores

Vieira, Lucas Vasconcelos

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.
The premise in experiments with repeated measures is that observations taken in the same experimental unit are correlated and that correlations decrease proportionally to the increase in the distance between measurements in time or space. Nevertheless, these experiments are often analyzed as if the correlations between the repeated measures were constant or using methods that only consider correlations different, which may impact on the rejection rate of the null hypothesis, and ultimately type I error rate and statistical power. In this context, the present study investigated the application of mixed linear models with different assumptions about the covariance matrix in data sets from simulated experiments with repeated measures. 84 scenarios that varied in terms of the covariance matrix pattern (14 structures), number of repeated measurements (4 and 8) and sample size (4, 8 and 12) were evaluated. 10,000 datasets were simulated for each scenario based on a multivariate normal distribution and were subsequently analyzed using mixed linear models. Type I error rate and statistical power for the hypothesis test of the interaction between treatments and repeated measures were estimated as the proportion of p values less than or equal to 0.01 or 0.05 out of a total of 10,000 tests for each scenario. The models were also evaluated for their ability to fit the data using Bayesian Information Criteria (BIC). Thus, the frequency with which the covariance structures were chosen by the selection criteria was computed. Results indicate that the assumption chosen most frequently by the information criteria resulted from the specified covariance structure that corresponded to the empirical covariance structure of the analyzed data sets, particularly for those with larger number of repeated measures and sample sizes. Results also indicate that the use of covariance models that do not recognize heterogeneous correlations between repeated measures can inflate type I error or reduce it to very conservative levels, which may affect the conclusion of agricultural experiments. For a 5% significance level, type I error bias was greater than 2α, while for 1% significance level, bias was over 4α. In addition, the statistical power was reduced when the assumption about the covariance matrix of the data sets did not correspond to the empirical covariance structure, particularly for those datasets with a smaller sample size.

Descrição

Palavras-chave

Teste F , Modelos de covariância, Robustez, Dados correlacionados, Erro do tipo I, Poder estatístico, Critérios de seleção, Simulação, F test, Covariance models, Robustness, Correlated data, Type I error, Statistical power, Information criteria, Simulation

Como citar