MARCELA APARECIDA GUERREIRO MACHADO GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DE PROCESSOS MULTIVARIADOS Tese apresentada à Faculdade de Engenharia do Campus de Guaratinguetá, Universidade Estadual Paulista, para a obtenção do título de Doutor em Engenharia Mecânica na área de Transmissão e Conversão de Energia. Orientador: Prof. Dr. Antônio Fernando Branco Costa Co-orientador: Prof. Dr. Fernando Augusto Silva Marins Guaratinguetá 2009 M149g Machado, Marcela Aparecida Guerreiro Gráficos de controle para o monitoramento de processos multivariados / Marcela Aparecida Guerreiro Machado. - Guaratinguetá : [s.n.], 2009. 158f. : il. Bibliografia: f. 134-145 Tese (doutorado) – Universidade Estadual Paulista, Faculdade de Engenharia de Guaratinguetá, 2009. Orientador: Prof. Dr. Antonio Fernando Branco Costa Co-orientador: Prof. Dr. Fernando Augusto Silva Marins 1. Controle de qualidade – Métodos estatísticos I. Título CDU 658.56 UNESP UNIVERSIDADE ESTADUAL PAULISTA Faculdade de Engenharia do Campus de Guaratinguetá "GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DE PROCESSOS MULTIVARIADOS" MARCELA APARECIDA GUERREIRO MACHADO ESTA TESE FOI JULGADA ADEQUADA PARA A OBTENÇÃO DO TÍTULO DE “DOUTORA EM ENGENHARIA MECÂNICA” PROGRAMA: ENGENHARIA MECÂNICA ÁREA: TRANSMISSÃO E CONVERSÃO DE ENERGIA APROVADA EM SUA FORMA FINAL PELO PROGRAMA DE PÓS-GRADUAÇÃO Prof. Dr. Marcelo dos Santos Pereira Coordenador BANCA EXAMINADORA: Prof. Dr. ANTONIO FERNANDO BRANCO COSTA Orientador/UNESP-FEG Profa. Dra. LINDA LEE HO USP-SP Prof. Dr. ROBERTO DA COSTA QUININO UFMG-MG Prof. Dr. MESSIAS BORGES SILVA UNESP-FEG Prof. Dr. UBIRAJARA ROCHA FERREIRA UNESP-FEG Abril de 2009 DADOS CURRICULARES MARCELA APARECIDA GUERREIRO MACHADO NASCIMENTO 14.05.1982 – SÃO PAULO / SP FILIAÇÃO Marcos de Lélis Brandão Machado Maria Sueli Guerreiro Machado 2000/2004 Curso de Graduação em Engenharia de Produção Mecânica FEG - UNESP 2005/2006 Curso de Pós-Graduação em Engenharia Mecânica, nível de Mestrado, na Faculdade de Engenharia do Campus de Guaratinguetá da UNESP 2006/2009 Curso de Pós-Graduação em Engenharia Mecânica, nível de Doutorado, na Faculdade de Engenharia do Campus de Guaratinguetá da UNESP DEDICATÓRIA de modo especial, ao meu marido, aos meus pais e às minhas irmãs, que sempre me incentivaram em todos os momentos. AGRADECIMENTOS Em primeiro lugar agradeço a Deus, fonte de vida e esperança. Ao meu marido Francisco, pelo apoio e cumplicidade. Aos meus pais, Marcos e Maria Sueli, e às minhas irmãs, Mariana e Marilia, que sempre me incentivaram ao longo deste caminho. Ao meu orientador, Prof. Dr. Antônio Fernando Branco Costa pelos ensinamentos transmitidos. Sem a sua orientação, dedicação e auxílio, o estudo aqui apresentado seria praticamente impossível. Ao co-orientador deste trabalho, Prof. Dr. Fernando Augusto Silva Marins pelos conselhos preciosos durante a elaboração dessa pesquisa. Aos professores que participaram da banca examinadora, pelas críticas e sugestões que certamente contribuíram para melhorar o conteúdo deste trabalho. Ao Departamento de Produção, por terem colaborado com a minha formação e pelo convívio sempre agradável. A todos aqueles que, direta ou indiretamente, contribuíram para a realização deste trabalho. À FAPESP, pela concessão da bolsa de doutorado. MACHADO, M. A. G. Gráficos de controle para o monitoramento de processos multivariados. 2009. 158f. Tese (Doutorado em Engenharia Mecânica) – Faculdade de Engenharia do Campus de Guaratinguetá, Universidade Estadual Paulista, Guaratinguetá, 2009. RESUMO Esta tese oferece algumas contribuições à área de monitoramento de processos multivariados. Com respeito ao monitoramento do vetor de médias, investigou-se o desempenho dos gráficos de 2T baseados em componentes principais e também o desempenho dos gráficos de médias utilizados em conjunto, sendo que cada gráfico monitora a média de uma das características de qualidade. Com respeito ao monitoramento da matriz de covariâncias, foi proposta uma nova estatística baseada nas variâncias amostrais (estatística de VMAX). O gráfico de VMAX é mais eficiente do que o gráfico da variância amostral generalizada S , que é o gráfico usual para o monitoramento da matriz de covariâncias. Uma vantagem adicional dessa nova estatística é que o usuário já está bem familiarizado com o cálculo de variâncias amostrais; o mesmo não pode ser dito em relação à variância amostral generalizada S . O desempenho do gráfico de VMAX foi também avaliado quando se utiliza a amostragem dupla, quando se variam os parâmetros do gráfico de controle, quando se adota o esquema de EWMA e quando se aplicam regras especiais de decisão. Investigou-se também o desempenho dos gráficos de controle destinados ao monitoramento simultâneo do vetor de médias e da matriz de covariâncias. PALAVRAS-CHAVE: Gráfico de 2T de Hotelling, variância amostral generalizada S , processos multivariados, vetor de médias, matriz de covariâncias, componentes principais, estatística de VMAX, monitoramento simultâneo MACHADO, M. A. G. Control charts for monitoring multivariate processes. 2009. 158f. Thesis (Doctorate in Mechanical Engineering) – Faculdade de Engenharia do Campus de Guaratinguetá, Universidade Estadual Paulista, Guaratinguetá, 2009. ABSTRACT This thesis offers some contributions to the field of monitoring multivariate processes. Regarding to the monitoring of the mean vector, we investigated the performance of the 2T charts based on principal components and also the performance of the mean charts used simultaneously, where each chart is assigned to control one quality characteristic. Regarding to the monitoring of the covariance matrix, we propose a new statistic based on the sample variances (the VMAX statistic). The VMAX chart is more efficient than the generalized variance S chart, which is the usual chart for monitoring the covariance matrix. An additional advantage of this new statistic is that the user is already well familiar with the calculation of sample variances; we can’t say the same regarding to the generalized variance S statistic. We also studied the performance of the VMAX chart with double sampling, with adaptive schemes, with the EWMA procedure and also with special run rules. We also investigated the performance of the control charts designed for monitoring the mean vector and the covariance matrix simultaneously. KEYWORDS: Hotelling’s 2T control chart, generalized variance S chart, multivariate processes, mean vector, covariance matrix, principal components, VMAX statistic, monitoring simultaneously LISTA DE FIGURAS FIGURA 1 – Gráfico de controle ............................................................................ 31 FIGURA 2 – Gráfico de X - ocorrência de um alarme falso ................................... 33 FIGURA 3 – Gráfico de X - ocorrência de um alarme verdadeiro........................... 33 FIGURA 4 – Gráfico scree-plot (k=2) .................................................................... 48 FIGURA 5 – Gráfico de controle 2T de Hotelling ................................................... 57 FIGURA 6 – Gráfico de controle de VMAX ........................................................... 73 FIGURA 7 – Gráfico de controle de VMAX com amostragem dupla..................... 76 FIGURA 8 – Gráfico de controle de VMAX com amostra de tamanho variável ... 78 FIGURA 9 – Gráfico de VMAX com regra especial de decisão ............................. 82 FIGURA 10 – Gráfico de S com amostra de tamanho variável.............................. 87 FIGURA 11 – Diagrama de probabilidades ............................................................ 89 LISTA DE TABELAS TABELA 1 – Limites de controle ............................................................................ 61 TABELA 2 – Autovalores ( λ ) para o caso bivariado.............................................. 62 TABELA 3 – Autovetores para o caso bivariado..................................................... 62 TABELA 4 – Valores de NMA para os gráficos de 2 T tradicional e de 2 T baseado em componentes principais (p=2 e ρ= 3,0± ) ..................................... 63 TABELA 5 – Valores de NMA para os gráficos de 2 T tradicional e de 2 T baseado em componentes principais (p=2 e ρ= 5,0± ) .................................... 64 TABELA 6 – Valores de NMA para os gráficos de 2 T tradicional e de 2 T baseado em componentes principais (p=2 e ρ= 7,0± ).................................... 65 TABELA 7 – Autovalores ( λ ) para o caso trivariado ............................................. 66 TABELA 8 – Autovetores para o caso trivariado .................................................... 66 TABELA 9 – Valores de NMA para os gráficos de 2 T tradicional e de 2 T baseado em componentes principais (p=3 e 12ρ = 13ρ = 23ρ = 0) ...................... 66 TABELA 10 – Valores de NMA para os gráficos de 2 T tradicional e de 2 T baseado em componentes principais (p=3 e 12ρ = 13ρ = 23ρ = 0,3) ................... 67 TABELA 11 – Valores de NMA para os gráficos de 2 T tradicional e de 2 T baseado em componentes principais (p=3 e 12ρ =0,8, 13ρ =0,5, 23ρ =0,2)........68 TABELA 12 – Valores de NMA para o gráfico de 2 T tradicional e para os gráficos SU X e PC ( 0,0≥ρ ).......................................................................69 TABELA 13 – Valores de NMA para o gráfico de 2 T tradicional e para os gráficos SU X e PC ( 0,0≤ρ ).......................................................................70 TABELA 14 – Valores de NMA para o gráfico de VMAX (p=2, n=5) ................... 97 TABELA 15 – Valores de NMA para os gráficos de VMAX e de S (p=2, ρ=0,5)..................................................................................... .97 TABELA 16 – Valores de NMA para o gráfico de VMAX (p=2; ρ=0,5; n=5; LC=3,668) ........................................................... 97 TABELA 17 – Valores de NMA para o gráfico de VMAX (p=2, n = 4, 1n =2, 2n =8, ρ =0,5) .................................................... 98 TABELA 18 – Valores de NMA para os gráficos de VMAX e de S com amostragem dupla (p=2, n = 4, ρ=0,5)........................................... 99 TABELA 19 – Valores de NMA para os gráficos de VMAX e de S com amostragem dupla (p=2, n = 4, 1n =3, ρ=0,5)................................. .100 TABELA 20 – Valores de NMA para os gráficos de VMAX e de S com amostragem dupla (p=2, n = 5, 1n =3, ρ=0,5)................................. 100 TABELA 21 – Valores de NMA para os gráficos de VMAX e de S com amostragem dupla (p=2, n = 5, 1n =4, ρ=0,5)................................. 101 TABELA 22 – Valores de NMA para os gráficos de VMAX e de S com amostra de tamanho variável (p=2, n = 4, 1n =3)............................ 102 TABELA 23 – Valores de NMA para os gráficos de VMAX e de S com amostra de tamanho variável (p=2, n = 5, 1n =3)............................ 103 TABELA 24 – Valores de NMA para os gráficos de VMAX e de S com amostra de tamanho variável (p=2, n = 5, 1n =4)............................ 104 TABELA 25 – Valores de NMA para os gráficos de S , VMAX-EWMA e V-EWMA (p=2, n=4, r =0,2) .......................................................... 106 TABELA 26 – Valores de NMA para o gráfico de VMAX-EWMA (p=2, n=4) ..... 107 TABELA 27 – Valores de NMA para o gráfico de VMAX-EWMA (p=2, n=5) ..... 107 TABELA 28 – Valores de NMAss para o gráfico de VMAX (p=2; ρ =0,5, n=5, caso I)................................................................. 109 TABELA 29 – Valores de NMAss para o gráfico de VMAX (p=2; ρ =0,5, n=5, caso II) ............................................................... 109 TABELA 30 – Valores de NMAss para o gráfico de VMAX (p=2;L=5; ρ =0,5)............................................................................. 110 TABELA 31 – Valores de NMA para o gráfico de VMAX (p=3, n=5) ................... 111 TABELA 32 – Valores de NMA para os gráficos de VMAX e de S (p=3, 12ρ = 13ρ = 23ρ = 0,5) .................................................................... 111 TABELA 33 – Valores de NMA para os gráficos de VMAX e de S (p=3, 12ρ = 13ρ = 23ρ = 0,5, n=5, LC=3,851).......................................... 111 TABELA 34 – Valores de NMA para o gráfico de VMAX (p=4, n=5) ................... 112 TABELA 35 – Valores de NMA para os gráficos de VMAX e de S (p=4, n=5, 12ρ = 13ρ = 14ρ = 23ρ = 24ρ = 34ρ = 0,5)....................................... 112 TABELA 36 – Valores de NMA para os gráficos de 2 T e S e 2 T e VMAX em uso simultâneo ( ρ =0,0)............................................................... 120 TABELA 37 – Valores de NMA para os gráficos de 2 T e S e 2 T e VMAX em uso simultâneo ( ρ =0,5)............................................................... 120 TABELA 38 – Influência do parâmetro L no desempenho do gráfico MCMAX ( ρ =0,5; matriz de covariâncias muda de 0� para 1� ) ..................... 121 TABELA 39 – Valores de NMA - gráficos simultâneos de 2 T e S e gráfico MCMAX ( ρ =0,0; matriz de covariâncias muda de 0� para 1� ) ..................... 123 TABELA 40 – Valores de NMA - gráficos simultâneos de 2 T e S e gráfico MCMAX ( ρ =0,5; matriz de covariâncias muda de 0� para 1� ) ..................... 123 TABELA 41– Valores de NMA - gráficos simultâneos de 2 T e S e gráfico MCMAX ( ρ =0,7; matriz de covariâncias muda de 0� para 1� ) ..................... 124 TABELA 42 – Valores de NMA - gráficos simultâneos de 2 T e S e gráfico MCMAX ( ρ =0,5; matriz de covariâncias muda de 0� para 2� )..................... 124 TABELA 43 – Valores de Pv para o gráfico de MCMAX (%) ............................... 125 TABELA 44 – Valores de NMA - gráficos simultâneos de 2 T e S e gráfico de R (ρ =0,5; D =0,8; D1=1,0; LC=29,4)................................................... 126 TABELA 45 – Valores de NMA - gráficos simultâneos de 2 T e S e gráfico de R (ρ =0,5; D =1,2; D1=0,75; LC=32,6)................................................. 126 TABELA 46 – Valores de NMA - gráficos simultâneos de 2 T e S e gráfico de R (ρ =0,7; D =2,0; D1=0,7; LC=45,75)................................................. 127 TABELA 47 – Influência do parâmetro D no desempenho dos gráficos de R (ρ =0, 5) ............................................................................................. 128 TABELA 48 – Influência do parâmetro D1 no desempenho dos gráficos de R (ρ =0, 5) ............................................................................................. 129 TABELA 49 – Valores de Pv para os gráficos de R (%) (ρ =0,5; D =1,2; D1=0,75; LC=32,6)................................................ 130 LISTA DE ABREVIATURAS E SIGLAS PC - Componentes principais PCA - Análise de componentes principais (do inglês, Principal Components Analysis) SU X - Simultâneos univariados de X VMAX - Máxima variância EWMA - Média móvel ponderada exponencialmente (do inglês, Exponentially Weighted Moving-Average) LISTA DE SÍMBOLOS iX - Variável de interesse i iμ - Média da variável iX i0μ - Média da variável iX em controle � - Vetor de médias do processo 0� - Vetor de médias com o processo em controle 1� - Vetor de médias do processo após a ocorrência da causa especial iσ - Desvio-padrão da variável iX ijσ = jiσ - Covariância entre iX e jX 2 iσ - Variância de iX ρ - Coeficiente de correlação 0� - Matriz de covariâncias com o processo em controle 2T - Estatística de Hotelling com distribuição de Qui-Quadrado iδ - Deslocamento da média da variável iX em relação ao seu valor-alvo p - Número de variáveis do processo LC - Limite de controle α - Probabilidade de alarme falso – erro do tipo I β - Probabilidade de não-detecção – erro do tipo II d - Raiz quadrada da soma dos quadrados dos deslocamentos das médias das variáveis iX dλ - Parâmetro de não-centralidade do gráfico de controle de 2T X - Média amostral α ′ - Erro total do tipo I ( )21, zzf - Função densidade conjunta de uma distribuição normal bivariada com correlação ρ λ - Autovalor ie - Autovetor LSC - Limite superior de controle LIC - Limite inferior de controle S - Variância amostral generalizada � - Matriz de covariâncias após a ocorrência da causa especial 1� - Matriz de covariâncias após a ocorrência da causa especial 2� - Matriz de covariâncias após a ocorrência da causa especial e com alteração de ρ ia - Aumento do desvio-padrão γ - Magnitude da perturbação ρ′ - Coeficiente de correlação após a ocorrência da causa especial 2 iS - Variância de iX 1n - Tamanho de amostra no primeiro estágio para os gráficos de VMAX e de S com amostragem dupla Tamanho da menor amostra para os gráficos de VMAX e de S com amostra de tamanho variável 2n - Tamanho de amostra no segundo estágio para os gráficos de VMAX e de S com amostragem dupla Tamanho da maior amostra para os gráficos de VMAX e de S com amostra de tamanho variável n - Tamanho da amostra considerando os dois estágios da amostragem n - Número médio de itens inspecionados por amostragem 2 ipS - Variância amostral de iX no primeiro estágio da amostragem 2 isS - Variância amostral de iX no segundo estágio da amostragem pVMAX - Máxima variância amostral no primeiro estágio sVMAX - Máxima variância amostral no segundo estágio LA - Limite de advertência para o gráfico de VMAX com amostragem dupla 1LC - Limite de controle do primeiro estágio para o gráfico de VMAX com amostragem dupla Limite de controle para o gráfico de VMAX com amostra de tamanho variável quando a amostra de tamanho menor está em uso 2LC - Limite de controle do segundo estágio para o gráfico de VMAX com amostragem dupla Limite de controle para o gráfico de VMAX com amostra de tamanho variável quando a amostra de tamanho maior está em uso 0p - Probabilidade de que a amostragem seja interrompida no primeiro estágio Probabilidade condicional de um ponto cair na região central dado que ele não caiu na região de ação quando o gráfico de VMAX com amostra de tamanho variável está em uso 1α - Probabilidade de alarme falso no primeiro estágio 2α - Probabilidade de alarme falso no segundo estágio 1p - Probabilidade de alarme verdadeiro no primeiro estágio para o gráfico de VMAX com amostragem dupla 2p - Probabilidade de alarme verdadeiro no segundo estágio para o gráfico de VMAX com amostragem dupla dp - Probabilidade de alarme verdadeiro 1LA - Limite de advertência para o gráfico de VMAX com amostra de tamanho variável quando a amostra de tamanho menor está em uso 2LA - Limite de advertência para o gráfico de VMAX com amostra de tamanho variável quando a amostra de tamanho maior está em uso r - Constante de amortecimento para os gráficos de VMAX-EWMA e V- EWMA iZ - Estatística do gráfico de VMAX-EWMA p - Vetor de probabilidades iniciais para o gráfico VMAX-EWMA R - Matriz de probabilidades de transição para o gráfico VMAX-EWMA NMA - Número médio de amostras até o sinal 0NMA - Número médio de amostras até o sinal durante o período em controle zsNMA - NMA que mede o tempo necessário para se detectar uma causa especial que esteja presente desde o início do monitoramento ssNMA - NMA que mede o tempo necessário para se detectar uma causa especial que ocorre após um longo e indeterminado período de operação em controle NA - Número de amostras conformes entre ocorrências de amostras não- conformes L - Número máximo de amostras entre amostras não-conformes para que se tenha um alarme no gráfico de controle de VMAX com regra especial de decisão k - Fator de abertura dos limites de controle 1k - Fator de abertura do limite de controle 1LC 2k - Fator de abertura do limite de controle 2LC P - Matriz de probabilidades de transição P* - Matriz de probabilidades de transição dos estados transitórios D´ - Vetor de probabilidades iniciais do gráfico de S com amostra de tamanho variável I - Matriz identidade 1b - Probabilidade de se retirar uma amostra de tamanho 1n , calcular a estatística S e o valor obtido ser inferior ao limite 1LA , ou seja, a próxima amostra deve ser de tamanho 1n 2b - Probabilidade de se retirar uma amostra de tamanho 2n , calcular a estatística S e o valor obtido estar entre os limites 2LA e 2LC , ou seja, a próxima amostra deve ser de tamanho 2n 2 nχ - Distribuição de qui-quadrado com n graus de liberdade 2 2212, nn χρρ χ � � �� � � − - Distribuição de qui-quadrado com n graus de liberdade e com o parâmetro de não-centralidade dado por ( ) 222 1 nχρρ − SUMÁRIO LISTA DE FIGURAS LISTA DE TABELAS LISTA DE ABREVIATURAS E SIGLAS LISTA DE SÍMBOLOS 1 INTRODUÇÃO ............................................................................................. 22 1.1 CONSIDERAÇÕES INICIAIS ..................................................................... 22 1.2 JUSTIFICATIVA E IMPORTÂNCIA.......................................................... 26 1.3 OBJETIVOS.................................................................................................. 27 1.3.1 Objetivo Geral ............................................................................................ 27 1.3.2 Objetivos Específicos.................................................................................. 27 1.4 DELIMITAÇÕES DO TRABALHO............................................................ 27 1.5 CARÁTER INÉDITO ................................................................................... 28 1.6 ORGANIZAÇÃO DO TEXTO..................................................................... 29 2 GRÁFICOS DE CONTROLE...................................................................... 31 2.1 CONSIDERAÇÕES INICIAIS ..................................................................... 31 2.2 ALARMES NO GRÁFICO DE CONTROLE.............................................. 32 2.3 DESEMPENHO DOS GRÁFICOS DE CONTROLE.................................. 34 2.4 GRÁFICOS DE CONTROLE UNIVARIADOS.......................................... 36 2.5 GRÁFICOS DE CONTROLE MULTIVARIADOS .................................... 40 2.5.1 O Vetor de médias e a matriz de covariâncias amostrais ...................... 41 2.5.2 Estimação de parâmetros: vetor de médias, matrizes de covariâncias e de correlação populacionais ............................................ 43 2.5.3 Distribuição normal multivariada ........................................................... 45 2.5.4 Análise de componentes principais .......................................................... 46 2.6 GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DO VETOR DE MÉDIAS ............................................................................ 49 2.7 GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DA MATRIZ DE COVARIÂNCIAS............................................................ 52 3 DESCRIÇÃO DO GRÁFICO DE 2T PADRÃO E DOS GRÁFICOS PROPOSTOS PARA O MONITORAMENTO DO VETOR DE MÉDIAS DO PROCESSO............................................. 56 3.1 CONSIDERAÇÕES INICIAIS ..................................................................... 56 3.2 GRÁFICO DE CONTROLE DE 2T DE HOTELLING ............................... 56 3.3 GRÁFICOS DE CONTROLE DE 2T BASEADOS EM COMPONENTES PRINCIPAIS............................................................. 58 3.4 GRÁFICOS DE X UNIVARIADOS PARA O MONITORAMENTO DE PROCESSOS BIVARIADOS.................................................................. 59 4 ANÁLISE DE DESEMPENHO DO GRÁFICO DE 2T PADRÃO E DOS GRÁFICOS PROPOSTOS PARA O MONITORAMENTO DO VETOR DE MÉDIAS DO PROCESSO ............................................. 61 4.1 CONSIDERAÇÕES INICIAIS ..................................................................... 61 4.2 PROPRIEDADES DOS GRÁFICOS DE CONTROLE DE 2T BASEADOS EM COMPONENTES PRINCIPAIS...................................... 61 4.3 ANÁLISE DE DESEMPENHO DOS GRÁFICOS DE X UNIVARIADOS PARA O MONITORAMENTO DE PROCESSOS BIVARIADOS .............................................................................................. 68 5 DESCRIÇÃO DOS GRÁFICOS PROPOSTOS PARA O MONITORAMENTO DA MATRIZ DE COVARIÂNCIAS E DE ALGUNS ESQUEMAS CONCORRENTES ................................... 71 5.1 CONSIDERAÇÕES INICIAIS ...................................................................... 71 5.2 GRÁFICOS DE CONTROLE PROPOSTOS - CASO BIVARIADO ......... 72 5.2.1 Gráfico da máxima variância (gráfico de VMAX).................................. 72 5.2.2 Descrição do gráfico de VMAX com amostragem dupla........................ 74 5.2.3 Descrição do gráfico de VMAX com amostra de tamanho variável...... 77 5.2.4 Gráfico de EWMA baseado na estatística de VMAX ............................. 79 5.2.5 Gráfico de VMAX com regra especial de decisão ................................... 81 5.3 ESQUEMAS CONCORRENTES – CASO BIVARIADO ........................... 84 5.3.1 Gráfico da variância amostral generalizada S ....................................... 84 5.3.2 Gráfico de S com amostragem dupla proposto por Grigoryan e He (2005) ................................................................................ 84 5.3.3 Gráfico de S com amostra de tamanho variável proposto por Aparisi et al. (2001) ..................................................................................... 86 5.3.4 Gráfico V-EWMA ...................................................................................... 90 5.4 GRÁFICO DE VMAX – CASO MULTIVARIADO ................................... 92 5.5 GRÁFICO DA VARIÂNCIA AMOSTRAL GENERALIZADA S - CASO MULTIVARIADO .............................................................................. 94 6 ANÁLISE DE DESEMPENHO DOS GRÁFICOS PROPOSTOS PARA O MONITORAMENTO DA MATRIZ DE COVARIÂNCIAS E DE ALGUNS ESQUEMAS CONCORRENTES ................................... 95 6.1 CONSIDERAÇÕES INICIAIS ...................................................................... 95 6.2 DESEMPENHO DOS GRÁFICOS PROPOSTOS - CASO BIVARIADO . 96 6.2.1 Gráfico de VMAX....................................................................................... 96 6.2.2 Desempenho do gráfico de VMAX com amostragem dupla .................. 98 6.2.3 Desempenho do gráfico de VMAX com amostra de tamanho variável ........................................................................................................ 101 6.2.4 Desempenho do gráfico de VMAX-EWMA ............................................. 105 6.2.5 Desempenho do gráfico de VMAX com regra especial de decisão ........ 108 6.3 DESEMPENHO DO GRÁFICO DE VMAX - CASO MULTIVARIADO ........................................................................................ 110 7 DESCRIÇÃO DOS GRÁFICOS PROPOSTOS PARA O MONITORAMENTO SIMULTÂNEOS DO VETOR DE MÉDIAS E DA MATRIZ DE COVARIÂNCIAS.......................................................... 113 7.1 CONSIDERAÇÕES INICIAIS ...................................................................... 113 7.2 GRÁFICOS DE 2T E VMAX EM USO SIMULTÂNEO ........................... 114 7.3 GRÁFICO DE MCMAX................................................................................ 115 7.3.1 Propriedades do gráfico de MCMAX....................................................... 116 7.4 GRÁFICOS DE CONTROLE BASEADOS NA ESTATÍSTICA DE QUI-QUADRADO NÃO CENTRAL............................................................ 117 8 ANÁLISE DE DESEMPENHO DOS GRÁFICOS DE CONTROLE DESTINADOS AO MONITORAMENTO SIMULTÂNEO DO VETOR DE MÉDIAS E DA MATRIZ DE COVARIÂNCIAS DE PROCESSOS BIVARIADOS ............................................................... 119 8.1 CONSIDERAÇÕES INICIAIS ...................................................................... 119 8.2 DESEMPENHO DOS GRÁFICOS DE 2T E VMAX .................................. 119 8.3 DESEMPENHO DO GRÁFICO DE MCMAX............................................. 121 8.4 DESEMPENHO DOS GRÁFICOS DE R...................................................... 125 9 CONCLUSÕES E SUGESTÕES PARA PESQUISAS FUTURAS......... 131 9.1 CONCLUSÕES.............................................................................................. 131 9.2 SUGESTÕES PARA PESQUISAS FUTURAS ........................................... 133 REFERÊNCIAS ....................................................................................................... 134 APÊNDICE A – Obtenção do NMA para o gráfico de VMAX – caso bivariado .... 146 APÊNDICE B – Obtenção do NMA para o gráfico de VMAX com amostragem dupla .............................................................................................. 148 APÊNDICE C – Obtenção do NMA para o gráfico de VMAX – caso trivariado.... 150 APÊNDICE D – Obtenção da probabilidade ps de W1 e/ou W2 exceder o limite de controle ......................................................... 153 APÊNDICE E – Obtenção da probabilidade ps de R1 e/ou R2 exceder o limite de controle ......................................................... 156 1 INTRODUÇÃO 1.1 CONSIDERAÇÕES INICIAIS O início formal do controle estatístico de processo se deu por volta de 1924, quando Walter A. Shewhart desenvolveu e aplicou os gráficos de controle na Bell Telephone Laboratories (SHEWHART, 1931). No início, como era de se esperar, poucos acreditaram no potencial desta nova técnica. Pouco a pouco, no entanto, os gráficos de controle ganharam a fama de serem ferramentas poderosas de monitoramento. Quando o gráfico de Shewhart está em uso, amostras de tamanho fixo são retiradas do processo em intervalos regulares. De acordo com os fundamentos estabelecidos por Shewhart, sempre que um ponto é plotado na região de ação do gráfico, o responsável pelo processo deve iniciar uma investigação, visando encontrar causas especiais que afetam a qualidade dos produtos, como por exemplo, um desgaste de ferramenta que altera a dimensão dos eixos que estão sendo manufaturados. Em geral, o desempenho dos gráficos de controle tem sido medido pelo número médio de amostras, NMA, que o gráfico de controle precisa para sinalizar uma alteração no processo (COSTA; EPPRECHT; CARPINETTI, 2005). O gráfico de Shewhart é uma ferramenta de monitoramento simples que não demanda recursos computacionais, portanto bastante oportuna para a época que surgiu. As facilidades computacionais de hoje têm alimentado alterações à idéia original de Shewhart. No caso do monitoramento de processos univariados, as estratégias que vêm sendo propostas, visando melhorar o desempenho dos gráficos de controle, consistem em variar os seus parâmetros de projeto (esquemas adaptativos), alterar o esquema de amostragem e as regras de decisão. A idéia do esquema adaptativo consiste em variar os parâmetros de projeto dos gráficos de Shewhart (tamanho da amostra n, intervalo de tempo entre retirada de amostras h e fator de abertura k dos limites de controle), entre um valor mínimo e um máximo, com base nas informações obtidas após a inspeção da última amostra retirada do 23 processo. Os esquemas adaptativos melhoram o desempenho dos gráficos de controle, quanto à sinalização de desajustes no processo (ver Reynolds et al. (1988); Runger e Pignatiello (1991); Reynolds e Arnold (1989); Runger e Montgomery (1993); Prabhu; Runger e Keats (1993); Costa (1994, 1997, 1998, 1999, 1999a); Costa e De Magalhães (2006); De Magalhães et al. (2001, 2002, 2006); De Magalhães e Moura Neto (2005); Epprecht e Costa (2001); Epprecht; Costa e Mendes (2003, 2005); Michel e Fogliatto (2002)). Uma segunda estratégia para melhorar o desempenho dos gráficos de controle adota esquemas alternativos de amostragem, tais como a amostragem dupla (DAUDIN, 1992) ou a amostragem em dois estágios (COSTA; RAHIM, 2004). Do mesmo modo que os esquemas adaptativos, a amostragem dupla melhora o desempenho dos gráficos de controle. Quando o gráfico de X com amostragem dupla está em uso, a amostragem é realizada em dois estágios, sendo que as amostras de tamanho n são divididas em sub- amostras de tamanho 1n e 2n , tal que n = 1n + 2n . Uma média amostral da sub-amostra de tamanho 1n distante do valor-alvo da média do processo, leva ao segundo estágio da amostragem, onde as 2n unidades restantes são inspecionadas e a média amostral considerando a amostra de tamanho n é calculada e comparada com os limites de controle. De acordo com Costa e Rahim (2004, 2006), quando se tem um processo bastante estável, o monitoramento se torna monótono, pois raramente um valor amostral é plotado fora dos limites de controle. A adoção do gráfico de controle tradicional, neste contexto, tem como conseqüência natural (e negativa) uma tendência do usuário prestar cada vez menos atenção aos procedimentos necessários à obtenção dos valores das estatísticas utilizadas no monitoramento. A média, a variância e a amplitude amostral são exemplos destas estatísticas. Ressalta-se que tal falta de atenção pode levar ao uso indevido do gráfico de controle. Visando a minimização deste problema, Costa e Rahim (2004) propuseram um esquema alternativo de amostragem, isto é, o esquema de amostragem em dois estágios. A amostragem em dois estágios é um caso particular da amostragem dupla, 24 onde 1n =1. A grande vantagem da amostragem em dois estágios é que, durante o período em que o processo permanece isento de causas especiais, a amostragem na maioria das vezes se reduz a inspeção de um único item que, sendo feita por atributos, se torna mais simples e menos monótona. Em uma terceira estratégia, a tomada de decisões é diferente daquela baseada em um único ponto na região de ação do gráfico de controle. O gráfico de Shewhart sinaliza uma deterioração do processo sempre que um ponto cai em sua região de ação. Alternativamente, Wu e Spedding (2000) propuseram um gráfico de controle com regra especial de decisão conhecido como Synthetic Control Chart. O Synthetic Control Chart sinaliza somente quando um segundo ponto cai na região de ação, e sob a condição de que o número de amostras entre os dois pontos que caíram na região de ação não seja superior a um valor inteiro L. O Synthetic Control Chart tem sido objeto recente de pesquisa, ver Wu e Spedding (2000, 2000a), Wu e Yeo (2001), Wu; Yeo e Spedding (2001), Calzada e Scariano (2001), Davis e Woodall (2002), Machado e Costa (2005,2005a), Costa e Rahim (2006a), Costa e Machado (2007) e Costa et al. (2008). O aumento da complexidade e dos níveis de automação dos processos industriais e a crescente disponibilidade de suporte computacional têm alimentado o interesse pelo monitoramento simultâneo de várias características de qualidade, também chamadas de variáveis do processo (LOWRY; MONTGOMERY, 1995). Pouco a pouco as novas estratégias de monitoramento, originalmente propostas para melhorar o desempenho dos gráficos de controle univariados, estão sendo aplicadas ao monitoramento de processos multivariados. Desde que foi criado, o gráfico de controle 2T (HOTELLING, 1947) passou a ser o dispositivo estatístico mais utilizado no monitoramento do vetor de médias de duas ou mais características de qualidade correlacionadas. Lowry e Montgomery (1995) fazem uma revisão dos gráficos de controle multivariados. Mason e Young (2002) discutem exaustivamente as aplicações do gráfico de controle 2T . 25 O gráfico de controle 2T de Hotelling é análogo ao gráfico X de Shewhart, sendo ambos pouco sensíveis a pequenas alterações no processo. Desta forma, métodos estatísticos tais como o esquema CUSUM e o gráfico de EWMA, ver Costa; Epprecht e Carpinetti (2005), têm sido utilizados para o caso multivariado em que o vetor de médias está sujeito a pequenas alterações (ver Woodall e Ncube (1985); Crosier (1988); Pignatiello e Runger (1990); Lowry et al. (1992); Lowry e Montgomery (1995); Prabhu e Runger (1997); Qiu e Hawkins (2001)). A idéia de se variar os parâmetros dos gráficos de controle multivariados (gráficos adaptativos multivariados), tais como o tamanho da amostra e/ou o intervalo de tempo entre retiradas de amostras, tem sido explorada em artigos recentes (ver Aparisi (1996), Aparisi e Haro (2001), Aparisi e Haro (2003), Chou; Chen e Chen (2006)). A amostragem dupla para processos multivariados também tem sido objeto de estudo ((GRIGORYAN; HE, 2005) e (HE; GRIGORYAN, 2005)). Grigoryan (2003) estudou o caso dos gráficos multivariados com amostragens múltiplas obtendo o NMA por meio de simulação. Alternativamente, Machado (2006) e Costa e Machado (2007) obtiveram as propriedades dos gráficos de controle bivariados com amostragem dupla e com regra especial de decisão por meio de desenvolvimentos teóricos. Assim como é importante monitorar o vetor de médias de um processo, é também importante monitorar a sua matriz de covariâncias � (YEH et al., 2003, 2004, 2005; SURTIHADI et al., 2004; GRIGORYAN e HE, 2005). O primeiro gráfico de controle utilizado no monitoramento da matriz de covariâncias � se baseou na estatística obtida do teste da razão de máxima verossimilhança generalizada (ALT, 1985). Para o caso bivariado, Alt (1985) propôs o uso da variância amostral generalizada S para controlar a matriz de covariâncias � . Aparisi et al. (1999) estenderam a aplicação da estatística S para o caso em que o número de variáveis do processo sob monitoramento é maior do que dois (p>2) e, considerando esta mesma estatística, propuseram um gráfico de controle bivariado com amostra de tamanho variável (APARISI et al., 2001). Grigoryan e He (2005) propuseram 26 o gráfico de controle multivariado com amostragem dupla para o monitoramento da matriz de covariâncias. Uma revisão recente de gráficos de controle para o monitoramento da matriz de covariâncias foi elaborada por Yeh et al. (2006). Chang e Zhang (2007) apresentaram uma metodologia para o monitoramento da variabilidade de processos multivariados autocorrelacionados. Artigos que tratam do monitoramento simultâneo do vetor de médias e da matriz de covariâncias são poucos e recentes, ver Khoo (2005), Chen, Cheng e Xie (2005) e Zhang e Chang (2008). 1.2 JUSTIFICATIVA E IMPORTÂNCIA O avanço computacional tem impulsionado o reprojeto dos gráficos de controle. Neste contexto, tem se variado os parâmetros dos gráficos de controle. Seus parâmetros de projeto, em especial o tamanho das amostras, antes fixos, passaram a variar de maneira inteligente, acelerando assim a detecção de mudanças no processo. Nesta mesma linha, visando melhorar o desempenho dos gráficos de controle, novos esquemas de amostragem e critérios de decisão vêm sendo propostos. Surgiu assim uma nova geração dos gráficos de Shewhart. Em se tratando de processos univariados, a literatura sobre este tema é bastante rica. Esta tem sido a linha de pesquisa de Costa (1994, 1997, 1998, 1999, 1999a), Costa e Claro (2007), Costa e Machado (2003, 2003a, 2007, 2008, 2008a), Costa e De Magalhães (2005, 2007), Costa e Rahim (2001, 2004, 2004a, 2006, 2006a) e Costa; De Magalhães e Epprecht (2008). Os trabalhos voltados a processos multivariados são poucos e recentes - ver Bernard (2001), Skinner (2002), Thomas (2002), Konrath (2002), Grigoryan (2003) e Testik (2003) - e, em geral, a complexidade dos modelos tem levado ao uso de técnicas de simulação para a obtenção das propriedades dos gráficos de controle. Por exemplo, Grigoryan (2003) utilizou simulação para estudar o desempenho dos gráficos multivariados com amostragens múltiplas. 27 Esta tese trata do monitoramento de processos multivariados. O foco principal do presente trabalho se voltou para o monitoramento da matriz de covariâncias. Este tema de pesquisa é recente e está em evidência (YEH et al., 2003, 2004, 2005; SURTIHADI et al., 2004; GRIGORYAN e HE, 2005). 1.3 OBJETIVOS 1.3.1 Objetivo Geral Encontrar estatísticas de monitoramento mais eficientes que as de 2T e da variância generalizada S na sinalização de desajustes no vetor de médias e na matriz de covariâncias de processos multivariados. 1.3.2 Objetivos Específicos 1. Propor novas estatísticas para o monitoramento do vetor de médias e da matriz de covariâncias de processos multivariados. 2. Para as estatísticas do item (1) estudar o desempenho dos esquemas EWMA, adaptativos, com amostragem dupla ou com regras especiais de decisão; 3. Comparar a eficiência dos gráficos de controle estudados no item (2) com a eficiência dos gráficos multivariados tradicionais. 1.4 DELIMITAÇÕES DO TRABALHO Os resultados obtidos são válidos apenas para o caso de processos que seguem uma distribuição normal multivariada. Além disso, os valores do vetor de médias e da matriz de covariâncias são supostos conhecidos. 28 1.5 CARÁTER INÉDITO Em relação aos gráficos de controle destinados ao monitoramento do vetor de médias, não há na literatura consultada trabalhos que estudam o desempenho dos gráficos de 2T baseados em componentes principais, ou dos gráficos de controle univariados de X em uso conjunto para o monitoramento de processos multivariados. Nesta tese estudou-se o comportamento de tais gráficos em relação a diferentes tipos de perturbações e correlações. Para o caso do monitoramento da matriz de covariâncias, propõe-se uma nova estatística de monitoramento baseada nas variâncias amostrais, que é muito mais simples de se trabalhar se comparada com a estatística tradicional utilizada no monitoramento da matriz de covariâncias, isto é, a estatística da variância generalizada S . Em relação ao monitoramento simultâneo do vetor de médias e da matriz de covariâncias, propõem-se estatísticas alternativas às estatísticas de 2T e S . Esta tese vem gerando vários artigos nacionais e internacionais. Vale salientar que, até o momento, do total de 11 artigos submetidos, oito já foram aceitos para publicação (COSTA; MACHADO, 2008a, 2009; MACHADO; COSTA, 2008, 2008a; MACHADO; DE MAGALHÃES; COSTA, 2008; MACHADO; COSTA, 2008d; MACHADO; COSTA; RAHIM, 2008; MACHADO; COSTA; MARINS, 2009) e os outros três artigos ainda se encontram em processo de revisão (MACHADO; COSTA, 2008e; COSTA; MACHADO; CLARO, 2008; MACHADO; COSTA; CLARO, 2008). Os artigos aceitos serão publicados nas seguintes revistas internacionais (I) e nacionais (N): International Journal of Production Economics, International Journal of Advanced Manufacturing Technology, Pesquisa Operacional, Communications in Statistics e Produção, que segundo a avaliação Qualis-Engenharia III da Capes, são classificadas como A (I), A (I), B (I), B (I) e A (N), respectivamente. 29 1.6 ORGANIZAÇÃO DO TEXTO A tese está estruturada em nove capítulos. Neste primeiro capítulo foi apresentado um breve histórico sobre os gráficos de controle, as justificativas para a escolha do tema, os objetivos, as delimitações do trabalho, seu caráter inédito e a seguir descreve-se a organização do texto. O Capítulo 2 é dedicado aos gráficos de controle univariados e multivariados, apresentando de forma detalhada as pesquisas realizadas até o momento na área de controle estatístico de processo. O Capítulo 3 é dedicado à descrição dos gráficos de 2T baseados em componentes principais e, dando continuidade ao estudo dos gráficos de controle para o monitoramento do vetor de médias, neste mesmo capítulo são apresentados os gráficos univariados de X para o monitoramento de processos multivariados. Os principais resultados obtidos com a utilização dos gráficos de 2T baseados em componentes principais e dos gráficos univariados de X se encontram no Capítulo 4. O Capítulo 5 trata dos gráficos de controle baseados na estatística da máxima variância, VMAX, proposta para o monitoramento da matriz de covariâncias de processos multivariados. No Capítulo 6 o desempenho dos gráficos de controle propostos é comparado com o dos esquemas concorrentes. O Capítulo 7 trata dos gráficos de controle destinados ao monitoramento simultâneo do vetor de médias e da matriz de covariâncias de processos bivariados. No Capítulo 8 o desempenho dos gráficos de controle propostos para o monitoramento simultâneo do vetor de médias e da matriz de covariâncias é comparado com o dos gráficos de 2T e S . No Capítulo 9 estão as conclusões e sugestões para futuras pesquisas. No Apêndice A está o desenvolvimento matemático necessário para a obtenção do NMA do gráfico de VMAX para o caso de processos bivariados. 30 O Apêndice B apresenta o desenvolvimento matemático necessário para a obtenção do NMA do gráfico de VMAX com amostragem dupla para o caso de processos bivariados. No Apêndice C está o desenvolvimento matemático necessário para a obtenção do NMA do gráfico de VMAX para processos trivariados. Esse desenvolvimento pode ser facilmente estendido para o caso em que p > 3. O Apêndice D apresenta o desenvolvimento matemático necessário para a obtenção do NMA do gráfico de MCMAX, cujos pontos amostrais correspondem ao maior valor em módulo de quatro medidas das duas características de qualidade sob monitoramento, isto é, as suas médias e variâncias amostrais padronizadas. No Apêndice E está o desenvolvimento matemático necessário para a obtenção do NMA dos gráficos de controle baseados na estatística de monitoramento proposta por Costa e Rahim (2004a), denominados gráficos de R. 31 2 GRÁFICOS DE CONTROLE 2.1 CONSIDERAÇÕES INICIAIS Os gráficos de controle são dispositivos que operam em um estado de controle estatístico (processo sob controle), contudo estão sujeitos a causas especiais que o desajustam. O esquema de monitoramento de Shewhart (1931) para variáveis mensuráveis X, consiste em se retirar, a intervalos de tempos regulares de comprimento 0h , amostras de tamanho 0n . Para cada amostra é determinado o valor de uma estatística G adequada. Então estes valores são plotados em cartas onde estão especificados limites de controle (LIC é o limite inferior de controle e LSC é o limite superior de controle), cujo espaçamento em relação à linha central, LC, é estabelecido com base na variabilidade natural das medidas de X de uma característica de qualidade de produto estimada com o processo em controle (vide Figura 1). Figura 1: Gráfico de controle G LSC LC LIC Número da amostra 32 As causas especiais alteram a distribuição da variável aleatória X, tirando sua média do valor-alvo e/ou aumentando a sua variabilidade (COSTA; EPPRECHT; CARPINETTI, 2005). Máquinas ajustadas ou controladas de maneira inadequada, erros do operador, ou matéria-prima defeituosa são exemplos de causas especiais. As causas especiais fazem com que os valores da estatística G se afastem da linha central do gráfico de controle. Deste modo, a presença de uma causa especial é sinalizada por um valor de G além dos limites de controle. Neste capítulo serão estudadas as propriedades dos gráficos de controle de Shewhart univariados e multivariados. Antes, porém, serão definidos os riscos estatísticos inerentes ao monitoramento de processos por meio de gráficos de controle. As figuras da próxima seção foram adaptadas de Costa; Epprecht e Carpinetti (2005). 2.2 ALARMES NO GRÁFICO DE CONTROLE Considere o gráfico de controle das médias X . Quando o processo está em um estado de controle estatístico, tem-se o risco α de um valor de X cair fora dos limites de controle, sinalizando indevidamente uma causa especial (“alarme falso”). A Figura 2 retrata a ocorrência de um alarme falso no gráfico de X . Quando o processo está fora de controle, portanto sob a influência de uma causa especial, tem-se o risco β de um valor de X cair dentro dos limites de controle, não sinalizando assim a existência da causa especial. A Figura 3 retrata a ocorrência de um alarme verdadeiro no gráfico de X . 33 Figura 2: Gráfico de X - ocorrência de um alarme falso Figura 3: Gráfico de X - ocorrência de um alarme verdadeiro A conseqüência de ordem prática associada ao erro do tipo I (alarme falso) é de uma intervenção no processo na hora errada, quando o mesmo está isento de causas especiais 15 30 45 60 75 90 105 Minutos )n/;(N~);(N~X 00XX σμσμ LM = μ0 nkLSC /00 σμ += Alarme falso nkLIC /00 σμ −= h = 15 min 0 δσ 15 30 45 60 75 90 Minutos nkLSC /00 σμ += )n/;(N~);(N~X 000XX σδσ+μσμ Alarme verdadeiro 00 δσμμ += nkLIC /00 σμ −= 0μ=LM 34 (o que em si já acarreta um custo – de interrupção do processo, de mão-de-obra – além de um risco de desajustar um processo que estava ajustado); e a conseqüência de ordem prática associada ao erro do tipo II (“não-detecção”) é a não intervenção no processo na hora certa, quando o mesmo está sob a influência de causas especiais. Em geral, as causas especiais comprometem a qualidade dos itens produzidos, portanto quanto antes forem descobertas e eliminadas melhor. 2.3 DESEMPENHO DOS GRÁFICOS DE CONTROLE Com base na relação entre os custos de operação e a habilidade do dispositivo estatístico em detectar causas especiais, pode-se determinar a melhor combinação dos parâmetros dos gráficos de controle, ou seja, o tamanho da amostra n, o intervalo de tempo h entre retirada de amostras e o fator k de abertura dos limites de controle - ver Costa; Epprecht e Carpinetti (2005). O desempenho dos gráficos de controle é medido pelo número médio de amostras até o sinal (NMA), para intervalo de tempo fixo entre amostras. Esta medida de desempenho, por sua vez, depende dos parâmetros de projeto do gráfico de controle n, h e k. Os parâmetros de projeto influenciam de forma diferente no desempenho dos gráficos de controle, nos riscos α e β e no custo de inspeção (COSTA; MACHADO, 2003, 2003a). Durante o período em controle o NMA=1/α e é denominado 0NMA e, durante o período fora de controle, NMA=1/pd, sendo pd = 1- β. Quando um processo está sob controle, é desejável que o número médio de amostras retiradas do processo desde o início do monitoramento até o sinal (NMA0) seja grande, de modo a garantir poucos alarmes falsos. Quando um processo está fora de controle, é desejável que o número médio de amostras retiradas desde a ocorrência de uma causa especial até o sinal (NMA) seja pequeno, de modo a garantir uma rápida detecção da causa especial. Para n=2 e k=3,00, são necessárias 17,81 amostras em média para detectar uma causa especial que desloca a média do processo de um desvio-padrão (δ=1). 35 Por exemplo, no processo de empacotamento de leite, se o volume X de cada pacote tem média 0μ de 1000 ml e desvio-padrão 0σ de 10 ml, trata-se então de uma causa especial que desloca a média para 990 ml ou 1010 ml. Se aumentarmos n para 5 o NMA se reduz a 4,47 (ver detalhes em Costa; Epprecht e Carpinetti (2005)). Desta forma, observa-se que o aumento do tamanho da amostra melhora o desempenho do gráfico, ou seja, aumenta o poder em se detectar um desajuste do processo. Conseqüentemente, o risco β diminui. Porém, o custo de inspeção se eleva com o aumento do tamanho da amostra. O risco α independe de n. Já o aumento de k tem um impacto negativo sobre o desempenho dos gráficos, pois diminui o seu poder. Em contrapartida, reduz-se a incidência de alarmes falsos, ou seja, o risco α diminui. Quanto ao h, deve-se ter sempre em mente o seguinte: valores pequenos de h implicam em custos elevados com amostragens e maior incidência de alarmes falsos. Antes de se aprofundar na escolha dos valores dos parâmetros do gráfico de controle é preciso investigar se as condições do processo a ser monitorado satisfazem as suposições necessárias para a utilização do gráfico, isto é, se as observações da característica de qualidade de interesse são independentes e normalmente distribuídas. A suposição mais importante relativa aos gráficos de controle é a de independência das observações, porque os gráficos de controle convencionais não funcionam bem se a característica de qualidade apresenta níveis, ainda que baixos, de autocorrelação ao longo do tempo. Especificamente, esses gráficos de controle darão resultados enganosos sob a forma de demasiados alarmes falsos se os dados são autocorrelacionados (MONTGOMERY, 2004). Este aspecto tem sido enfatizado por vários autores, incluindo Russo e Camargo (2004), Moreira e Echeveste (2004), Moreira e Caten (2004), Machado (2005), Claro; Costa e Machado (2007) e Costa e Claro (2007). Infelizmente, a suposição de observações independentes nem sempre é satisfeita em alguns processos de fabricação. Como exemplo podem-se citar processos químicos em 36 que medidas consecutivas de uma variável do processo, ou uma característica do produto, apresentam não raramente alto nível de autocorrelação (MONTGOMERY, 2004). De fato, Shewhart ao criar os gráficos de controle, estava considerando indústrias de partes discretas, com nenhum ou quase nenhum grau de automação. Em tais processos, a condição de independência das observações geralmente é satisfeita. Hoje em dia, porém, processos contínuos e por batelada são extremamente freqüentes e, muitos desses processos, raramente produzem observações independentes, de modo que não podem ser monitorados pelos gráficos convencionais. Este problema não se restringe a processos contínuos e por bateladas: processos discretos altamente automatizados também costumam produzir dados autocorrelacionados (COSTA; EPPRECHT; CARPINETTI, 2005). Portanto, é importante antes de iniciar o monitoramento de um processo, identificar se ele produz itens nos quais as observações da característica de qualidade de interesse são independentes ou autocorrelacionadas, pois um gráfico de controle inadequado, que produza alarmes falsos em excesso, acabará sendo descartado, ou pior, mantido apenas para cumprir alguma exigência formal. Os alarmes são simplesmente ignorados pelo pessoal envolvido com o processo. Vale ressaltar também a importância de se analisar a capacidade de um processo, isto é, sua capacidade de produzir itens conformes, ou seja, de acordo com as especificações do projeto. Essa capacidade depende dessas próprias especificações e da variabilidade do processo; portanto, ela não está apenas vinculada à presença ou ausência de causas especiais, embora seja evidente que desajustes e/ou falta de estabilidade do processo (provocados por causas especiais) reduzem sua capacidade e aumentam o número de itens não conformes produzidos (COSTA; EPPRECHT; CARPINETTI, 2005). 2.4 GRÁFICOS DE CONTROLE UNIVARIADOS Os gráficos de controle têm sido a principal ferramenta estatística utilizada no monitoramento de processos, graças a sua simplicidade operacional. De acordo com os 37 fundamentos de Shewhart, sempre que um ponto é plotado na região de ação do gráfico, o responsável pelo processo deve iniciar uma investigação, visando encontrar causas especiais que afetam a qualidade dos produtos. Por exemplo, a ocorrência de um desgaste de ferramenta alterará o diâmetro X dos eixos que estão sendo manufaturados. Entretanto, essa simplicidade torna o gráfico de controle lento na detecção de pequenas e moderadas alterações nos parâmetros dos processos que estão sendo monitorados, isto é, na média e/ou na variância da variável aleatória X. Diante disso, não têm sido poucas as propostas de alteração à idéia original de Shewhart como, por exemplo, variar os parâmetros dos gráficos de controle, alterar o esquema de amostragem e as regras de decisão (Wu e Spedding (2000) e Machado e Costa (2005, 2005a)). A idéia de variar os parâmetros dos gráficos de controle univariados (gráficos adaptativos), tais como o tamanho de amostra e/ou o intervalo de tempo entre retirada de amostras, tem sido bastante explorada. Reynolds et al. (1988), Reynolds e Arnold (1989), Runger e Pignatiello (1991), Runger e Montgomery (1993) e Reynolds e Stoumbos (2001) estudaram o caso em que o intervalo entre retirada de amostras é variável (VSI – Variable Sampling Interval). Quando os gráficos de controle com intervalo variável de tempo entre retirada de amostras estão em uso a ocorrência de uma observação na região central do gráfico não levanta suspeitas de que o processo esteja desajustado; conseqüentemente, o monitoramento é relaxado e um intervalo de tempo maior que o usual é adotado para a retirada da próxima amostra. Por outro lado, a ocorrência de uma observação na região de advertência do gráfico de controle levanta suspeita de que o processo se desajustou; conseqüentemente, a próxima amostra é retirada o mais breve possível visando confirmar ou não tal suspeita. Mantendo a mesma freqüência de inspeção durante o período em que o processo permanece ajustado, o gráfico VSI demanda, em média, menos amostras para sinalizar um desajuste. De forma análoga é possível variar os demais parâmetros dos gráficos de controle. A idéia do gráfico de controle com amostra de tamanho variável (VSS – Variable Sample Size) foi introduzida por Prabhu; Runger e Keats (1993) e Costa (1994). Prabhu; 38 Montgomery e Runger (1994) e Costa (1997, 1999) abordaram também o caso em que tanto o tamanho de amostra como o intervalo entre retiradas de amostras são variáveis (VSSI – Variable Sampling Size Interval). Costa (1998,1999a) estendeu o estudo do gráfico de controle VSSI e incluiu limites de ação variáveis, sendo este gráfico denominado gráfico de controle VP (Variable Parameters). Assim como o esquema adaptativo, o gráfico de controle com amostragem dupla proposto por Daudin (1992), foi criado para atender a necessidade de se ter uma ferramenta estatística ágil na detecção de alterações nos parâmetros do processo. Quando o gráfico de controle X com amostragem dupla está em uso a amostragem é realizada em dois estágios com amostras de tamanho n , sendo n = 1n + 2n . Se para a sub-amostra de tamanho 1n obtém-se um valor de X distante de 0μ , a amostragem vai para o segundo estágio, onde as 2n unidades restantes são inspecionadas e a média amostral considerando a amostra de tamanho n é calculada e comparada com os limites de controle. Caso contrário, a amostragem é interrompida no primeiro estágio. A amostragem em dois estágios é um caso particular da amostragem dupla, onde 1n =1. Quando se tem um processo bastante estável, isto é, com média e variância que permanecem longos períodos de tempo sem se alterarem, o monitoramento se torna bastante monótono, pois raramente um valor de X , ou de R, cai fora dos limites de controle. A conseqüência natural é de o usuário dar cada vez menos atenção aos passos necessários para a obtenção dos valores de X e de R. Esta falta de atenção pode, em alguns casos, levar a sérios enganos. A amostragem em dois estágios (COSTA; RAHIM, 2004, 2006) torna o monitoramento mais simples e menos monótono. No primeiro estágio, um item da amostra é inspecionado e seu valor de X é comparado com os limites do gráfico de Shewhart para observações individuais. Deste modo, se o ponto X cair dentro dos limites de controle a amostragem é interrompida; caso contrário, segue-se para o segundo estágio, quando então toda amostra é inspecionada e sua média X é agora comparada com os limites do gráfico de Shewhart para médias (podendo também ser calculada a sua 39 amplitude R, para então ser comparada com os limites do gráfico de Shewhart para as amplitudes). Quando a amostragem em dois estágios está em uso, no primeiro estágio é possível trabalhar com atributos e, desta forma, reduzir o esforço com inspeção. O gráfico de controle das médias móveis ponderadas exponencialmente (EWMA) foi introduzido por Roberts (1959) com o objetivo de se ter uma ferramenta ágil na detecção de pequenas perturbações na média do processo. Desde então, o gráfico de controle de EWMA vem sendo muito estudado (ver Lucas e Saccucci (1990), Saccucci e Lucas (1990), Domangue e Patch (1991), Chen et al. (2001), Costa e Rahim (2006b)). O gráfico de Shewhart sinaliza uma deterioração do processo quando um ponto cai em sua região de ação. Alternativamente, Wu e Spedding (2000) propuseram um gráfico de controle com regra especial de decisão conhecido como Synthetic Control Chart. O Synthetic Control Chart sinaliza somente quando um segundo ponto cai na região de ação, e sob a condição de que o número de amostras entre os dois pontos que caíram na região de ação não seja superior a um valor inteiro L. O Synthetic Control Chart tem sido objeto recente de pesquisa, ver Wu e Spedding (2000, 2000a), Wu e Yeo (2001), Wu; Yeo e Spedding (2001), Calzada e Scariano (2001), Davis e Woodall (2002), Machado e Costa (2005,2005a), Costa e Rahim (2006a) e Costa et al. (2008). É comum o uso de dois gráficos de controle, um para o monitoramento da média do processo e outro para o monitoramento da variabilidade, ver Costa (1993), Gan (1995), Albin; Kang e Sheha (1997), Costa (1998 e 1999), Costa e Rahim (2000, 2001), Rahim e Costa (2000), Costa e Rahim (2004) e Costa; Epprecht e Carpinetti, (2005). A principal conclusão que pode ser tirada de todos esses estudos é que gráficos conjuntos não são confiáveis na identificação do tipo de causa especial. Na prática, a velocidade com a qual os gráficos de controle detectam mudanças no processo parece ser mais importante do que a habilidade destes em identificar o tipo de mudança. Deste modo, faz sentido considerar um único gráfico de controle, baseado em uma única estatística, para o monitoramento simultâneo da média e da variância do processo, ver Domangue e Patch (1991), Chen; Cheng e Xie (2001, 2004), Costa e Rahim 40 (2004a, 2006), Costa e De Magalhães (2005), Costa; Epprecht e Carpinetti (2005), Barbosa; Machado e Costa (2005). A combinação da regra de decisão de dois pontos na região de ação e de uma estatística única para o monitoramento da média e da variabilidade do processo tem sido objeto de estudo de vários pesquisadores, ver Machado e Costa (2005,2005a). O objetivo é monitorar o processo de forma a detectar qualquer causa especial que altere a sua média μ de 0μ para 001 δσμμ ±= , onde 0≠δ , e/ou altere o seu desvio-padrão σ de 0σ para 01 γσσ = , onde 1>γ . Sejam ,...3,2,1 , =ixij , e nj ,...,2,1= as observações da variável X organizadas em sub-grupos de tamanho n > 1, com i indexando o número do grupo. Seja nXXX inii /)...( 1 ++= a i-ésima média amostral, e seja 0μ−= ii Xe a diferença entre a i-ésima média amostral e o valor alvo da média do processo. Então para � <− ≥ = 0e se , 0e se , i i D D iξ , tem-se que: ,...,iXR n j iiji 21 ,)( 1 2 00 =� +−= = σξμ onde D é uma constante positiva. Quando D=0, 2 0 )/(γσiR tem distribuição de qui- quadrado não-central com n graus de liberdade e um parâmetro de não-centralidade 22 /γδλ nd = , ou seja )(~)/( 22 0 dniR λχγσ , ver Chen; Cheng e Xie (2004). O uso da estatística de Qui-quadrado não-central para controlar a média e a variância do processo tem sido também objeto de estudo de Costa e Rahim (2004a, 2006, 2006a, 2006b), Costa e De Magalhães (2005, 2007), Machado e Costa (2005, 2005a), Barbosa; Machado e Costa (2005) e Costa; De Magalhães e Epprecht (2008). 2.5 GRÁFICOS DE CONTROLE MULTIVARIADOS Até agora foram discutidos os gráficos de controle univariados. Porém, o aumento da complexidade e dos níveis de automação dos processos industriais e a crescente disponibilidade de suporte computacional, têm aumentado o interesse pelo monitoramento simultâneo de várias características de qualidade, também chamadas de variáveis do processo (LOWRY; MONTGOMERY, 1995). Pouco a pouco as novas estratégias de 41 monitoramento para processos univariados estão sendo estendidas ao monitoramento de processos multivariados. Antes de discutir as estratégias de monitoramento para processos multivariados, são apresentadas na seção 2.5.1 algumas notações e definições de vetores aleatórios, matrizes de covariância e de correlação utilizados no controle estatístico de processos multivariados. Na seção 2.5.2 estão as equações para estimação das matrizes de covariâncias e de correlação através de dados amostrais; na seção 2.5.3 apresenta-se a distribuição normal multivariada e na seção 2.5.4 estão alguns conceitos relacionados à técnica de análise de componentes principais. 2.5.1 O vetor de médias e a matriz de covariâncias amostrais Seja X um vetor contendo p componentes, onde cada componente é uma variável aleatória, isto é, Xi é uma variável aleatória onde i = 1, 2, ..., p. Então, X é chamado de vetor aleatório e é denotado por: � � � � � � � � � � � � � = pX X X X � 2 1 O vetor transposto de vetor aleatório X é denotado por ] ... [ 321 pXXXXX =′ . O vetor )(XE=μ é chamado de vetor de médias do vetor ] ... [ 321 pXXXXX =′ , sendo � � � � � � � � � � � � � � � ⋅ ⋅ ⋅= � � � � � � � � � � � � � � � � � � � ⋅ ⋅ ⋅ == p pXE XE XE XE μ μ μ μ )( )( )( )( 2 1 2 1 onde )( ii XE=μ denota a média, ou esperança, da variável aleatória Xi, i = 1, 2, ..., p. 42 A variância do i-ésimo componente do vetor X é denotada por iiiiXVar σσ == 2)( . O desvio-padrão é denotado por iσ ou iiσ e fornece a informação sobre a dispersão dos valores das variáveis Xi em relação a iμ , isto é, indica se os valores de Xi estão próximos ou distantes da média iμ . Assim, valores grandes de iσ indicam uma maior dispersão de valores de Xi em relação à média iμ . A covariância entre os valores da i-ésima e j-ésima variáveis do vetor X é definida por: )])([(),( jjiiijji XXEXXCov μμσ −−== (2.1) A covariância serve para medir o grau de relacionamento linear entre duas variáveis aleatórias. De acordo com a expressão (2.1), quando os valores de Xi acima (abaixo) da média iμ tendem a estar associados aos valores de Xj acima (abaixo) da média jμ , a covariância ijσ tende a ser positiva. Portanto, à medida que a variável Xi cresce (decresce) numericamente, a variável Xj também cresce (decresce) linearmente. Quando os valores de Xi acima da média iμ tendem a estar associados com valores de Xj abaixo da média jμ , ou vice-versa, a covariância ijσ tende a ser negativa. Neste caso, à medida que a variável Xi cresce (decresce) numericamente, a variável Xj decresce (cresce) linearmente. Embora a covariância tenha informação sobre o relacionamento linear entre duas variáveis, é difícil julgar se a relação é forte ou não, observando-se apenas os seus valores numéricos uma vez que não se tem um valor de referência mínimo ou máximo para comparação dos valores ijσ . Assim, uma medida mais útil na prática é a correlação. (MINGOTI, 2005). É prática comum apresentar os valores de ijσ em uma matriz chamada matriz de covariâncias. A matriz de variâncias e covariâncias do vetor aleatório X é denotada por: � � � � � � � � � � � � � =�= pppp p p pxpXCov σσσ σσσ σσσ )( 21 22221 11211 � ���� � � . 43 A título de ilustração, a matriz � � �� � − −=� 5 2 2 8 22 x representa a matriz de covariâncias de um vetor aleatório [ ]21 XXX =′ , tal que 11σ = 2 1σ = 8; 22σ = 2 2σ = 5; 12σ = 21σ = -2. O coeficiente de correlação entre a i-ésima e j-ésima variáveis do vetor X é definido por: ji ij ijii ij ij σσ σ σσ σ ρ == onde 11 ≤≤− ijρ , i = 1, 2, ..., p. A correlação é uma medida mais adequada para avaliar o grau de relacionamento linear entre duas variáveis aleatórias do que a covariância, pois seus valores estão sempre entre -1 e 1. Assim quanto mais próximo de 1, maior é o relacionamento linear positivo entre as variáveis Xi e Xj e quanto mais próximo de -1, maior o relacionamento linear negativo entre as variáveis. Uma correlação próxima de zero é uma indicação numérica de um não-relacionamento linear entre as variáveis em questão. Quando se têm muitas variáveis, o procedimento mais comum é apresentar os valores de ijρ em uma matriz chamada de matriz de correlação. 2.5.2 Estimação de parâmetros: vetor de médias, matrizes de covariâncias e de correlação populacionais Na prática, as matrizes de covariâncias e de correlação teóricas precisam ser estimadas através de dados amostrais. Assim, supondo que se dispõe de uma amostra aleatória de tamanho n, onde, para cada elemento da amostra, tenha-se observado os valores de p-variáveis aleatórias de interesse, ou seja, têm-se n vetores aleatórios independentes e identicamente distribuídos da forma: 44 � � � � � � � � � � � � � = 1 21 11 1 pX X X X � � � � � � � � � � � � � � = 2 22 12 2 pX X X X � , ... , � � � � � � � � � � � � � = pn n n n X X X X � 2 1 sendo que o primeiro índice indica a variável e o segundo o elemento amostral. O vetor de médias μ será estimado pelo vetor de médias amostrais X definido por: [ ] � � � � � � � � � � � � � =++= p n X X X XXX n X � � 1 2 1 21 onde iX é a média amostral da i-ésima variável, i = 1, 2, ..., p. A matriz de covariâncias pxp � será estimada pela matriz de covariâncias amostrais p xpS definida por: � � � � � � � � � � � � � = pppp p p pxp SSS SSS SSS S 21 22221 11211 � ���� � � sendo jiij SS = , ij ≠ e iiS definidos respectivamente por: ( ) 1 1 2 − � − = = n XX S n l iil ii que é a variância amostral da i-ésima variável, ( )( ) 1 1 − � −− = = n XXXX S n l jjliil ij que é a covariância amostral entre a i-ésima e j-ésima variáveis. A matriz de correlação teórica pxpP será estimada pela matriz de correlação amostral pxpR definida por: � � � � � � � � � � � � � = pppp p p pxp RRR RRR RRR R 21 22221 11211 � ���� � � 45 onde jjii ij pxp SS S R = é o coeficiente de correlação amostral entre as i-ésima e j-ésima variáveis, conhecido como coeficiente de correlação de Pearson (MINGOTI, 2005). 2.5.3 Distribuição normal multivariada A distribuição normal multivariada é uma generalização da normal univariada para o caso no qual se trabalha com duas ou mais variáveis aleatórias simultaneamente. A distribuição normal univariada com média μ e variância 2σ tem densidade de probabilidades dada por: ( ) �� � � � �� � � � � � � � −− = 2 2 1 2 1 σ μ σπ x expxf . No caso de um vetor aleatório de dimensão p, ou seja, ] ... [ 321 pXXXXX =′ diz-se que este vetor tem uma distribuição normal p-variada, e denota-se ( )pxpNX ,~ �μ , se a função densidade de probabilidade de X for dada por: ( ) ( ) ( ) ( ) � � � � −�′ − − � = − μμ π xxexpxxxf pp 1 21221 2 1 2 1 ,,, � . A quantidade ( ) ( )μμ −�′ − − xx 1 é referida como a distância de Mahalanobis do vetor x ao vetor de médias μ . Ela também é denominada de distância padronizada ou distância estatística (MINGOTI, 2005). Quando p = 2, tem-se a distribuição normal bivariada. Nesse caso, a função densidade do vetor [ ]21 XXX =′ é dada por: ( ) ( ) ( ) ( ) � � � � −�′ − − � = − μμ π xxexpxxf 1 2121 2 1 2 1 , , � � � � � � � = � � � � � � � =� 2 221 21 2 1 22 21 12 11 σσρσ σρσσ σσ σσ 46 sendo ρ o coeficiente de correlação entre X1 e X2, 11 <<− ρ , ( )22 2 2 1 1 ρσσ −=� . Quando ρ =0, a função ( )21, xxf é o produto de duas densidades normais univariadas e, logo, as variáveis X1 e X2 são independentes, isto é, ( ) ( ) ( )2121 , xgxgxxf = onde, ( ) ( ) �� � � � �� � �� � � �� � � −− = 2 1 11 1 1 2 1 2 1 σ μ σπ x expxg ( ) ( ) �� � � � �� � �� � � �� � � −− = 2 2 22 2 2 2 1 2 1 σ μ σπ x expxg Portanto, no caso da distribuição normal bivariada, se X1 e X2 forem não correlacionadas também serão independentes (MINGOTI, 2005). 2.5.4 Análise de componentes principais O objetivo principal da técnica de análise de componentes principais (PCA – Principal Components Analysis) é o de explicar a estrutura de variância e covariância de um vetor aleatório, composto de p variáveis aleatórias 1X , 2X ,…, pX , através da construção de combinações lineares das variáveis originais. Estas combinações lineares são chamadas de componentes principais e são não correlacionadas entre si. Se existem p variáveis originais é possível obter p componentes principais. No entanto, em geral deseja-se obter redução do número de variáveis a serem avaliadas e interpretação das combinações lineares construídas, ou seja, a informação contida nas p variáveis originais é substituída pela informação contida em k (k < p) componentes principais não correlacionadas (MINGOTI, 2005). Considere as seguintes combinações lineares: pp XeXeXeY 121211111 +++=′= �Xe 47 pp XeXeXeY 222212122 +++=′= �Xe (2.2) � � ppppppp XeXeXeY +++=′= �2211Xe onde Var )( iY = iii λ=′�ee pi ,,2,1 �= (2.3) Cov ),( ki YY = 0=′ ki�ee pki ,,2,1, �= (2.4) sendo � a matriz de covariâncias do vetor aleatório X′ =[ 1X , 2X ,…, pX ] e ( )ii e,λ , os autovalores-autovetores de � , com 021 ≥≥≥≥ pλλλ � . As componentes principais são aquelas combinações lineares 1Y , 2Y ,…, pY não correlacionadas entre si cujas variâncias em (2.3) são as maiores possíveis. Desta forma, o sistema de variabilidade do vetor aleatório composto das p variáveis originais é aproximado pelo sistema de variabilidade do vetor aleatório que contém as k componentes principais. A qualidade da aproximação depende do número de componentes mantidas no sistema e pode ser medida através da avaliação da proporção de variância total explicada por elas (MINGOTI, 2005). Suponha que X é um vetor normal p com média e matriz de covariâncias dadas por � e � , respectivamente, ou seja, ( )��,pN . A densidade de X é constante no elipsóide centrado em � ( ) ( ) 21 c=− ′ − − �x��x (2.5) o qual tem eixos iguais a iic eλ± , pi ,,2,1 �= , sendo ( ) ( ) ( )22 2 2 2 1 1 12 111 xexexexx p p c ′++′+′=�′= − λλλ � (2.6) onde xexexe p′′′ ,,, 21 � são as componentes principais de x (Johnson e Wichern (2002)). Se xexexe ppyyy ′=′=′= ,,, 2211 � tem-se 48 ( ) ( ) ( )22 2 2 2 1 1 2 111 p p yyyc λλλ +++= � . (2.7) Desta forma, a distância estatística ( 2c ) pode ser expressa em função dos valores de X (expressão (2.6)) ou em função dos valores de Y (expressão (2.7)). Quando o objetivo é a redução de dimensionalidade, é necessário estabelecer critérios para escolher o número k de componentes principais. Os critérios mais utilizados, segundo Mingoti (2005), são: 1) Escolher k de maneira que �≥� == p j j k i i 11 9,0 λλ . 2) Escolher k de maneira que mi λλ ≥ , onde p p j j m � = =1 λ λ e ki ,,2,1 �= . 3) Plotar iλ em função de i, ki ,,2,1 �= , e selecionar o último valor de k antes do “cotovelo” da curva. No exemplo ilustrado na Figura 4, k = 2. (i) 2,0 1,0 0 iλ 1 2 3 4 5 6 Figura 4 - Gráfico scree-plot (k = 2) Entretanto, em se tratando do uso de gráficos de controle baseados em componentes principais, um critério interessante é investigar o desempenho do gráfico de controle em função de k. 49 2.6 GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DO VETOR DE MÉDIAS Desde que foi criado, o gráfico de controle baseado na estatística 2T para o monitoramento de processos multivariados (HOTELLING, 1947) passou a ser o dispositivo estatístico mais usual no monitoramento do vetor de médias de duas ou mais características de qualidade. O gráfico de controle 2T é utilizado no monitoramento simultâneo de p variáveis de interesse. Quando o vetor das médias e a matriz de covariâncias, 0μ e 0� , de um processo p-variado distribuído normalmente são conhecidos, a estatística 2T de Hotelling para a i-ésima amostra é dada por: ( ) ( ),0 1 00 2 μμ −�′−= − iii XXnT onde n é o tamanho da i-ésima amostra e iX é o vetor das médias amostrais dos p parâmetros para a amostra i. Quando o processo está sob controle, 2 iT segue uma distribuição de qui-quadrado com p graus de liberdade. Quando o vetor das médias e a matriz de covariâncias são desconhecidos, costuma- se utilizar os estimadores 0μ̂ e 0�̂ baseados em m amostras: � = == m i iX m X 1 0 1 μ̂ e , 1ˆ 1 0 � = ==� m i iS m S onde iX e iS são respectivamente o vetor das médias da amostra e a mat