MARCELA APARECIDA GUERREIRO MACHADO ESTUDO DAS PROPRIEDADES DOS GRÁFICOS DE CONTROLE BIVARIADOS COM AMOSTRAGEM DUPLA Dissertação apresentada à Faculdade de Engenharia do Campus de Guaratinguetá, Universidade Estadual Paulista, para a obtenção do título de Mestre em Engenharia Mecânica na área de Projetos e Materiais. Orientador: Prof. Dr. Antônio Fernando Branco Costa Co-orientador: Prof. Dr. Fernando Augusto Silva Marins Guaratinguetá 2006 M149e Machado, Marcela Aparecida Guerreiro Estudo das propriedades dos gráficos de controle bivariados com amostragem dupla / Marcela Aparecida Guerreiro Machado . – Guaratinguetá : [s.n.], 2006 129f. : il. Bibliografia: f. 99-106 Dissertação (mestrado) – Universidade Estadual Paulista, Faculdade de Engenharia de Guaratinguetá, 2006 Orientador: Prof. Dr.Antonio Fernando Branco Costa Co-Orientador: Fernando Augusto Silva Marins 1. Controle de qualidade – Métodos estatísticos I. Título CDU 658.56 UNESP UNIVERSIDADE ESTADUAL PAULISTA Faculdade de Engenharia do Campus de Guaratinguetá ESTUDO DAS PROPRIEDADES DOS GRÁFICOS DE CONTROLE BIVARIADOS COM AMOSTRAGEM DUPLA MARCELA APARECIDA GUERREIRO MACHADO ESTA DISSERTAÇÃO FOI JULGADA ADEQUADA PARA A OBTENÇÃO DO TÍTULO DE “MESTRE EM ENGENHARIA MECÂNICA” ESPECIALIDADE: ENGENHARIA MECÂNICA ÁREA DE CONCENTRAÇÃO: PROJETOS E MATERIAIS APROVADA EM SUA FORMA FINAL PELO PROGRAMA DE PÓS- GRADUAÇÃO Prof. Dr. João Andrade de Carvalho Júnior Coordenador BANCA EXAMINADORA: Prof. Dr. ANTONIO FERNANDO BRANCO COSTA Orientador/UNESP-FEG Prof. Dr. FERNANDO AUGUSTO SILVA MARINS Co-Orientador / UNESP-FEG Prof. Dr. SEBASTIÃO DE AMORIM IMECC-UNICAMP Prof. Dr. MESSIAS BORGES SILVA UNESP-FEG Agosto de 2006 DADOS CURRICULARES MARCELA APARECIDA GUERREIRO MACHADO NASCIMENTO 14.05.1982 – SÃO PAULO / SP FILIAÇÃO Marcos de Lélis Brandão Machado Maria Sueli Guerreiro Machado 2000/2004 Curso de Graduação FEG - UNESP 2005/2006 Curso de Pós-Graduação em Engenharia Mecânica, nível de Mestrado, na Faculdade de Engenharia do Campus de Guaratinguetá da UNESP DEDICATÓRIA de modo especial, aos meus pais e irmãs, que sempre me incentivaram em todos os momentos. AGRADECIMENTOS Em primeiro lugar agradeço a Deus, fonte de vida e esperança. Agradeço pela minha vida, minha família e meus amigos, ao meu orientador, Prof. Dr. Antônio Fernando Branco Costa que jamais deixou de me incentivar. Sem a sua orientação, dedicação e auxílio, o estudo aqui apresentado seria praticamente impossível. ao co-orientador deste trabalho, Prof. Dr. Fernando Augusto Silva Marins pelos conselhos preciosos durante a elaboração dessa pesquisa. aos meus pais Marcos e Maria Sueli, que apesar das dificuldades enfrentadas, sempre incentivaram meus estudos. aos professores que participaram da banca examinadora. a Capes pelo apoio financeiro concedido a mim durante o curso. MACHADO, M. A. G. Estudo das propriedades dos gráficos de controle bivariados com amostragem dupla. 2006. 129f. Dissertação (Mestrado em Engenharia Mecânica) – Faculdade de Engenharia do Campus de Guaratinguetá, Universidade Estadual Paulista, Guaratinguetá, 2006. RESUMO Assim como o gráfico de X , o gráfico 2T de Hotelling é lento na detecção de pequenas a moderadas perturbações no processo. Estudos consagrados mostram que o desempenho do gráfico de X melhora em muito com o uso da amostragem dupla. Com base nestes resultados, este trabalho se dedica ao estudo das propriedades dos gráficos 2T com amostragem dupla para processos bivariados. Através de uma rotação dos eixos cartesianos é possível transformar as variáveis originais, que em geral são altamente correlacionadas, em variáveis independentes. Com as novas variáveis e trabalhando com coordenadas polares foi possível obter o número médio de amostras (NMA) que o gráfico proposto necessita para detectar uma alteração no processo. Por meio de comparações dos NMAs foi possível verificar que o gráfico de controle proposto é, na maioria das vezes, mais eficiente que os gráficos adaptativos em que o tamanho das amostras e/ou o intervalo entre retirada de amostras são variáveis. PALAVRAS-CHAVE: Gráfico 2T de Hotelling, amostragem dupla, processos bivariados, número médio de amostras MACHADO, M. A. G. The properties’ study of the bivariate control charts with double sampling. 2006. 129f. Dissertation (Master Degree in Mechanical Engineering) – Faculdade de Engenharia do Campus de Guaratinguetá, Universidade Estadual Paulista, Guaratinguetá, 2006. ABSTRACT Similarly to the X chart, the 2T chart is slow to detect small or even moderate process disturbances. Earlier studies have shown that the use of the double sampling procedure improves substantially the X chart performance. Based on that, we propose here to study the performance of the 2T chart with double sampling applied to control bivariate processes. An appropriate rotation transforms the original bivariate variables, in general presenting high correlation, in independent variables. With these equivalent variables and working with polar coordinates, it was possible to obtain the average run length (ARL) that measures the effectiveness of the proposed chart in detecting a process change. By comparisons of the ARLs it was possible to verify that the proposed control chart is, frequently, more efficient than the adaptive charts with variable sample size or variable sampling interval. KEYWORDS: 2T chart, double sampling, bivariate processes, average run length LISTA DE FIGURAS FIGURA 1 – Gráfico de controle ......................................................................... 32 FIGURA 2 – Volume dos saquinhos de leite (processo estável e ajustado) .......... 33 FIGURA 3 – Gráfico de X - ocorrência de um alarme falso ................................. 34 FIGURA 4 – Gráfico de X - ocorrência de um alarme verdadeiro ......................... 35 FIGURA 5 – Tempo até o sinal ........................................................................... 37 FIGURA 6 – Gráfico de controle BIDU com os valores de 2 1iT e 2 2iT ..................... 54 FIGURA 7 – Gráfico de controle BITWO com os valores de 2 1iT e 2 2iT ................... 55 FIGURA 8 – Gráfico de controle SyBIDU com os valores de 2 1iT e 2 2iT ................. 57 FIGURA 9 – Gráfico de controle SyBITWO com os valores de 2 1iT e 2 2iT ............... 58 FIGURA 10 – Gráfico de controle 2T de Hotelling ............................................... 59 FIGURA 11 – Gráfico de controle MVSS.............................................................. 60 FIGURA 12 – Gráfico de controle MVSI .............................................................. 63 FIGURA 13 – Gráfico de controle MVSSVSI ........................................................ 66 FIGURA 14 – Curva de probabilidades de não-detecção ( λ =0,25) ...................... 81 FIGURA 15 – Curva de probabilidades de não-detecção ( λ =0,50) ...................... 81 FIGURA 16 – Curva de probabilidades de não-detecção ( λ =0,75) ...................... 82 FIGURA 17 – Curva de probabilidades de não-detecção ( λ =1,00) ...................... 82 FIGURA 18 – Curva de probabilidades de não-detecção ( λ =1,25) ...................... 83 FIGURA 19 – Curva de probabilidades de não-detecção ( λ =1,50) ...................... 83 FIGURA A.1 – Rotação dos eixos )(1 xh e )(2 yh ................................................ 108 FIGURA B.1 – Espaço amostral de ( ),( 011 µng ; ),( 012 µng ) ................................. 110 FIGURA B.2 – Espaço amostral de ( ),( 01 µng ; ),( 02 µng ).................................... 112 FIGURA B.3 – Área Aij ........................................................................................ 113 FIGURA B.4 – ∆ x e ∆ y........................................................................................ 114 FIGURA B.5 – Espaço amostral de ( ),( 111 µng ; ),( 112 µng ) .................................. 115 FIGURA C.1 – Seqüência de amostras dentro ou fora dos limites......................... 119 FIGURA C.2 – Casos em que o gráfico com regra especial de decisão sinaliza (L=3) .............................................................................. 119 FIGURA C.3 – Diagrama de transição de estados (L=3)....................................... 120 LISTA DE TABELAS TABELA 1 – Parâmetros de entrada: gráficos BIDU e MVSS ( n =3; α1=0,001).... 76 TABELA 2 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =3; 1n =1) .............................................. 76 TABELA 3 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =3; 1n =2 ).............................................. 77 TABELA 4 – Parâmetros de entrada: gráficos BIDU e MVSS ( n =4; α1=0,001) ............................................................................ 77 TABELA 5 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =4; 1n =1) .............................................. 77 TABELA 6 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =4; 1n =2) ............................................... 78 TABELA 7 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =4; 1n =3) ............................................... 78 TABELA 8 – Parâmetros de entrada: gráficos BIDU e MVSS ( n =5; α1=0,001) ... 79 TABELA 9 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =5; 1n =1) .............................................. 79 TABELA 10 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =5; 1n =2) .............................................. 79 TABELA 11 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =5; 1n =3) .............................................. 80 TABELA 12 – Valores de NMA para os gráficos 2 T , BIDU e MVSS (α1=0,001; NMA0=200; n =5; 1n =4) ............................................... 80 TABELA 13 – Parâmetros do gráfico MVSI ( n =4 e 5) ........................................ 84 TABELA 14 – Valores de TES para os gráficos 2 T , BIDU e MVSI (α1=0,001; NMA0=200; n =4) ........................................................ 84 TABELA 15 – Valores de TES para os gráficos 2 T , BIDU e MVSI (α1=0,001; NMA0=200; n =5) ........................................................ 84 TABELA 16 – Parâmetros de entrada: gráfico BIDU ( n =4; α1=0) ...................... 85 TABELA 17 – Valores de NMA para os gráficos 2 T e BIDU (NMA0=200; n =4; 1n =1) ............................................................... 86 TABELA 18 – Valores de NMA para os gráficos 2 T e BIDU (NMA0=200; n =4; 1n =2) ............................................................... 86 TABELA 19 – Valores de NMA para os gráficos 2 T e BIDU (NMA0=200; n =4; 1n =3)................................................................ 86 TABELA 20 – Parâmetros de entrada: gráfico SyBIDU ( n =4; α1=0) ................... 88 TABELA 21 – Valores de NMA e NMASS para os gráficos 2 T , BIDU e SyBIDU (α1=0; NMA0=200; n =4; 1n =1; 2n =8) ............................................ 88 TABELA 22 – Valores de NMA e NMASS para os gráficos 2 T , BIDU e SyBIDU (α1=0; NMA0=200; n =4; 1n =1; 2n =16) .......................................... 89 TABELA 23 – Valores de NMA e NMASS para os gráficos 2 T , BIDU e SyBIDU (α1=0; NMA0=200; n =4; 1n =2; 2n =8) ............................................ 89 TABELA 24 – Valores de NMA e NMASS para os gráficos 2 T , BIDU e SyBIDU (α1=0; NMA0=200; n =4; 1n =2; 2n =16) .......................................... 89 TABELA 25 – Valores de NMA e NMASS para os gráficos 2 T , BIDU e SyBIDU (α1=0; NMA0=200; n =4; 1n =3; 2n =8) ............................................ 90 TABELA 26 – Valores de NMA e NMASS para os gráficos 2 T , BIDU e SyBIDU (α1=0; NMA0=200; n =4; 1n =3; 2n =16) ........................................... 90 TABELA 27 – Parâmetros dos gráficos BIDU e MVSSVSI ( n =2; α1=0; b=0,1) ... 91 TABELA 28 – Parâmetros dos gráficos BIDU e MVSSVSI ( n =3; α1=0; b=0,1) ... 91 TABELA 29 – Parâmetros dos gráficos BIDU e MVSSVSI ( n =4; α1=0; b=0,1) ... 91 TABELA 30 – Parâmetros dos gráficos BIDU e MVSSVSI ( n =2; α1=0; b=0,2) ... 91 TABELA 31 – Parâmetros dos gráficos BIDU e MVSSVSI ( n =3; α1=0; b=0,2) ... 92 TABELA 32 – Parâmetros dos gráficos BIDU e MVSSVSI ( n =4; α1=0; b=0,2) ... 92 TABELA 33 – Valores de TES para os gráficos BIDU e MVSSVSI ( n =2; α1=0; b=0,1) ....................................................................... 92 TABELA 34 – Valores de TES para os gráficos BIDU e MVSSVSI ( n =3; α1=0; b=0,1) ....................................................................... 92 TABELA 35 – Valores de TES para os gráficos BIDU e MVSSVSI ( n =4; α1=0; b=0,1) ....................................................................... 92 TABELA 36 – Valores de TES para os gráficos BIDU e MVSSVSI ( n =2; α1=0; b=0,2) ....................................................................... 93 TABELA 37 – Valores de TES para os gráficos BIDU e MVSSVSI ( n =3; α1=0; b=0,2) ....................................................................... 93 TABELA 38 – Valores de TES para os gráficos BIDU e MVSSVSI ( n =4; α1=0; b=0,2) ....................................................................... 93 TABELA 39 – Parâmetros de entrada: gráfico BIDU ( n =4; α1=0) ...................... 94 TABELA 40 – Valores de NMA para o gráfico *2 T ( NMA0=200; n =4) .............. 94 TABELA 41 – Valores de NMA para o gráfico BIDU (α1=0; NMA0=200; n =4; 1n =1; 2n =8) .......................................... 95 TABELA 42 – Valores de NMA para o gráfico BIDU (α1=0; NMA0=200; n =4; 1n =1; 2n =16) ........................................ 95 TABELA C.1 – Matriz de transição da cadeia de Markov (L=3) .......................... 120 TABELA C.2 – Matriz de probabilidades iniciais da cadeia de Markov (L=3)...... 122 LISTA DE ABREVIATURAS E SIGLAS BIDU - Bivariado com Amostragem Dupla BITWO - Bivariado com amostragem em dois estágios MVSI - Multivariado com tempo de espera entre retirada de amostras variável MVSS - Multivariado com tamanho de amostra variável MVSSVSI - Multivariado com tamanho de amostra e tempo de espera entre retiradas de amostra variáveis SyBIDU - Bivariado Synthetic com Amostragem Dupla SyBITWO - Bivariado Synthetic com amostragem em dois estágios LISTA DE SÍMBOLOS x - Variável de interesse y - Variável de interesse xµ - Média da variável x yµ - Média da variável y x0µ - Média da variável x em controle y0µ - Média da variável y em controle x1µ - Média da variável x após a ocorrência da causa especial y1µ - Média da variável y após a ocorrência da causa especial xσ - Desvio-padrão da variável x yσ - Desvio padrão da variável y xyσ = yxσ - Covariância entre x e y 2 xσ - Variância de x 2 xσ - Variância de y ρ - Coeficiente de correlação Σ - Matriz de covariâncias ε - Matriz de covariância unitária 2T - Estatística de Hotelling com distribuição de Qui-Quadrado 2 1T - Distância estatística entre o vetor de médias de x e y e o vetor de valores alvos );( 00 yx µµ no primeiro estágio da amostragem 2 2T - Distância estatística entre o vetor de médias de x e y e o vetor de valores alvos );( 00 yx µµ no segundo estágio da amostragem LA - Limite de advertência para os gráficos BIDU, BITWO, SyBIDU e SyBITWO 1LC - Limite de controle do primeiro estágio para os gráficos BIDU, BITWO, SyBIDU e SyBITWO 2LC - Limite de controle do segundo estágio para os gráficos BIDU, BITWO, SyBIDU e SyBITWO w - Limite de advertência para os gráficos MVSS, MVSI e MVSSVSI LC - Limite de controle para os gráficos MVSS, MVSI e MVSSVSI 0n - Tamanho de amostra do gráfico 2T com parâmetros fixos 1n - Tamanho da amostra no primeiro estágio para os gráficos BIDU, BITWO, SyBIDU e SyBITWO Tamanho da menor amostra para os gráficos MVSS e MVSSVSI 2n - Tamanho da amostra no segundo estágio para os gráficos BIDU, BITWO, SyBIDU e SyBITWO. Tamanho da maior amostra para os gráficos MVSS e MVSSVSI. n - Tamanho de amostra considerando os dois estágios de amostragem n - Número médio de itens inspecionado por amostragem h - Intervalo de tempo entre retirada de amostras a 0t - Intervalo longo de tempo entre amostragens para os gráficos MVSI e MVSSVSI b 0t - Intervalo curto de tempo entre amostragens para os gráficos MVSI e MVSSVSI 0t - Intervalo de tempo entre amostragens para o gráfico 2T com parâmetros fixos TES - Tempo esperado até o sinal TMAF - Tempo médio até a ocorrência de um alarme falso M - Intervalo de tempo entre o momento da retirada da última amostra antes da ocorrência da causa especial e a ocorrência da causa especial 1x - Média amostral da característica de qualidade x da sub- amostra de tamanho 1n . 1 y - Média amostral da característica de qualidade y da sub- amostra de tamanho 1n . 2x - Média amostral da característica de qualidade x da sub- amostra de tamanho n . 2y - Média amostral da característica de qualidade y da sub- amostra de tamanho n . 1α - Probabilidade de alarme falso no primeiro estágio 2α - Probabilidade de alarme falso no segundo estágio α - Probabilidade de alarme falso quando a amostragem dupla está em uso β - Probabilidade de não-detecção 1p - Probabilidade de alarme verdadeiro no primeiro estágio para os gráficos BIDU, BITWO, SyBIDU e SyBITWO. Porcentagem do tempo que o processo permanece no estado 1, quando isento de causas especiais, para os gráficos MVSS, MSVI e MVSSVSI. 2p - Probabilidade de verdadeiro no segundo estágio para os gráficos BIDU, BITWO, SyBIDU e SyBITWO. Porcentagem do tempo que o processo permanece no estado 2, quando isento de causas especiais para os gráficos MVSS, MSVI e MVSSVSI. p - Probabilidade de alarme verdadeiro quando a amostragem dupla está em uso p0 - Probabilidade de que a amostragem seja interrompida no primeiro estágio NMA - Número médio de amostras até o sinal 0NMA - Número médio de amostras até o sinal durante o período em controle NMAZS - NMA que mede o tempo necessário para se detectar uma causa especial que esteja presente desde o início do monitoramento NMAss - NMA que mede o tempo necessário para se detectar uma causa especial que ocorre após um longo e indeterminado período de operação em controle xδ - Deslocamento da média da variável x em relação ao seu valor-alvo yδ - Deslocamento da média da variável y em relação ao seu valor-alvo xδ ′ - Deslocamento da média da variável x em relação ao seu valor-alvo, considerando os eixos x e y rotacionados valor-alvo, considerando os eixos x e y rotacionados yδ ′ - Deslocamento da média da variável y em relação ao seu valor-alvo, considerando os eixos x e y rotacionados d - Raiz quadrada da soma dos quadrados dos deslocamentos das médias das variáveis x e y λ - Parâmetro de não-centralidade do gráfico de controle 2T Magnitude da perturbação no processo 1λ - Parâmetro de não-centralidade do gráfico de controle MVSS e MVSSVSI considerando a menor amostra 2λ - Parâmetro de não-centralidade dos gráficos de controle MVSS e MVSSVSI considerando a maior amostra ),(1 µng - Variável aleatória e normal ),(2 µng - Variável aleatória e normal ),( µng - Vetor bi-dimensional ( ), 21 gg , sendo 1g e 2g independentes NA - Número de amostras conformes entre ocorrências de amostras não-conformes L - Número máximo de amostras entre amostras não-conformes para que se tenha um alarme nos gráficos de controle SyBIDU e SyBITWO k - Número de variáveis do processo sendo monitoradas Fator de abertura dos limites de controle F - Distribuição de Qui-Quadrado central acumulada )N(0,εf - Função densidade da distribuição normal bivariada com média zero e matriz de covariância unitária ),0( εN - Distribuição normal bivariada com média zero e matriz de covariâncias unitária P - Matriz de probabilidades de transição Q - Matriz de probabilidades de transição dos estados transitórios B′ - Vetor de probabilidades iniciais dos gráficos MVSS, MVSI e MVSSVSI I - Matriz identidade t′ - Vetor do intervalo de tempo entre retirada de amostras para os gráficos MVSI e MVSSVSI Q´ Matriz de probabilidades iniciais S Vetor de probabilidades iniciais I1 - Região do gráfico de controle BIDU abaixo do limite de advertência I2 - Região do gráfico de controle BIDU delimitada pelos limites de advertência e de controle do primeiro estágio I3 - Região do gráfico de controle BIDU acima do limite de controle do primeiro estágio I4 - Região do gráfico de controle BIDU abaixo do limite de controle do segundo estágio I5 - Região do gráfico de controle BIDU acima do limite de controle do segundo estágio * 5I - Região fora do disco D(C, R) Rmax - Raio de um disco D cuja probabilidade de se ter um par (x, y) que não pertence ao disco é praticamente zero m - Número de partições das variáveis x e y A Probabilidade de se ter uma amostra conforme quando em uso o gráfico de controle com regra especial de decisão B Probabilidade de se ter uma amostra não-conforme quando em uso o gráfico de controle com regra especial de decisão SUMÁRIO LISTA DE FIGURAS LISTA DE TABELAS LISTA DE ABREVIATURAS E SIGLAS LISTA DE SÍMBOLOS 1 INTRODUÇÃO.......................................................................................... 22 1.1 CONSIDERAÇÕES INICIAIS .................................................................. 22 1.2 JUSTIFICATIVA E IMPORTÂNCIA ....................................................... 26 1.3 OBJETIVOS.............................................................................................. 28 1.3.1 Objetivo Geral......................................................................................... 28 1.3.2 Objetivos Específicos .............................................................................. 28 1.4 MÉTODO DE PESQUISA ........................................................................ 28 1.5 VERIFICAÇÃO DOS RESULTADOS...................................................... 29 1.6 LIMITAÇÕES DO TRABALHO............................................................... 29 1.7 CARÁTER INÉDITO................................................................................ 29 1.8 ORGANIZAÇÃO DO TEXTO.................................................................. 30 2 GRÁFICOS DE CONTROLE................................................................... 32 2.1 CONSIDERAÇÕES INICIAIS .................................................................. 32 2.2 ALARMES NO GRÁFICO DE CONTROLE............................................ 34 2.3 DESEMPENHO DOS GRÁFICOS DE CONTROLE................................ 35 2.4 GRÁFICOS DE CONTROLE UNIVARIADOS........................................ 39 2.5 GRÁFICOS DE CONTROLE MULTIVARIADOS .................................. 42 2.5.1 O Vetor de Médias e a Matriz de Covariâncias Amostrais .................. 43 2.5.2 Estimação de Parâmetros: Vetor de médias, Matrizes de Covariâncias e de Correlação Populacionais ........................................ 45 2.5.1 Distribuição Normal Multivariada........................................................ 46 2.6 GRÁFICO DE CONTROLE 2T DE HOTELLING ................................... 47 3 DESCRIÇÃO DO GRÁFICO DE CONTROLE BIVARIADO COM AMOSTRAGEM DUPLA E DE ALGUNS ESQUEMAS CONCORRENTES............................................................................................. 51 3.1 CONSIDERAÇÕES INICIAIS .................................................................. 51 3.2 GRÁFICO DE CONTROLE BIDU............................................................. 51 3.3 GRÁFICO DE CONTROLE BITWO .......................................................... 54 3.4 GRÁFICO DE CONTROLE SyBIDU ......................................................... 55 3.5 GRÁFICO DE CONTROLE SyBITWO ...................................................... 57 3.6 GRÁFICO DE CONTROLE 2T DE HOTELLING .................................... 58 3.7 GRÁFICO DE CONTROLE MVSS ............................................................ 60 3.8 GRÁFICO DE CONTROLE MVSI ............................................................. 62 3.9 GRÁFICO DE CONTROLE MVSSVSI ....................................................... 65 3.10 OBTENÇÃO DO NMA PARA OS ESQUEMAS CONCORRENTES ........ 69 4 DESENVOLVIMENTO MATEMÁTICO ............................................... 70 4.1 CONSIDERAÇÕES INICIAIS .................................................................. 70 4.2 PROPRIEDADES DOS GRÁFICOS BIVARIADOS COM AMOSTRAGEM DUPLA .......................................................................... 70 4.3 CONSIDERAÇÕES FINAIS ..................................................................... 73 5 ANÁLISE DE DESEMPENHO DO GRÁFICO PROPOSTO E DOS ESQUEMAS CONCORRENTES............................................... 74 5.1 GRÁFICO DE CONTROLE MVSI ............................................................. 75 5.2 DESEMPENHO DO GRÁFICO BIDU ...................................................... 75 5.3 COMPARAÇÃO DOS DESEMPENHOS DOS GRÁFICOS BIDU E MVSI............................................................................................................. 83 5.4 ANÁLISE DA INFLUÊNCIA DE 1α NO DESEMPENHO DO GRÁFICO BIDU ......................................................................................... 85 5.5 DESEMPENHO DO GRÁFICO SyBIDU .................................................. 87 5.6 COMPARAÇÃO DOS DESEMPENHOS DOS GRÁFICOS BIDU E MVSSVSI ..................................................................................................... 90 5.7 ESTUDO DO EFEITO DA CORRELAÇÃO NO DESEMPENHO DO GRÁFICO BIDU.................................................................................. 93 6 CONCLUSÕES E SUGESTÕES PARA FUTURAS PESQUISAS ......... 96 REFERÊNCIAS ................................................................................................... 99 APÊNDICE A – Prova do Teorema A1 ................................................................ 107 APÊNDICE B – Cálculos Secundários ................................................................. 110 APÊNDICE C – Modelo de Cadeia de Markov para obtenção do NMA do gráfico de controle com regra especial de decisão....................... 118 APÊNDICE D – Código computacional em FORTRAN........................................ 123 1 INTRODUÇÃO 1.1 CONSIDERAÇÕES INICIAIS Em geral, produtos que atendem às exigências do cliente advêm de processos estáveis. Mais precisamente, de processos capazes de operar com pequena variabilidade em torno das dimensões-alvo ou nominais do produto. O controle estatístico do processo (CEP) é uma ferramenta de resolução de problemas útil na obtenção da estabilidade do processo e na melhoria da capacidade através da redução da variabilidade (MONTGOMERY, 2004). O início formal do controle estatístico de processo se deu por volta de 1924, quando Walter A. Shewhart desenvolveu e aplicou os gráficos de controle na Bell Telephone Laboratories. No início, como era de se esperar, poucos acreditaram no potencial desta nova técnica. Pouco a pouco, no entanto, os gráficos de controle ganharam a fama de serem ferramentas poderosas de monitoramento. A década de 70 pode ser considerada como a década dos gráficos de Shewhart; o lema da época era: “só se assegura qualidade de processos que estejam sob o monitoramento de gráficos de Shewhart”. Esta “febre” teve seu lado bom e seu lado ruim. O lado bom foi que o uso intenso dos gráficos de controle facilitou a divulgação de diversas técnicas estatísticas, especialmente desenvolvidas para o monitoramento de processos industriais. O lado ruim foi que, em função da pressão natural gerada pelo modismo da época, os gráficos de Shewhart passaram a ser utilizados de forma indevida, ou pior, em situações desnecessárias, caindo assim no descrédito. Ainda hoje, se sente o efeito deste modismo. De acordo com os fundamentos estabelecidos por Shewhart, sempre que um ponto é plotado na região de ação do gráfico, o responsável pelo processo deve interrompê-lo imediatamente, visando encontrar causas especiais que afetam a qualidade dos produtos, como por exemplo, um desgaste de ferramenta que altera a dimensão dos eixos que estão sendo manufaturados. Na prática, contudo, poucos são aqueles que seguem a regra estabelecida por Shewhart. A maioria prefere, por 23 exemplo, esperar o surgimento de um segundo ponto na região de ação e, além disso, só tomam a decisão drástica de parar o processo se este ponto não estiver muito longe do primeiro. Para atender esta exigência do usuário surgiram os gráficos de controle com regra especial de decisão, conhecidos na literatura como Synthetic Control Chart (WU; SPEDDING , 2000). O avanço tecnológico tem, cada vez mais, levado a processos com menor variabilidade. Neste contexto, pequenas alterações no processo podem ser críticas, devendo, portanto, ser eliminadas com rapidez. A idéia original de Shewhart – de controlar o processo apenas através das informações extraídas da última amostra, e de decidir por intervir no processo apenas após a ocorrência de um ponto amostral além dos limites de controle – não pode ser diretamente utilizada no monitoramento de processos com baixa variabilidade, pelas seguintes razões (COSTA; EPPRECHT; CARPINETTI, 2005): a) os gráficos de controle se tornam lentos na detecção de causas especiais que alteram de forma moderada os parâmetros do processo; b) os custos com amostragem tornam-se proibitivos, face a necessidade de se ter que trabalhar com amostras grandes. Em geral, o desempenho dos gráficos de controle tem sido medido pelo número médio de amostras, NMA, que o gráfico de controle precisa para sinalizar uma alteração no processo (COSTA; EPPRECHT; CARPINETTI, 2005). Não têm sido poucas as propostas de alterações à idéia original de Shewhart. No caso do monitoramento de processos univariados, as estratégias que vêm sendo adotadas, visando melhorar o desempenho dos gráficos de controle, consistem em se variar os parâmetros de projeto dos gráficos de Shewhart. Esses parâmetros são o tamanho da amostra n, o intervalo de tempo entre retirada de amostras h e o fator de abertura k dos limites de controle. Tais gráficos de controle são conhecidos como Gráficos de Controle Adaptativos (ver Reynolds et al. (1988), Runger e Pignatiello (1991), Reynolds e Arnold (1989) e Runger e Montgomery (1993)). Uma segunda estratégia para melhorar o desempenho dos gráficos de controle consiste em se adotar esquemas alternativos de amostragem, tais como a Amostragem dupla (DAUDIN, 1992) ou a Amostragem em dois estágios (COSTA; RAHIM, 2004). Uma terceira estratégia 24 consiste em tomadas de decisão diferentes daquelas baseadas em um único ponto na região de ação do gráfico de controle, ver Wu e Spedding (2000). Quando o gráfico de Shewhart está em uso, amostras de tamanho fixo são retiradas do processo em intervalos regulares. A idéia do esquema adaptativo consiste em se variar os parâmetros de projeto dos gráficos de Shewhart (tamanho da amostra n, intervalo de tempo entre retirada de amostras h e fator de abertura k dos limites de controle), entre um valor mínimo e um máximo, com base nas informações obtidas após a inspeção da última amostra retirada do processo. Os esquemas adaptativos melhoram o desempenho dos gráficos de controle, quanto à sinalização de desajustes no processo (ver Reynolds et al. (1988); Prabhu; Runger e Keats (1993); Costa (1994, 1997, 1998, 1999, 1999a); Costa e De Magalhães (2006); De Magalhães et al. (2001, 2002, 2006); De Magalhães e Moura Neto (2005); Epprecht e Costa (2001); Epprecht; Costa e Mendes (2003, 2005); Michel e Fogliatto (2002)). Os esquemas adaptativos também têm sido utilizados com os gráficos de controle destinados ao monitoramento de processos multivariados, ver Aparisi (1996); Aparisi e Haro (2001, 2003); Chou; Chen e Chen (2006) e Yeh e Lin (2002). Do mesmo modo que os esquemas adaptativos, a amostragem dupla melhora o desempenho dos gráficos de controle. De acordo com Costa e Rahim (2004, 2006), quando se tem um processo bastante estável, o monitoramento se torna monótono, pois raramente um valor amostral é plotado fora dos limites de controle. A adoção do gráfico de controle tradicional, neste contexto, tem como conseqüência natural (e negativa) uma tendência do usuário dispensar cada vez menos atenção aos procedimentos necessários à obtenção dos valores das estatísticas utilizadas no monitoramento. A média, a variância e a amplitude amostral são exemplos destas estatísticas. Ressalta-se que tal falta de atenção pode afetar o desempenho do gráfico de controle no monitoramento do processo. Visando minimizar este problema, Costa e Rahim (2004) propuseram um esquema alternativo de amostragem, isto é, o esquema de amostragem em dois estágios. No primeiro estágio apenas um item da amostra é inspecionado e, sempre que possível, a inspeção é feita por atributos. Se o item é aprovado, a amostragem é interrompida. Caso contrário, a amostragem vai para o 25 segundo estágio quando então todos os itens da amostra são inspecionados e os valores da característica de qualidade de interesse são medidos e utilizados na obtenção da(s) estatística(s) de monitoramento. A grande vantagem da amostragem em dois estágios é que, durante o período em que o processo permanece ajustado, a amostragem é, na maioria das vezes, interrompida e o controle acaba sendo feito apenas por atributos, que além de mais simples é menos monótono. O gráfico de Shewhart sinaliza uma deterioração do processo sempre quando um ponto cai em sua região de ação. Alternativamente, Wu e Spedding (2000) propuseram um gráfico de controle com regra especial de decisão conhecido como Synthetic Control Chart. O Synthetic Control Chart sinaliza somente quando um segundo ponto cai na região de ação, e sob a condição de que o número de amostras entre os dois pontos que caíram na região de ação, não seja superior a um valor inteiro L. O Synthetic Control Chart tem sido objeto recente de pesquisa, ver Wu e Spedding (2000, 2000a), Wu e Yeo (2001), Wu; Yeo e Spedding (2001), Calzada e Scariano (2001), Davis e Woodall (2002), Machado e Costa (2005,2005a) e Costa e Rahim (2006a). Até agora se discutiu os gráficos de controle univariados. Porém, o aumento da complexidade e dos níveis de automação dos processos industriais e a crescente disponibilidade de suporte computacional, têm aumentado o interesse pelo monitoramento simultâneo de várias características de qualidade, também chamadas de variáveis do processo (LOWRY; MONTGOMERY, 1995). Pouco a pouco as novas estratégias de monitoramento, originalmente propostas para melhorar o desempenho dos gráficos de controle univariados, estão sendo aplicadas ao monitoramento de processos multivariados. Desde que foi criado, o gráfico de controle 2T (HOTELLING, 1947) passou a ser o dispositivo estatístico mais utilizado no monitoramento de duas ou mais características de qualidade. Estas características frequentemente são inter- relacionadas e formam um conjunto correlacionado (MASON; YOUNG, 2002). Lowry e Montgomery (1995) fazem uma revisão dos gráficos de controle 26 multivariados. Mason e Young (2002) discutem exaustivamente as aplicações do gráfico de controle 2T . O gráfico de controle 2T é utilizado no monitoramento simultâneo de k variáveis de interesse. Quando o vetor das médias e a matriz de covariância, respectivamente 0µ e 0∑ , de um processo k-variado normalmente distribuído são conhecidos, a estatística 2T de Hotelling para a i-ésima amostra é dada por: ( ) ( ),0 1 00 2 µµ −∑ ′ −= − iii XXnT onde n é o tamanho da i-ésima amostra e iX é o vetor das médias amostrais dos k parâmetros para a amostra i. Quando o processo está sob controle, 2 iT segue uma distribuição de Qui-quadrado com k graus de liberdade, desde que o vetor das médias seja normalmente distribuído (MASON; YOUNG, 2002). O gráfico de controle 2 T de Hotelling é análogo ao gráfico X de Shewhart, sendo ambos pouco sensíveis a pequenas alterações no processo. Desta forma, métodos estatísticos tais como o esquema CUSUM e o gráfico de EWMA, ver Costa; Epprecht e Carpinetti (2005), têm sido utilizados para o caso multivariado em que o vetor de médias está sujeito a pequenas alterações (ver Woodall e Ncube (1985); Crosier (1988); Pignatiello e Runger (1990); Lowry et al. (1992); Lowry e Montgomery (1995); Prabhu e Runger (1997); Qiu e Hawkins (2001)). A idéia de se variar os parâmetros dos gráficos de controle multivariados (gráficos adaptativos multivariados), tais como o tamanho da amostra, o intervalo de tempo entre retiradas de amostras, tem sido explorada em artigos recentes (ver Aparisi (1996), Aparisi e Haro (2001), Aparisi e Haro (2003), Chou; Chen e Chen (2006)). A amostragem dupla para processos multivariados também tem sido objeto de estudo ((GRIGORYAN; HE, 2005) e (HE; GRIGORYAN, 2005)). 1.2 JUSTIFICATIVA E IMPORTÂNCIA Quando Shewhart propôs os gráficos de controle, o seu objetivo principal era de se ter um dispositivo estatístico bastante simples para o monitoramento de processos. Contudo, com o passar do tempo, os processos se tornaram mais sofisticados e passaram a demandar o uso de técnicas estatísticas mais eficientes, no sentido de se 27 detectar perturbações no processo com maior rapidez. Além disso, a automatização dos processos tem feito surgir a necessidade do monitoramento simultâneo de vários parâmetros de qualidade, tais como dimensão, peso, composição, etc. Graças ao avanço computacional tem sido possível reprojetar os gráficos de controle e torná-los mais eficientes. Neste contexto, têm se variado os parâmetros dos gráficos de controle, e/ou modificado o esquema de amostragem, e/ou o critério de decisão. Surge assim uma nova geração dos gráficos de Shewhart. Em se tratando de processos univariados, a literatura sobre este tema é bastante rica. Contudo, os trabalhos voltados a processos multivariados são poucos e recentes - ver Bernard (2001), Skinner (2002), Thomas (2002), Konrath (2002), Grigoryan (2003) e Testik (2003) - e, em geral, a complexidade dos modelos tem levado ao uso de técnicas de simulação para a obtenção das propriedades dos gráficos de controle. Por exemplo, Grigoryan (2003) estudou os gráficos multivariados com amostragens múltiplas obtendo o NMA por meio de simulação. Alternativamente, esta dissertação trata da elaboração de modelos matemáticos necessários ao estudo do desempenho dos gráficos de controle. Fundamentados em Teoremas e Corolários da Estatística, foi possível obter para o caso bivariado normal expressões fechadas para o NMA. Como Grigoryan (2003) já havia antecipado, não é simples obter tais expressões. Contudo, com base em estudos teóricos, foi possível obtê-las. Um aspecto importante desta nova geração de gráficos de controle é que estes são ferramentas ágeis na detecção de alterações nos parâmetros dos processos. Tanto a adoção da amostragem dupla quanto a adoção da regra especial de decisão tentam simplificar o monitoramento realizado através dos gráficos de controle. Estando a amostragem dupla em uso e sendo o tamanho da amostra no primeiro estágio 1n = 1, a freqüência que pode conduzir ao segundo estágio da amostragem é baixa. Dessa forma, em grande parte do tempo, o usuário lida com a informação direta dos parâmetros sob monitoramento, ou seja, com os valores de );( yx . Dispositivos do tipo “calibres” permitem que, no primeiro estágio da amostragem, a inspeção seja por atributos. 28 Estando em uso a regra especial de decisão o usuário pode esperar o surgimento de um segundo ponto na região de ação e, além disso, só tomar a decisão drástica de parar o processo se este ponto não estiver muito longe do primeiro, o que de fato já ocorria na prática. Assim, este estudo torna-se importante à medida que se propõe a estudar os gráficos de controle bivariados com amostragem dupla e regra especial de decisão por meio de desenvolvimentos teóricos. O método aqui empregado pode ser utilizado em futuras pesquisas para o caso em que se consideram três ou mais características de qualidade sob monitoramento. 1.3 OBJETIVOS 1.3.1 Objetivo Geral Este trabalho teve como objetivo geral estudar os gráficos de controle bivariados com amostragem dupla e regra especial de decisão. 1.3.2 Objetivos Específicos a) Revisar a bibliografia existente sobre gráficos de controle multivariados; b) Criar modelos matemáticos necessários à obtenção das propriedades dos gráficos de controle bivariados com amostragem dupla com ou sem regra especial de decisão; c) Comparar o desempenho dos gráficos de controle propostos com o dos gráficos multivariados tradicionais. d) Comparar o desempenho dos gráficos de controle propostos com o dos gráficos multivariados adaptativos. 1.4 MÉTODO DE PESQUISA Para atender os objetivos propostos adotou-se a pesquisa quantitativa, que segundo Diehl e Tatim (2004) caracteriza-se pelo uso da quantificação no tratamento 29 das informações por meio de técnicas estatísticas, com o objetivo de garantir resultados confiáveis. As propriedades dos gráficos de controle bivariados baseadas na estatística 2 T são facilmente obtidas, pois 2T segue uma distribuição de Qui-Quadrado. Para o esquema de amostragem considerado neste trabalho, isto é, a amostragem dupla, foi preciso redefinir a função de Qui-Quadrado de uma forma apropriada (baseada na idéia de coordenadas polares). Além disso, fez-se uso de uma estratégia que consistiu na rotação de eixos cartesianos de forma a transformar as variáveis originais correlacionadas, em variáveis independentes, ver Apêndice A. A pesquisa consistiu basicamente de cinco etapas: revisão da bibliografia sobre gráficos de controle multivariados, desenvolvimento das expressões matemáticas para a obtenção das medidas de desempenho dos gráficos de controle propostos, elaboração de código computacional, comparação do desempenho dos gráficos de controle propostos com o dos esquemas concorrentes e, por fim, análise de todo o trabalho. 1.5 VERIFICAÇÃO DOS RESULTADOS Os valores do NMA foram obtidos pelas expressões matemáticas desenvolvidas neste trabalho e por simulação. Tais simulações foram feitas por bolsistas de Iniciação Científica. As diferenças nos valores obtidos pelas expressões matemáticas e pelas simulações não excederam a 1%. 1.6 LIMITAÇÕES DO TRABALHO Os resultados obtidos são válidos apenas para o caso bivariado normal. Embora os métodos empregados se apliquem ao caso mais geral multivariado, a extensão das expressões matemáticas para k variáveis, sendo k > 2, não é trivial. 1.7 CARÁTER INÉDITO Para o caso bivariado não há na literatura trabalhos que tratam da obtenção, por meio de desenvolvimentos teóricos, das propriedades dos gráficos de controle com 30 amostragem dupla e regra especial de decisão. Quando da revisão bibliográfica dos gráficos de controle multivariados observou-se que a técnica de simulação tem sido a mais utilizada. Optou-se neste trabalho pelo estudo teórico, pois além do caráter inédito, permitiu conhecer com mais precisão as propriedades dos gráficos de controle com amostragem dupla com ou sem regra especial de decisão. 1.8 ORGANIZAÇÃO DO TEXTO A dissertação está estruturada em seis capítulos. Neste primeiro capítulo foi apresentado um breve histórico sobre os gráficos de controle, as justificativas para a escolha do tema, os objetivos, o método de pesquisa, a validação dos resultados, as limitações do trabalho, seu caráter inédito e a organização do texto. O Capítulo 2 é dedicado aos gráficos de controle univariados e multivariados, apresentando de forma detalhada as pesquisas realizadas até o momento na área de controle estatístico de processo. Direciona-se em especial aos gráficos de controle com amostragem dupla e regra especial de decisão, que são o foco deste trabalho. A descrição dos gráficos de controle propostos, bem como a dos esquemas concorrentes está no Capítulo 3. No Capítulo 4 está o desenvolvimento matemático necessário para a obtenção das propriedades dos gráficos de controle bivariados com amostragem dupla com ou sem regra especial de decisão. No Capítulo 5 o desempenho dos gráficos de controle propostos é comparado com o dos esquemas concorrentes. No Capítulo 6 estão as conclusões e sugestões para futuras pesquisas. No Apêndice A está a prova do Teorema A.1 introduzido no Capítulo 4, o qual mostra como é possível transformar as variáveis originais de monitoramento, consideradas correlacionadas, em variáveis independentes. O Apêndice B é uma complementação ao Capítulo 4. Neste Apêndice estão os cálculos secundários necessários ao completo desenvolvimento das expressões para obtenção das propriedades dos gráficos de controle propostos. 31 No Apêndice C está o procedimento utilizado por Davis e Woodall (2002), baseado em um modelo de cadeia de Markov, para obtenção das propriedades dos gráficos de controle com regra especial de decisão. No Apêndice D está o código computacional desenvolvido em FORTRAN que fornece os NMAs teóricos, isto é, obtidos com o auxílio das expressões matemáticas do Capítulo 4. 32 2 GRÁFICOS DE CONTROLE 2.1 CONSIDERAÇÕES INICIAIS Os gráficos de controle são dispositivos gráficos que servem para monitorar processos que, em geral, iniciam operação em um estado de controle estatístico (processo sob controle) e assim permanecem até o surgimento de uma causa especial que os levam para um segundo estado, onde as condições de controle estatístico deixam de existir (processo fora de controle). O esquema clássico de Shewhart para cartas de controle de variáveis mensuráveis X, consiste em se retirar, a intervalos de tempos regulares de comprimento 0h , amostras de tamanho 0n . Para cada amostra é determinado o valor de uma estatística G adequada. Então estes valores são plotados em cartas onde estão especificados limites de controle (LIC é o limite inferior de controle e LSC é o limite superior de controle), cujo espaçamento em relação a linha central, LC, é estabelecido com base na variabilidade natural das medidas de X de uma característica de qualidade de produtos advindos de um processo sob controle (vide Figura 1). Figura 1: Gráfico de controle G LSC LC LIC Número da amostra 33 Considerando uma linha de empacotamento de leite, espera-se que a média dos volumes dos saquinhos fique em torno do valor especificado de 1000 ml e que não exista grande variabilidade entre estes volumes, ver Figura 2. O valor especificado de 1000 ml é o valor-alvo da variável aleatória X, quantidade de leite em cada saquinho. A variável X pode ser ainda o diâmetro de um eixo, a concentricidade de um eixo, entre outras grandezas mensuráveis. Figura 2: Volume dos saquinhos de leite (processo estável e ajustado) As causas especiais alteram a distribuição da variável aleatória X, tirando sua média do valor-alvo e/ou aumentando a sua variabilidade (COSTA; EPPRECHT; CARPINETTI, 2005). Máquinas ajustadas ou controladas de maneira inadequada, erros do operador, ou matéria-prima defeituosa são exemplos de causas especiais. As causas especiais fazem com que os valores da estatística G se afastem da linha central do gráfico de controle. Deste modo, a presença de uma causa especial é sinalizada por um valor de G além dos limites de controle. Neste capítulo serão estudadas as propriedades dos gráficos de controle de Shewhart univariados e multivariados. Em especial serão estudados os gráficos de controle com amostragem dupla e regra especial de decisão. Antes, porém, serão definidos os riscos estatísticos inerentes ao monitoramento de processos por meio de gráficos de controle. As figuras da próxima seção foram adaptadas de Costa; Epprecht e Carpinetti (2005). 975 985 995 1005 1015 1025 0 5 10 15 20 25 30 35 40 Número das observações X (ml) especificações 34 2.2 ALARMES NO GRÁFICO DE CONTROLE Considere o gráfico de controle das médias X . Quando o processo está em um estado de controle estatístico, tem-se o risco α de um valor de X cair fora dos limites de controle, sinalizando indevidamente uma causa especial (“alarme falso”). A Figura 3 retrata a ocorrência de um alarme falso no gráfico de X . Quando o processo está fora de controle, portanto sob a influência de uma causa especial, tem-se o risco β de um valor de X cair dentro dos limites de controle, não sinalizando assim a existência da causa especial. A Figura 4 retrata a ocorrência de um alarme verdadeiro no gráfico de X . Figura 3: Gráfico de X - ocorrência de um alarme falso 15 30 45 60 75 90 105 Minutos )n/;(N~);(N~X 00XX σµσµ LM = µ0 nkLSC /00 σµ += Alarme falso nkLIC /00 σµ −= h = 15 min 35 Figura 4: Gráfico de X - ocorrência de um alarme verdadeiro A conseqüência de ordem prática associada ao erro do tipo I (alarme falso) é intervir no processo na hora errada, quando o mesmo está isento de causas especiais (o que em si já acarreta um custo – de interrupção do processo, de mão de obra – além de um risco de desajustar um processo que estava ajustado); e a conseqüência de ordem prática associada ao erro do tipo II (“não-detecção”) é não intervir no processo na hora certa, quando o mesmo está sob a influência de causas especiais. Em geral, as causas especiais comprometem a qualidade dos itens produzidos, portanto quanto antes forem descobertas e eliminadas melhor. 2.3 DESEMPENHO DOS GRÁFICOS DE CONTROLE Com base na relação entre os custos de operação e eficácia do gráfico de controle pode-se determinar a melhor combinação dos parâmetros dos gráficos de controle, ou seja, o tamanho da amostra n, o intervalo de tempo h entre retirada de amostras e o fator k de abertura dos limites de controle - ver Costa; Epprecht e Carpinetti, (2005). O desempenho dos gráficos de controle é medido pelo número médio de amostras até o sinal (NMA) ou pelo tempo esperado até o sinal (TES). Estas medidas de desempenho, por sua vez, dependem dos parâmetros de projeto do gráfico de 15 30 45 60 75 90 Minutos nkLSC /00 σµ += )n/;(N~);(N~X 000XX σδσ+µσµ LM = µ0 Alarme verdadeiro 00 δσ+µ=µ nkLIC /00 σµ −= δσ h = 15 minutos 36 controle n, h e k. Os parâmetros de projeto influenciam de forma diferente no desempenho dos gráficos de controle, nos riscos α e β e no custo de inspeção (COSTA; MACHADO, 2003, 2003a). Durante o período em controle o NMA=1/α e é denominado 0NMA , e durante o período fora de controle NMA=1/p, sendo p =1- β. Quando um processo está sob controle é desejável que o número médio de amostras retiradas do processo desde o início do monitoramento até o sinal (NMA0) seja grande, de modo a garantir poucos alarmes falsos. Quando um processo está fora de controle é desejável que o número médio de amostras retiradas desde a ocorrência de uma causa especial até o sinal (NMA) seja pequeno, de modo a garantir uma rápida detecção da causa especial. O TES (Tempo esperado até o sinal), isto é, o tempo esperado entre a ocorrência da causa especial e a sua detecção é dado por (ver Figura 5): TES = E(TS)= E(h x NAS - M)=h x E(NAS) - E(M) onde TS é o tempo até o sinal, NAS é o número de amostras até o sinal, M é o intervalo de tempo entre o momento da retirada da última amostra antes da ocorrência da causa especial e a ocorrência da causa especial. A esperança do número de amostras até o sinal, E(NAS), é o NMA, o número médio de amostras até o sinal (NMA = 1/p). A causa especial pode ocorrer em qualquer instante dentro de um intervalo h. Para M ~ uniforme [0, h], tem-se E(M)=h/2, ver Reynolds et al. (1988). Portanto, substituindo: TES = h x NMA – h/2 = h/p - h/2 Durante o período em controle o TES=h/α e é denominado TMAF, tempo médio até a ocorrência de um alarme falso. 37 h*NAS TS M h Pontos de Inspeção µ0 µ1 Figura 5: Tempo até o sinal Por exemplo para n=2 e k=3,00 são necessárias 17,81 amostras em média para detectar uma causa especial que desloca a média de um desvio padrão (δ=1). No exemplo dos saquinhos de leite se o volume X de cada saquinho tem média 0µ de 1000 ml e desvio-padrão 0σ de 10 ml, trata-se então de uma causa especial que desloca a média para 990 ml ou 1010 ml. Se aumentarmos n para 5 o NMA se reduz a 4,47. Se for retirada uma amostra a cada uma hora se gasta 17,31 horas (17,81 -0,5 = 17,31) para n=2 e 3,97 horas (4,47 – 0,5 = 3,97) para n=5 para se detectar a causa especial. Desta forma, observa-se que o aumento do tamanho da amostra melhora o desempenho do gráfico, ou seja, aumenta o poder em se detectar um desajuste do processo. Conseqüentemente o risco β diminui. Porém, o custo de inspeção se eleva com o aumento do tamanho da amostra. O risco α independe de n. Já o aumento de k tem um impacto negativo sobre o desempenho dos gráficos, pois diminui o seu poder. Em contrapartida, reduz-se a incidência de alarmes falsos, ou seja, o risco α diminui. Quanto ao h, deve-se ter sempre em mente o seguinte: valores pequenos de h implicam em custos elevados com amostragens e maior incidência de alarmes falsos. Antes de se aprofundar, porém, na escolha dos parâmetros de implementação do gráfico de controle de Shewhart é importante investigar se as condições do processo a ser monitorado satisfazem as suposições necessárias para a utilização do gráfico, isto 38 é, se as observações da característica de qualidade de interesse são independentes e normalmente distribuídas. A suposição mais importante relativa aos gráficos de controle é a de independência das observações, porque os gráficos de controle convencionais não funcionam bem se a característica da qualidade apresenta níveis, ainda que baixos, de correlação ao longo do tempo. Especificamente, esses gráficos de controle darão resultados enganosos sob a forma de demasiados alarmes falsos se os dados são autocorrelacionados (MONTGOMERY, 2004). Este aspecto tem sido enfatizado por vários autores, incluindo Russo e Camargo (2004), Moreira e Echeveste (2004) e Moreira e Caten (2004). Infelizmente, a suposição de observações não-correlacionadas ou independentes nem sempre é satisfeita em alguns processos de fabricação. Os exemplos incluem processos químicos em que medidas consecutivas de uma variável do processo ou uma característica do produto se apresentam não raro altamente correlacionadas (MONTGOMERY, 2004). De fato, Shewhart, ao criar os gráficos de controle, estava considerando indústrias de partes discretas, com nenhum ou quase nenhum grau de automação. Em tais processos, a condição de independência das observações geralmente é satisfeita. Hoje em dia, porém, processos contínuos e por batelada são extremamente freqüentes, principalmente (embora não exclusivamente) na indústria química e na indústria metalúrgica. Tais processos raramente produzem observações independentes, de modo que não podem ser monitorados pelos gráficos convencionais. Este problema não se restringe a processos contínuos e por bateladas: processos discretos altamente automatizados também costumam produzir dados autocorrelacionados (COSTA; EPPRECHT; CARPINETTI, 2005). Portanto, é importante antes de iniciar o monitoramento de um processo, identificar se ele produz observações independentes ou se é autocorrelacionado, pois um gráfico de controle inadequado, que produza alarmes falsos em excesso, acabará sendo descartado, ou pior, mantido apenas para cumprir alguma exigência formal. Os alarmes são simplesmente ignorados pelo pessoal envolvido com o processo. 39 2.4 GRÁFICOS DE CONTROLE UNIVARIADOS Os gráficos de controle têm sido a principal ferramenta estatística utilizada no monitoramento de processos, graças a sua simplicidade operacional. De acordo com os fundamentos de Shewhart, sempre que um ponto é plotado na região de ação do gráfico, o responsável pelo processo deve interrompê-lo imediatamente, visando encontrar causas especiais que afetam a qualidade dos produtos, exemplo, um desgaste de ferramenta que altera o diâmetro X dos eixos que estão sendo manufaturados. Entretanto, essa simplicidade torna o gráfico de controle lento, na detecção de pequenas e moderadas alterações nos parâmetros dos processos que estão sendo monitorados, isto é, na média e/ou na variância da variável aleatória X. Diante disso, não têm sido poucas as propostas de alteração à idéia original de Shewhart, como por exemplo, os gráficos de controle adaptativos, a amostragem dupla, a amostragem em dois estágios e as regras especiais de decisão, citados por Wu e Spedding (2000) e Machado e Costa (2005, 2005a). A idéia de se variar os parâmetros dos gráficos de controle univariados (gráficos adaptativos), tais como o tamanho de amostra, o intervalo de tempo entre retirada de amostras, tem sido bastante explorada. Reynolds et al. (1988), Runger e Pignatiello (1991), Reynolds e Arnold (1989), Runger e Montgomery (1993) e Reynolds e Stoumbos (2001) estudaram o caso em que o intervalo entre retirada de amostras é variável (VSI – Variable Sampling Interval). Quando os gráficos de Shewhart com intervalo de tempo entre retirada de amostras variável estão em uso a ocorrência de uma observação na região central do gráfico não levanta suspeitas de que o processo esteja desajustado, conseqüentemente o monitoramento é relaxado e um intervalo de tempo maior que o usual é adotado para a retirada da próxima amostra. Por outro lado, a ocorrência de uma observação na região de advertência do gráfico de controle, levanta suspeita de que o processo se desajustou, conseqüentemente, a próxima amostra é retirada o mais breve possível visando confirmar ou não tal suspeita. Mantendo a mesma freqüência de inspeção durante o período em que o processo permanece ajustado, o gráfico VSI precisa, em 40 média, de menos amostras para sinalizar um desajuste. De forma análoga é possível variar os demais parâmetros dos gráficos de controle. A idéia do gráfico de Shewhart com tamanho de amostra variável (VSS – Variable Sample Size) foi introduzida por Prabhu; Runger e Keats (1993) e Costa (1994). Prabhu; Montgomery e Runger (1994) e Costa (1997, 1999) abordaram também o caso em que tanto o tamanho de amostra como o intervalo entre retiradas de amostras são variáveis (VSSI – Variable Sampling Size Interval). Costa (1998,1999a) estendeu o estudo do gráfico de Shewhart VSSI e incluiu limites de ação variáveis, sendo este gráfico denominado por gráfico de controle VP (Variable Parameters). Assim como o esquema adaptativo, o gráfico de controle com amostragem dupla proposto por Daudin (1992), foi criado para atender a necessidade de se ter uma ferramenta estatística ágil na detecção de pequenas alterações nos parâmetros do processo. Quando o gráfico de controle X com amostragem dupla está em uso a amostragem é realizada em dois estágios com amostras de tamanho n , sendo n = 1n + 2n . A ocorrência de uma média amostral, considerando a sub-amostra de tamanho 1n , distante do seu valor-alvo leva ao segundo estágio da amostragem, onde as 2n unidades restantes são inspecionadas e a média amostral considerando a amostra de tamanho n é calculada e comparada com os limites de controle. A amostragem em dois estágios é um caso particular da amostragem dupla, onde 1n =1. Quando se tem um processo bastante estável, isto é, com média e variância que permanecem longos períodos de tempo sem se alterarem, o monitoramento se torna bastante monótono, pois raramente um valor de X , ou de R, cai fora dos limites de controle. A conseqüência natural é de o usuário dar cada vez menos atenção aos passos necessários para a obtenção dos valores de X e de R. Esta falta de atenção pode, em alguns casos, levar a sérios enganos. A amostragem em dois estágios (COSTA; RAHIM, 2004, 2006) torna o monitoramento mais simples e menos monótono. No primeiro estágio, um item da amostra é inspecionado, e seu valor de X é comparado com os limites do gráfico de Shewhart para observações individuais. Deste modo, se o ponto X cair dentro dos limites de controle a amostragem é interrompida, caso contrário, segue-se para o 41 segundo estágio, quando então toda amostra é inspecionada, e sua média X é agora comparada com os limites do gráfico de Shewhart para médias (podendo também ser calculada a sua amplitude R, para então ser comparada com os limites do gráfico de Shewhart para as amplitudes). Quando a amostragem em dois estágios está em uso, no primeiro estágio é possível trabalhar com atributos e, desta forma, reduzir o esforço com inspeção. O gráfico de Shewhart sinaliza uma deterioração do processo sempre quando um ponto cai em sua região de ação. Alternativamente, Wu e Spedding (2000) propuseram um gráfico de controle com regra especial de decisão conhecido como Synthetic Control Chart. O Synthetic Control Chart sinaliza somente quando um segundo ponto cai na região de ação, e sob a condição de que o número de amostras entre os dois pontos que caíram na região de ação, não seja superior a um valor inteiro L. O Synthetic Control Chart tem sido objeto recente de pesquisa, ver Wu e Spedding (2000, 2000a), Wu e Yeo (2001), Wu; Yeo e Spedding (2001), Calzada e Scariano (2001), Davis e Woodall (2002), Machado e Costa (2005,2005a) e Costa e Rahim (2006a). Para variáveis de qualidade do tipo mensurável, é comum o uso de dois gráficos de controle, um para o monitoramento da média do processo e outro para o monitoramento da variabilidade, ver Costa; Epprecht e Carpinetti, (2005), Costa (1993), Costa e Rahim (2000, 2001), Rahim e Costa (2000), Gan (1995), Albin; Kang e Sheha (1997), Costa (1998 e 1999) e Costa e Rahim (2004). A principal conclusão que pode ser tirada de todos esses estudos é que nenhum dos gráficos conjuntos são confiáveis na identificação do tipo de causa especial. Na prática, a velocidade com a qual os gráficos de controle detectam mudanças no processo parece ser mais importante do que a habilidade destes em identificar o tipo de mudança. Deste modo, faz sentido considerar um único gráfico de controle, baseado em uma única estatística, para o monitoramento simultâneo da média e da variância do processo, ver Domangue e Patch (1991), Chen; Cheng e Xie (2001, 2004), Costa e Rahim (2004a, 2006), Costa e De Magalhães (2005), Costa; Epprecht e Carpinetti (2005), Barbosa; Machado e Costa (2005). 42 A combinação do uso da regra especial de decisão com uma única estatística para o monitoramento da média e da variabilidade do processo tem sido objeto de estudo. Machado e Costa (2005,2005a) têm utilizado com sucesso a estatística R. Sejam ,...3,2,1 , =ixij , e nj ,...,2,1= as observações da variável X organizadas em grupos de tamanho n > 1, com i indexando o número do grupo. Seja nXXX inii /)...( 1 ++= a i- ésima média amostral, e seja 0µ−= ii Xe a diferença entre a i-ésima média amostral e o valor alvo da média do processo. Então para     <− ≥ = 0e se , 0e se , i i d d iξ , tem-se que: ,...,iXR n j iiji 21 ,)( 1 2 00 =+−= ∑ = σξµ onde d é uma constante positiva. Quando d=0, 2 0 )/(γσiR tem distribuição de qui- quadrado não-central com n graus de liberdade e um parâmetro de não-centralidade 22 /γδλ n= , ou seja )(~)/( 22 0 λχγσ niR , ver Chen; Cheng e Xie (2004). O uso da estatística de Qui-quadrado não-central para controlar a média e a variância do processo tem sido também objeto de estudo de Costa e Rahim (2004a, 2006, 2006a, 2006b), Costa e De Magalhães (2005, 2006), Machado e Costa (2005, 2005a) e Barbosa; Machado e Costa (2005). 2.5 GRÁFICOS DE CONTROLE MULTIVARIADOS Até agora se discutiu os gráficos de controle univariados. Porém, o aumento da complexidade e dos níveis de automação dos processos industriais e a crescente disponibilidade de suporte computacional, têm aumentado o interesse pelo monitoramento simultâneo de várias características de qualidade, também chamadas de variáveis do processo (LOWRY; MONTGOMERY, 1995). Pouco a pouco as novas estratégias de monitoramento de processos univariados estão sendo aplicadas ao monitoramento de processos multivariados. Antes de discutir, porém, as estratégias de monitoramento multivariadas na seção 2.5.1 estão algumas notações e conceitos sobre vetores aleatórios, matrizes de covariância e de correlação com o intuito de mostrar como esses são utilizados dentro do contexto de estatística multivariada; na seção 2.5.2 estão as equações para 43 estimação das matrizes de covariâncias e de correlação através de dados amostrais e na seção 2.5.3 apresenta-se a distribuição normal multivariada. 2.5.1 O Vetor de Médias e a Matriz de Covariâncias Amostrais Seja X um vetor contendo k componentes, onde cada componente é uma variável aleatória, isto é, Xi é uma variável aleatória onde i = 1, 2, ..., k. Então, X é chamado de vetor aleatório e é denotado por:               ⋅ ⋅ ⋅= kX X X X 2 1 O vetor transposto de vetor aleatório X é denotado por [ ]kXXXXX ... 321=′ . O vetor )(XE=µ é chamado de vetor de médias do vetor [ ]kXXXXX ... 321=′ , sendo               ⋅ ⋅⋅=               ⋅ ⋅⋅== kkXE XE XE XE µ µ µ µ )( )( )( )( 2 1 2 1 Onde )( ii XE=µ denota a média, ou esperança, da variável aleatória Xi, i = 1, 2, ..., k. A variância do i-ésimo componente do vetor X é denotada por iiiiXVar σσ == 2)( . O desvio padrão é denotado por iσ ou iiσ e fornece a informação sobre a disposição dos valores das variáveis Xi em relação a iµ , isto é, indica se os valores de Xi estão próximos ou distantes da média iµ . Assim, valores grandes de iσ indicam uma maior dispersão de valores em relação à média da distribuição. A covariância entre os valores da i-ésima e j-ésima variáveis do vetor X é definida por: )])([(),( jjiiijji XXEXXCov µµσ −−== (2.1) 44 A covariância serve para medir o grau de relacionamento linear entre duas variáveis aleatórias. Basicamente, observando-se a expressão (2.1), percebe-se que quando os valores de Xi acima da média iµ tendem a estar associados aos valores de Xj acima da média jµ , a covariância ijσ tende a ser positiva assim como quando os valores de Xi abaixo da média iµ tenderem a estar associados aos valores de Xj abaixo da média jµ . Portanto, à medida que a variável Xi cresce (decresce) numericamente, a variável Xj também cresce (decresce) linearmente. Quando os valores de Xi acima da média iµ tendem a estar associados com valores de Xj abaixo da média jµ , ou vice- versa, a covariância ijσ tende a ser negativa. Neste caso, à medida que a variável Xi cresce (decresce) numericamente, a variável Xj decresce (cresce) linearmente. Embora a covariância tenha informação sobre o relacionamento linear entre duas variáveis, é difícil julgar se a relação é forte ou não, observando-se apenas os seus valores numéricos uma vez que não se tem um valor de referência mínimo ou máximo para comparação dos valores ijσ . Assim, uma medida mais útil na prática é a correlação. (MINGOTI, 2005). É prática comum apresentar os valores de ijσ em uma matriz chamada matriz de covariâncias. A matriz de variâncias e covariâncias do vetor aleatório X é denotada por:           =∑= kkkk k k kxkXCov σσσ σσσ σσσ )( 21 22221 11211 L MOMM L L . A título de ilustração, a matriz     − −=∑ 5 2 2 8 22 x representa a matriz de covariâncias de um vetor aleatório [ ]21 XXX =′ , tal que 11σ = 2 1σ = 8; 22σ = 2 2σ = 5; 12σ = 21σ = -2. O coeficiente de correlação entre a i-ésima e j-ésima variáveis do vetor X é definido por: ji ij ijii ij ij σσ σ σσ σ ρ == 45 onde 11 ≤≤− ijρ , i = 1, 2, ..., k. A correlação é uma medida mais adequada para avaliar o grau de relacionamento linear entre duas variáveis quantitativas do que a covariância, pois seus valores estão sempre entre -1 e 1. Assim quanto mais próximo de 1, mais indicação se tem de que existe um relacionamento linear positivo entre as variáveis Xi e Xj e quanto mais próximo de -1, mais indicação se tem da existência de um relacionamento linear negativo. Uma correlação próxima de zero é uma indicação numérica de um não-relacionamento linear entre as variáveis em questão. Quando se têm muitas variáveis, o procedimento mais comum é apresentar os valores de ijρ em uma matriz chamada de matriz de correlação. 2.5.2 Estimação de Parâmetros: Vetor de médias, Matrizes de Covariâncias e de Correlação Populacionais Na prática, as matrizes de covariâncias e de correlação teóricas precisam ser estimadas através de dados amostrais. Assim, supondo que se dispõe de uma amostra aleatória de tamanho n, onde, para cada elemento da amostra, tenha-se observado os valores de k-variáveis aleatórias de interesse, ou seja, têm-se n vetores aleatórios independentes e identicamente distribuídos da forma:           = 1 21 11 1 kX X X X M           = 2 22 12 2 kX X X X M , ... ,           = kn n n n X X X X M 2 1 sendo que o primeiro índice indica a variável e o segundo o elemento amostral. O vetor de médias µ será estimado pelo vetor de médias amostrais X definido por: [ ]           =++= k n X X X XXX n X M K 1 2 1 21 onde iX é a média amostral da i-ésima variável, i = 1, 2, ..., k. A matriz de covariâncias kxk ∑ será estimada pela matriz de covariâncias amostrais kxkS definida por: 46           = kkkk k k kxk SSS SSS SSS S 21 22221 11211 L MMMM L L sendo jiij SS = , ij ≠ e iiS definidos respectivamente por: ( ) 1 1 2 − − = ∑ = n XX S n l iil ii que é a variância amostral da i-ésima variável, ( )( ) 1 1 − −− = ∑ = n XXXX S n l jjliil ij que é a covariância amostral entre a i-ésima e j-ésima variáveis. A matriz de correlação teórica kxkP será estimada pela matriz de correlação amostral kxkR definida por:           = kkkk k k kxk RRR RRR RRR R 21 22221 11211 L MMMM L L onde jjii ij kxk SS S R = é o coeficiente de correlação amostral entre as i-ésima e j-ésima variáveis, conhecido como coeficiente de correlação de Pearson (MINGOTI, 2005). 2.5.3 Distribuição Normal Multivariada A distribuição normal multivariada é uma generalização da normal univariada para o caso no qual se trabalha com duas ou mais variáveis aleatórias simultaneamente. A distribuição normal univariada com média µ e variância 2σ tem densidade de probabilidades dada por: ( )               −− = 2 2 1 2 1 σ µ σπ x expxf . No caso de um vetor aleatório de dimensão k, ou seja, [ ]kXXXXX ... 321=′ diz-se que este vetor tem uma distribuição normal k-variada, e denota-se ( )kxkNX ,~ ∑µ , se a função densidade de probabilidade de X for dada por: 47 ( ) ( ) ( ) ( )       −∑ ′ − − ∑ = − µµ π xxexpxxxf kk 1 21221 2 1 2 1 ,,, K . A quantidade ( ) ( )µµ −∑ ′ − − xx 1 é referida como a distância de Mahalanobis do vetor x ao vetor de médias µ . Ela também é denominada de distância padronizada ou distância estatística (MINGOTI, 2005). Quando k = 2, tem-se a distribuição normal bivariada. Nesse caso, a função densidade do vetor [ ]21 XXX =′ é dada por: ( ) ( ) ( ) ( )       −∑ ′ − − ∑ = − µµ π xxexpxxf 1 2121 2 1 2 1 , ,         =         =∑ 2 221 21 2 1 22 21 12 11 σσρσ σρσσ σσ σσ sendo ρ o coeficiente de correlação entre X1 e X2, 11 <<− ρ , ( )22 2 2 1 1 ρσσ −=∑ . Quando ρ =0, a função ( )21, xxf é o produto de duas densidades normais univariadas e, logo, as variáveis X1 e X2 são independentes, isto é, ( ) ( ) ( )2121 , xgxgxxf = onde, ( ) ( )               −− = 2 1 11 1 1 2 1 2 1 σ µ σπ x expxg ( ) ( )               −− = 2 2 22 2 2 2 1 2 1 σ µ σπ x expxg Portanto, no caso da distribuição normal k-variada, se X1 e X2 forem não correlacionadas também serão independentes (MINGOTI, 2005). 2.6 GRÁFICO DE CONTROLE 2T DE HOTELLING Desde que foi criado, o gráfico de controle baseado na estatística 2T para o monitoramento de processos multivariados (HOTELLING, 1947) passou a ser o dispositivo estatístico mais usual no monitoramento de duas ou mais características de qualidade. Lowry e Montgomery (1995) fazem uma revisão dos gráficos de controle 48 multivariados. Mason e Young (2002) discutem exaustivamente as aplicações do gráfico de controle 2 T . O gráfico de controle 2T é utilizado no monitoramento simultâneo de k variáveis de interesse. Quando o vetor das médias e a matriz de covariância, 0µ e 0∑ , de um processo k-variado distribuído normalmente são conhecidos, a estatística 2 T de Hotelling para a i-ésima amostra é dada por: ( ) ( ),0 1 00 2 µµ −∑ ′ −= − iii XXnT onde n é o tamanho da i-ésima amostra e iX é o vetor das médias amostrais dos k parâmetros para a amostra i. Quando o processo está sob controle, 2 iT segue uma distribuição de Qui-quadrado com k graus de liberdade. Quando o vetor das médias e a matriz de covariância são desconhecidos, costuma-se utilizar os estimadores 0µ̂ e 0∑̂ baseados em m amostras: ∑ = == m i iX m X 1 0 1 µ̂ e , 1ˆ 1 0 ∑ = ==∑ m i iS m S onde iX e iS são respectivamente o vetor das médias da amostra e a matriz de covariância da i-ésima amostra aleatória e independente de uma distribuição normal k- variada com vetor das médias 0µ e matriz de covariância 0∑ . Assim, a estatística utilizada no monitoramento do processo para o caso em que os parâmetros são estimados, é dada por: ( ) ( ),ˆˆˆ 0 1 00 2 µµ −∑ ′ −= − iii XXnT neste caso, 2 iT segue uma distribuição F não-central. Recentemente Champ, Jones-Farmer e Rigdon (2005) estudaram as propriedades do gráfico de controle 2T quando os parâmetros são estimados. O gráfico de controle 2T de Hotelling é análogo ao gráfico X de Shewhart, sendo ambos pouco sensíveis a deslocamentos pequenos e moderados do vetor das médias. Desta forma, métodos estatísticos univariados tais como, o esquema CUSUM e o gráfico de EWMA, ver Costa; Epprecht e Carpinetti (2005), têm sido utilizados para o caso multivariado (ver Woodall e Ncube (1985); Crosier (1988); Pignatiello e Runger (1990); Lowry et al. (1992); Lowry e Montgomery (1995); Prabhu e Runger 49 (1997); Qiu e Hawkins (2001)) em que o vetor de médias está sujeito a pequenas alterações. Bernard (2001) estudou o desempenho do gráfico de EWMA multivariado para o monitoramento da variabilidade de um processo. A idéia de se variar os parâmetros dos gráficos de controle multivariados (gráficos adaptativos multivariados), tais como o tamanho da amostra, o intervalo de tempo entre retiradas de amostras, tem sido explorada em artigos recentes (Aparisi (1996), Aparisi e Haro (2001), Aparisi e Haro (2003), Chou; Chen e Chen (2006)). A adoção da amostragem dupla para o caso de processos multivariados tem sido estudada por Grigoryan e He (2005) e He e Grigoryan (2005). Grigoryan (2003) estudou o caso dos gráficos multivariados com amostragens múltiplas obtendo o NMA por meio de simulação. Alternativamente, Machado e Costa (2006, 2006a) se dedicaram a obtenção das propriedades dos Gráficos de Controle Bivariados com Amostragem em Dois Estágios e com Regra Especial de Decisão por meio de desenvolvimentos teóricos. Skinner (2002) estudou esquemas de controle multivariados apropriados para o caso em que as variáveis têm uma distribuição de Poisson. Uma dificuldade encontrada ao se lidar com qualquer gráfico de controle multivariado é a interpretação prática de um sinal de fora de controle. Especificamente, não se sabe ao certo qual das k variáveis (ou qual subconjunto delas) é responsável pelo sinal. A prática padrão consiste em plotar gráficos X univariados para as variáveis kXXXX ... 321 . No entanto, essa abordagem pode não ser bem sucedida (MONTGOMERY, 2004). Mason e Young (2002) discutem como o método da decomposição ortogonal pode auxiliar na interpretação de um sinal no gráfico 2 T . Thomas (2002) estende os estudos realizados por Mason et al. (1995) sobre a decomposição da estatística 2T de Hotelling para identificação das variáveis fora de controle quando em uso um esquema de monitoramento multivariado. Konrath (2002) estuda o gráfico de controle multivariado 2T de Hotelling, decompondo a estatística 2T por meio de um algoritmo computacional, também baseado na abordagem proposta por Mason et al. (1995). Antes de se utilizar um esquema de monitoramento multivariado deve-se investigar se os vetores de observações são independentes, assim como para o caso 50 univariado. As observações de um processo multivariado são k-dimensional e as componentes são, em geral, correlacionadas. Para o caso univariado, uma abordagem que se tem revelado útil quando se lida com dados autocorrelacionados consiste em modelar diretamente a estrutura correlacional com um modelo apropriado de série temporal, usar esse modelo para remover a autocorrelação dos dados e aplicar gráficos de controle aos resíduos ((MONTGOMERY; MASTRANGELO, 1991) e (LU; REYNOLDS, 1999)). São poucos, até o momento, os esquemas de monitoramento desenvolvidos para o caso multivariado quando as observações do processo são autocorrelacionadas. Kalgonda e Kulkarni (2004) propõem um esquema para o monitoramento da média de um processo multivariado autocorrelacionado. Eles consideram que as observações do processo seguem um modelo de série temporal vetorial de primeira ordem estacionário, VAR (1), e investigam o desempenho do esquema de monitoramento proposto em diagnosticar o sinal. 51 3 DESCRIÇÃO DO GRÁFICO DE CONTROLE BIVARIADO COM AMOSTRAGEM DUPLA E DE ALGUNS ESQUEMAS CONCORRENTES 3.1 CONSIDERAÇÕES INICIAIS Este capítulo se dedica a descrição dos gráficos de controle propostos para o monitoramento de processos bivariados. São eles: gráfico de controle bivariado com amostragem dupla (Bivariate Control Chart with Double Sampling ou gráfico BIDU), gráfico de controle bivariado com amostragem em dois estágios (Bivariate Control Chart with Two Stage Sampling ou gráfico BITWO), que é um caso particular do gráfico BIDU, e os gráficos BIDU e BITWO com regra especial de decisão (Bivariate Synthetic Control Charts ou, respectivamente, gráficos SyBIDU e SyBITWO). Além disso, serão descritos alguns gráficos multivariados existentes na literatura, para o caso particular de duas variáveis, com os quais os gráficos bivariados propostos concorrem. São eles: o gráfico de controle multivariado tradicional (gráfico 2 T ) introduzido por Hotelling (1947); o gráfico de controle multivariado com tamanho de amostra variável (Multivariate Control Chart with Variable Sample Size ou MVSS chart) objeto de estudo de Aparisi (1996); o gráfico de controle multivariado com intervalo de tempo entre retirada de amostras variável (Multivariate Control Chart with Variable Sampling Interval ou MVSI chart) estudado por Aparisi e Haro (2001) e o gráfico multivariado com ambos tamanho de amostra e intervalo de tempo entre retirada de amostras variáveis (MVSSVSI chart) estudado por Aparisi e Haro (2003). 3.2 GRÁFICO DE CONTROLE BIDU O gráfico de controle BIDU é empregado no monitoramento de duas características de qualidade (x; y), descritas por uma distribuição normal bivariada com vetor de médias );(' yx µµµ = e uma matriz de covariâncias conhecida         =Σ 2 2 yyx xyx σσ σσ , em que yxyxxy σρσσσ == é a covariância entre x e y. No início do 52 monitoramento o vetor de médias está centrado nos valores-alvo, );( 00 ' 0 yx µµµ = , mas após um certo tempo aleatório uma causa especial altera o vetor de médias de 0µ para 1µ , em que );()( ' 01 yyxx σδσδµµ =− , com 0≠xδ e/ou 0≠yδ sem alterar a matriz de covariâncias. Durante o período em controle 0µµ = e durante o período fora de controle 1µµ = . O objetivo do monitoramento é detectar qualquer causa especial que tire µ ′ do seu valor alvo 0µ ′ . Similarmente ao gráfico de controle de Shewhart, amostras com tamanho 1n + 2n são retiradas do processo em intervalos de tempos regulares. A amostragem é realizada em dois estágios. No primeiro estágio 1n unidades são inspecionadas, duas características de qualidade );( yx são medidas e a distância estatística entre ),( 111 yxX = e );( 00 ' 0 yx µµµ = , dada por )()( 01 1' 011 2 1 µµ −Σ−= − XXnT é calculada, sendo 1x e 1y as médias amostrais das duas características de qualidade );( yx da sub- amostra de tamanho 1n . Se 2 1T for menor do que o limite de advertência, LA , a amostragem é interrompida. Se 2 1T for maior do que o limite de controle do primeiro estágio, 1LC , o gráfico de controle sinaliza um desajuste do processo. Se 1LC < 2 1T < LA , a amostragem vai para o segundo estágio, onde as 2n unidades restantes são inspecionadas e a distância estatística entre ),( 222 yxX = e );( 000 yx µµµ = , dada por )()( 02 1' 02 2 2 µµ −Σ−= − XXnT , é calculada, sendo 2x e 2y as médias amostrais de );( yx levando em consideração a amostra de tamanho n , sendo n = 1n + 2n . O gráfico também sinaliza um desajuste do processo quando 2 2T > 2LC , sendo 2LC o limite de controle do segundo estágio. A região dada por ( LA , 1LC ) será chamada de região de advertência. A região acima de 1LC será chamada de região de ação do primeiro estágio e a região acima de 2LC será chamada de região de ação do segundo estágio. Se um ponto cai na região de ação antes da média do processo se desajustar, isto é, quando 0µµ = , tem-se um alarme falso. Em outras palavras, o gráfico de controle 53 sinaliza erroneamente a ocorrência de uma causa especial. No primeiro estágio