Flávio Lima de Souza Classificador Fisherface Fuzzy para o Reconhecimento de Faces São José do Rio Preto 2014 Flávio Lima de Souza Classificador Fisherface Fuzzy para o Reconhecimento de Faces Dissertação apresentada para obtenção do t́ıtulo de Mestre em Matemática, área de Modelagem Matemática, junto ao Programa de Pós Graduação em Matemática do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Campus São José do Rio Preto. Orientador: Prof. Dr. Mauŕılio Boaventura Coorientadora: Profa. Dra. Inês Aparecida Gasparotto Boaventura São José do Rio Preto 2014 Flávio Lima de Souza Classificador Fisherface Fuzzy para o Reconhecimento de Faces Dissertação apresentada para obtenção do t́ıtulo de Mestre em Matemática, área de Modelagem Matemática, junto ao Programa de Pós Graduação em Matemática do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Campus São José do Rio Preto. COMISSÃO EXAMINADORA Prof. Dr. Mauŕılio Boaventura Professor Adjunto UNESP - São José do Rio Preto Orientador Profa. Dra. Alessandra Aparecida Paulino Professora Doutora UNESP - Bauru Prof. Dr. Evanivaldo Castro Silva Júnior Professor Doutor FATEC - São José do Rio Preto São José do Rio Preto, 25 de julho de 2014. Dedico este trabalho a meu avô Eufrázio Eleutério, exemplo de trabalho, dedicação e honestidade. Agradecimentos Essa é uma parte extremamente importante desta dissertação, uma vez que tenho a oportunidade de agradecer às pessoas que de alguma forma, direta ou indiretamente participaram da realização da mesma, em especial, agradeço: A Deus, pelo dom da vida. Ao meu orientador Prof. Dr. Mauŕılio Boaventura, por todas as informações que me forneceu, pela disponibilidade de tempo, por me compreender e me ajudar nos momentos dif́ıceis que enfrentei e acima de tudo, pelos seus ensinamentos e conselhos que foram cruciais para a realização deste trabalho. À Profa. Dra. Inês Aparecida Gasparotto Boaventura, pelas sugestões, apoio e dedicação à esse projeto. À minha mãe, Aparecida, pelo amor, carinho, orações e amparo incondicional. À minha irmã, Adrieli, pelo apoio e ajuda ao longo desta etapa da minha vida. À minha sobrinha, Amanda, pelas alegrias, discontrações, teimosias e por me tornar o tio mais coruja do mundo. Aos meus avós, Maria Marinete, Elena e Eteuvino, pelos incentivos constantes e em especial ao meu querido avô Eufrázio, que recentemente foi embora, mas deixou muitas saudades. Aos meus familiares em geral que sempre me apoiaram. Agradeço também ao meu grande amigo João Carlos e seu filho Arthur, duas pessoas maravilhosas que ficarão marcadas sempre em minha vida. As minhas amigas de longa dada: Andressa, Camilla e Eiva. Aos meus eternos amigos: Aline, Cristina, Felipe, Janaina, Jéssica, Robson e Silmara. A todos vocês, quero registrar aqui, meus singelos agradecimentos. Agradecimentos vi Quero agradecer também a todos os meus professores de ensino médio, graduação e pós-graduação, por valiosos ensinamentos, em especial à professora Zulmira Afonso (Escola Estadual Armel Miranda) e ao Prof. Dr. Lúıs Antônio (UNESP-FEIS). À todas as pessoas e funcionários do IBILCE/UNESP que contribúıram de diferentes formas para a elaboração deste trabalho, em especial, ao André Luiz pela ajuda na implementação do algoritmo. À CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nı́vel Superior, pelo apoio financeiro. Obrigado a todos. “Quem quer fazer alguma coisa encontra um meio. Quem não quer fazer nada, encontra uma desculpa.” Aforisma Árabe Resumo A presente dissertação é um estudo do método Fisherface Fuzzy e das funções de pertinência fuzzy para o reconhecimento de faces. O tradicional método Fisherface é constitúıdo de duas técnicas de redução de dimensionalidade de dados: Análise de Componentes Principais (PCA) e Análise de Discriminante Linear (LDA). O método é relativamente insenśıvel a diversos fatores que atuam sobre as imagens, como variação na iluminação e diferentes expressões faciais. A fim de superar esses fatores e melhorar as taxas de reconhecimento do método Fisherface, é incorporado ao seu algoritmo graus de pertinência fuzzy, que são calculados a partir da técnica de k-vizinhos mais próximos (KNN), dando origem ao método Fisherface Fuzzy. O objetivo deste trabalho é avaliar o desempenho desses dois métodos e propor a utilização de uma nova função de pertinência para o método Fisherface Fuzzy. Os testes são realizados em duas bases de imagens faciais: Yale e ORL. Palavras-chave: Computação - Matemática, Modelos matemáticos, Reconheci- mento facial (computação), Sistemas difusos, Biometria. Abstract This dissertation is a study of the Fuzzy Fisherface method and fuzzy membership functions for recognizing faces. The traditional Fisherface method consists of two techniques of data dimensionality reduction: Principal Components Analysis (PCA) and Linear Discriminant Analysis (LDA). The method is relatively insensitive to many factors that influence the images, such as variation in illumination and different facial expressions. In order to overcome these factors and improve recognition rates of the Fisherface method, fuzzy membership degrees are embedded in your algorithm, and they are which are calculated from the technique of k-nearest neighbors (KNN) to give the Fuzzy Fisherface method. The objective of this study is to evaluate the performance of these two methods and propose the use of a new membership function for the Fuzzy Fisherface method. The tests are conducted on two bases of facial images: Yale and ORL. Keywords: Computing - Mathematics, Mathematical models, Face Recognition (computing), Fuzzy systems, Biometrics. Lista de Figuras 2.1 Caracteŕısticas F́ısicas comumente utilizadas na identificação de pessoas (imagens adaptadas da internet). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.2 Exemplos de Caracteŕısticas Comportamentais (imagens adaptadas da internet). . . . 7 2.3 Fase de registro ou cadastramento em Sistemas Biométricos, adaptada de http://www.metropoledigital.ufrn.br, acessado em 09/06/2014. . . . . . . . . . . . . 7 2.4 Fase de verificação ou comparação em Sistemas Biométricos, adaptada de http://www.metropoledigital.ufrn.br, acessado em 09/06/2014. . . . . . . . . . . . . 8 2.5 Fase de Identificação em Sistemas Biométricos, adaptada de http://www.metropoledigital. ufrn.br, acessado em 09/06/2014. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.6 Pontos identificadores das Impressões Digitais. . . . . . . . . . . . . . . . . . . . . . 10 2.7 Estrutura do DNA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.8 Imagem de um olho humano com a ı́ris em destaque (à esquerda) e imagem do fundo do olho humano, onde observamos os vasos sangúıneos da retina (à direita). . . . . . 11 2.9 Alguns pontos importantes para o reconhecimento facial. . . . . . . . . . . . . . . . 12 2.10 Pontos caracteŕısticos utilizados na Geometria da Mão. . . . . . . . . . . . . . . . . 13 2.11 Vibrações emitidas pela voz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.12 Forma de digitação em um teclado (à esquerda) e um estilo de um indiv́ıduo escrever (à direita). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.13 Modelo do Processo de Reconhecimento Facial . . . . . . . . . . . . . . . . . . . . . 17 2.14 Ilustração do pixel - menor elemento da imagem digital. . . . . . . . . . . . . . . . . 20 3.1 Ilustração da diferença entre os conjuntos fuzzy e crisp. . . . . . . . . . . . . . . . . 33 3.2 Função de Pertinência do tipo Trapezoidal. . . . . . . . . . . . . . . . . . . . . . . 34 x LISTA DE FIGURAS xi 3.3 Função de Pertinência do tipo Triangular. . . . . . . . . . . . . . . . . . . . . . . . 35 3.4 Função de Pertinência do tipo Gaussiano. . . . . . . . . . . . . . . . . . . . . . . . 35 3.5 Diagrama de Funcionamento do Método Fisherface Fuzzy. . . . . . . . . . . . . . . . 39 4.1 Diagrama detalhado do modelo avaliado - Fase de treinamento. . . . . . . . . . . . . 51 4.2 Exemplo de imagens faciais femininas e masculinas da base Yale. . . . . . . . . . . . 56 4.3 Médias das taxas de reconhecimento para o método Fisherface Fuzzy. . . . . . . . . . 59 4.4 Taxas de Reconhecimento para a Base Yale - Caso 1. . . . . . . . . . . . . . . . . . 61 4.5 Taxas de Reconhecimento para a Base Yale - Caso 2. . . . . . . . . . . . . . . . . . 61 4.6 Taxas de Reconhecimento para a Base Yale - Caso 3. . . . . . . . . . . . . . . . . . 62 4.7 Taxas de Reconhecimento para a Base Yale - Caso 4. . . . . . . . . . . . . . . . . . 62 4.8 Taxas de Reconhecimento para a Base Yale - Caso 5. . . . . . . . . . . . . . . . . . 63 4.9 Taxas de Reconhecimento para a Base Yale - Caso 6. . . . . . . . . . . . . . . . . . 63 4.10 Taxas de Reconhecimento para a Base Yale - Caso 7. . . . . . . . . . . . . . . . . . 64 4.11 Taxas de Reconhecimento para a Base Yale - Caso 8. . . . . . . . . . . . . . . . . . 64 4.12 Taxas de Reconhecimento para a Base Yale - Caso 9. . . . . . . . . . . . . . . . . . 65 4.13 Comparação das médias das taxas de reconhecimento para a Base Yale - Caso 1, 2 e 3. 65 4.14 Comparação das médias das taxas de reconhecimento para a Base Yale - Caso 4, 5 e 6. 66 4.15 Comparação das médias das taxas de reconhecimento para a Base Yale - Caso 7, 8 e 9. 66 4.16 Comparação das médias gerais das taxas de reconhecimento para a Base Yale. . . . . 67 4.17 Exemplo de imagens faciais masculinas da base ORL. . . . . . . . . . . . . . . . . . 69 4.18 Exemplo de imagens faciais femininas da base ORL. . . . . . . . . . . . . . . . . . . 70 4.19 Médias das taxas de reconhecimento para o método Fisherface Fuzzy. . . . . . . . . . 72 4.20 Taxas de Reconhecimento para a Base ORL - Caso 1. . . . . . . . . . . . . . . . . . 73 4.21 Taxas de Reconhecimento para a Base ORL - Caso 2. . . . . . . . . . . . . . . . . . 74 4.22 Taxas de Reconhecimento para a Base ORL - Caso 3. . . . . . . . . . . . . . . . . . 74 4.23 Taxas de Reconhecimento para a Base ORL - Caso 4. . . . . . . . . . . . . . . . . . 75 4.24 Taxas de Reconhecimento para a Base ORL - Caso 5. . . . . . . . . . . . . . . . . . 75 4.25 Taxas de Reconhecimento para a Base ORL - Caso 6. . . . . . . . . . . . . . . . . . 76 4.26 Taxas de Reconhecimento para a Base ORL - Caso 7. . . . . . . . . . . . . . . . . . 76 4.27 Taxas de Reconhecimento para a Base ORL - Caso 8. . . . . . . . . . . . . . . . . . 77 4.28 Taxas de Reconhecimento para a Base ORL - Caso 9. . . . . . . . . . . . . . . . . . 77 LISTA DE FIGURAS xii 4.29 Comparação das médias das taxas de reconhecimento para a Base ORL - Caso 1, 2 e 3. 78 4.30 Comparação das médias das taxas de reconhecimento para a Base ORL - Caso 4, 5 e 6. 78 4.31 Comparação das médias das taxas de reconhecimento para a Base ORL - Caso 7, 8 e 9. 79 4.32 Comparação das médias gerais das taxas de reconhecimento para a Base ORL. . . . . 80 Lista de Tabelas 2.1 Critérios desejáveis de um sistema de reconhecimento de pessoas. . . . . . . . . . . . 6 2.2 Comparação dos nove tipos biométricos descritos na seção (2.3) segundo Jain et al. [14], onde: A-alta performance, M-média performance, B-baixa performance. . . . . . 15 3.1 Parâmetros importantes do método Fisherface Fuzzy para o reconhecimento de faces. 41 3.2 Exemplo de Conjunto de Dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.3 Descrição do Passo 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.4 Descrição do Passo 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.5 Descrição do Passo 3 - Primeira Parte. . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.6 Descrição do Passo 3 - Segunda Parte. . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.7 Classe dos dados da tabela (3.6). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.8 Número de vizinhos do j-ésimo dado que pertence a i-ésima classe (nij). . . . . . . . 44 4.1 Conjunto de treinamento e Conjunto de teste para a Base Yale. . . . . . . . . . . . . 57 4.2 Comparação das médias para as taxas de reconhecimento do método Fisherface Fuzzy com a variação do parâmetro m da função de pertinência proposta por Song et al. [36] (Base Yale). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.3 Comparação das médias das taxas de reconhecimento do Fisherface Fuzzy com a função de pertinência proposta por Song et al. [36]. . . . . . . . . . . . . . . . . . . . . . . 59 4.4 Comparação das médias para as taxas de reconhecimento (Base Yale). . . . . . . . . 67 4.5 Comparação dos desvios padrão para as taxas de reconhecimento (Base Yale). . . . . 67 4.6 Conjunto de Treinamento e Conjunto de Teste para a Base ORL. . . . . . . . . . . . 70 xiii LISTA DE TABELAS xiv 4.7 Comparação das médias para as taxas de reconhecimento do método Fisherface Fuzzy com a variação do parâmetro m da função de pertinência proposta por Song et al. [36] (Base ORL). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.8 Comparação das médias das taxas de reconhecimento do Fisherface Fuzzy com a função de pertinência proposta por Song et al. [36]. . . . . . . . . . . . . . . . . . . . . . . 72 4.9 Comparação das médias para as taxas de reconhecimento (Base ORL). . . . . . . . . 79 4.10 Comparação dos desvios padrão para as taxas de reconhecimento (Base ORL). . . . . 79 Sumário 1 Introdução 1 1.1 Introdução e Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Reconhecimento Facial Convencional 4 2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2 Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3 Sistemas Biométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.4 Tipos de Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 Impressão Digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.2 DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.4.3 Íris . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.4.4 Retina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.4.5 Face . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.4.6 Geometria da mão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.4.7 Voz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.4.8 Padrão de Digitação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4.9 Assinatura Manuscrita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.5 Reconhecimento Facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.5.1 Técnicas de Reconhecimento Facial . . . . . . . . . . . . . . . . . . . . . 18 2.5.2 Métodos Hoĺısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.5.3 Definições Importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 xv SUMÁRIO xvi 2.5.4 Método Eigenface (PCA) . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.5.5 Método Fisherface (PCA+LDA) . . . . . . . . . . . . . . . . . . . . . . . 26 2.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3 Estudo do Método Fisherface Fuzzy e das Funções de Pertinência 30 3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.2 Algoritmo dos k-vizinhos mais próximos (KNN) . . . . . . . . . . . . . . . . . . 30 3.3 Lógica Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.4 Funções de Pertinência Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.5 Abordagem do Método Fisherface Fuzzy . . . . . . . . . . . . . . . . . . . . . . 36 3.5.1 Modelo Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.5.2 Exemplo - Cálculo das matrizes de dispersão interclasse e intraclasse Fuzzy 42 3.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4 Implementação dos Algoritmos, Testes e Resultados 49 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.2 Modelo Avaliado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3 Implementação dos Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.3.1 Algoritmo do método Fisherface . . . . . . . . . . . . . . . . . . . . . . . 52 4.3.2 Algoritmo do método Fisherface Fuzzy . . . . . . . . . . . . . . . . . . . 53 4.4 Testes e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.4.1 Base de Imagens Faciais Yale . . . . . . . . . . . . . . . . . . . . . . . . 55 4.4.2 Base de Imagens Faciais ORL . . . . . . . . . . . . . . . . . . . . . . . . 69 4.5 Justificativa do Modelo Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5 Considerações Finais 83 5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5.2 Contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 5.3 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 REFERÊNCIAS BIBLIOGRÁFICAS 86 Caṕıtulo 1 Introdução 1.1 Introdução e Motivação A identificação facial é uma tarefa fácil para os seres humanos. O nosso cérebro memoriza mais facilmente um rosto de uma pessoa do que um nome e ele pode realizar esta tarefa mesmo em situações adversas, tais como, variação de iluminação, variação de expressões faciais e utilização de acessórios. Pouco se sabe como é realizada esta tarefa cerebral, o que torna mais dif́ıcil capacitar uma máquina para realizar tal tarefa. Implementar um algoritmo que seja capaz de identificar e classificar uma face não é um processo simples. Por este motivo, nos últimos anos o reconhecimento de faces tornou-se uma área popular entre as pesquisas de visão computacional, reconhecimento de padrões, engenharia, matemática aplicada e computacional e etc., e seu maior desafio está em obter bons resultados de reconhecimento mesmo diante de diversos fatores que atuam sobre as imagens. Os métodos de reconhecimento facial deste trabalho baseiam-se na seguinte ideia: Dada uma imagem da face de um ind́ıviduo desconhecido, deve-se extrair suas caracteŕısticas para obter o vetor de caracteŕısticas e determinar a qual classe esse indiv́ıduo pertence (classificação). Para a finalidade de extração de caracteŕısticas e classificar faces foram utilizados métodos hoĺısticos, isto é, métodos que analisam a face de forma geral, sem localizar pontos individuais. Esses métodos são eficazes quando aplicados ao reconhecimento de faces em bases de imagens faciais com variação de iluminação e de expressões faciais, considerando que estes fatores estão 1 1.1 Introdução e Motivação 2 presentes no mundo real (dia-a-dia). Os métodos hoĺısticos mais conhecidos são Eigenface e Fisherface. Os métodos hoĺısticos em reconhecimento de faces utilizam como vetor de caracteŕıstica os pixels da imagen facial em teste e em seguida, para evitar o problema da alta dimensionalidade dos dados, são utilizados algoritmos estat́ısticos de redução de dimensionalidade, sendo os mais comuns: Análise de Componentes Principais (PCA) e Análise de Discriminante Linear (LDA). A técnica Eigenface (PCA) é mais simples devido à sua facilidade de implementação. Em 1997, Belhumeur et al. [7], propôs a utilização da LDA juntamente com a PCA no método Eigenface. Este método ficou conhecido como Fisherface (PCA + LDA). Em seu trabalho, os autores fizeram uma comparação da PCA com o subespaço LDA e mostraram que o espaço de caracteŕısticas criado pela transformação LDA, proporciona resultados de classificação bem melhores que o subespaço criado somente pela transformação PCA para o reconhecimento de faces com grandes variações de iluminação e expressões faciais. Em 1985, Keller et al. [20] propôs a utilização do algoritmo dos k-vizinhos mais próximos fuzzy (F-KNN) na classificação de padrões. Vinte anos mais tarde, Kwak e Pedrycz [21] incrementaram o método Fisherface juntamente com o algoritmo proposto por Keller et al. [20], obtendo o método Fisherface Fuzzy. A técnica Fisherface Fuzzy tem como prinćıpio incrementar a classificação de faces utilizando graus de pertinência, que afetam significativamente as matrizes de dispersão interclasse e intraclasse fuzzy e melhoram a performance do classificador. O cálculo dos graus de pertinência fuzzy é realizado através de uma sequência de passos proposta por Kwak e Pedrycz [21]. No cálculo dos graus de pertinência, utiliza-se uma função de pertinência fuzzy, sendo a mais utilizada, a função proposta por Keller et al. [20]: µij =  0, 51 + 0, 49(nij/k), se i = j 0, 49(nij/k), se i 6= j (1.1) onde k é o número de vizinhos mais próximo escolhido e nij representa o número de vizinhos do j-ésimo dado que pertence à i-ésima classe. Não há informações à respeito da origem desta função de pertinência. Diante desse fato, surgiram alguns questionamentos à respeito desta função, como por exemplo, por que esta função apresenta parâmetros fixos? Existem outras funções de pertinência que podem ser 1.2 Objetivos 3 utilizadas no processo de reconhecimento de faces? Essas e outras questões contribuiram como motivação deste trabalho. 1.2 Objetivos Esta dissertação tem como principal objetivo, o estudo, a implementação e a comparação de dois métodos de reconhecimento de faces: Fisherface e Fisherface Fuzzy, em meio à fatores que dificultam o processo de reconhecimento facial. Além disso, é dada especial atenção ao método Fisherface Fuzzy, avaliando o seu desempenho quando é alterada a função de pertinência fuzzy, bem como a proposta de uma outra função de pertinência que não depende de parâmetros aleatórios. Neste trabalho, foram utilizados como base principalmente os artigos de Keller et al. [20], Kwak e Pedrycz [21] e Song et al. [36]. 1.3 Organização da Dissertação Neste primeiro caṕıtulo encontram-se descritas algumas considerações iniciais e o contexto no qual se insere este trabalho. São apresentados também os objetivos. O texto a seguir está organizado da seguinte forma: No caṕıtulo 2 apresenta-se algumas considerações à respeito do reconhecimento facial convencional e são introduzidos os conceitos de biometria e sistemas biométricos. Na sequência são ilustradas as principais técnicas utilizadas no reconhecimento facial visando ressaltar os métodos de maior interesse na elaboração deste trabalho, além de toda a conceituação matemática envolvida nesta dissertação. No caṕıtulo 3 são apresentados os conceitos relacionados ao método Fisherface Fuzzy, incluindo os conceitos de k-vizinhos mais próximos, lógica fuzzy e funções de pertinência fuzzy. O caṕıtulo 4 refere-se a implementação dos algoritmos, no qual são apresentados os detalhes da sua estrutura. Além disso, são realizados os testes nas bases de dados e por último é realizada uma discussão dos resultados. O caṕıtulo 5 contém a finalização do trabalho com as considerações finais, contribuições e trabalhos futuros. Caṕıtulo 2 Reconhecimento Facial Convencional 2.1 Introdução Identificar significa determinar a identidade de alguém ou algo, distinguir os traços caracteŕısticos de alguém [13], logo identificar pessoas é associar uma identidade a um indiv́ıduo. Através de tal identificação, pode-se permitir ou negar o acesso à uma determinada informação (controle de acesso), ou à documentos, áreas restritas, informações, entre outros. Um dos exemplos mais antigos e básicos de uma caracteŕıstica que é utilizada para o reconhecimento de uma pessoa é o rosto [29]. Outras caracteŕısticas também têm sido utilizadas ao longo da história como meio mais formal de identificação de pessoas. Há evidências de que impressões digitais foram usadas como identificação biométrica na Babilônia, aproximadamente a 500 anos a.C. Os comerciantes chineses utilizavam impressões digitais para resolver transações comerciais no século XIV. No Egito antigo, comerciantes eram identificados por seus registros f́ısicos para diferenciar entre os comerciantes confiáveis e com reputação conhecida, dos comerciantes novos no mercado [29]. Identificar pessoas, embora pareça algo simples, tornou-se uma tarefa complicada, principalmente devido ao crescimento rápido das cidades na revolução industrial (meados dos anos 1800). Diante da dificuldade no reconhecimento de pessoas a partir apenas de habilidades humanas é que se iniciou a busca de métodos mais robustos para a realização desta tarefa [19]. Comerciantes e autoridades tiveram que criar outras formas de identificação de pessoas, 4 2.2 Biometria 5 pois não poderiam mais depender exclusivamente da sua própria experiência e do conhecimento do local para fazer essa tarefa. Neste peŕıodo, os tribunais de justiça começaram a registrar caracteŕısticas da identidade de criminosos, a fim de tratar de modo mais brando criminosos novatos e de forma mais rigorosa os criminosos reincidentes. Registravam em cartões detalhes das descrições f́ısicas de infratores, como altura, comprimento do braço, ou qualquer outro padrão, além de fotografias. Mais tarde, na América do Sul, Ásia e Europa, os departamentos de poĺıcia começaram a utilizar formalmente impressões digitais para desvendar crimes [29]. Sistemas biométricos começaram a surgir na segunda metade do século XX, coincidindo com o surgimento do computador. A seguir, é apresentado um breve resumo dos principais sistemas biométricos utilizados para a identificação de pessoas, ganhando maior destaque o reconhecimento por faces. 2.2 Biometria A biometria é uma ciência que estuda a mensuração dos seres vivos [1]. Pode ser definida como o estudo das medidas e de estruturas e órgãos de seres vivos, bem como da importância funcional dessas medidas [13]. A palavra biometria vem do grego bios (vida) e metrikos (medida). De maneira geral, pode-se definir a biometria como o reconhecimento automático de uma pessoa com base em caracteŕısticas f́ısicas e/ou comportamentais que a distingue das demais [40]. A biometria também pode ser definida como sendo o reconhecimento pessoal baseado nas caracteŕısticas fisiológicas ou comportamentais de um indiv́ıduo [31]. Como exemplo de caracteŕısticas fisiológicas, pode-se destacar a identificação por impressão digital, ı́ris, retina, geometria da mão, dedos e palma da mão, DNA e face. A figura (2.1) mostra alguns exemplos desse tipo de caracteŕıstica. As caracteŕısticas comportamentais, diferentemente das caracteŕısticas f́ısicas, podem ser aprendidas ou treinadas ao longo do tempo [19]. São exemplos deste tipo de caracteŕıstica: reconhecimento por voz, modo de andar, assinatura manuscrita e dinâmica de digitação. A figura (2.2) mostra algumas caracteŕısticas comportamentais. Qualquer um dos dois tipos de caracteŕısticas (f́ısica ou comportamental) podem ser utilizados para identificar uma pessoa, contudo, deve-se seguir alguns critérios no momento da escolha, obedecendo aos critérios desejáveis que possibilitará o desenvolvimento de um sistema de reconhecimento de pessoas [1]. Os critérios desejáveis estão descritos na tabela (2.1). 2.2 Biometria 6 Figura 2.1: Caracteŕısticas F́ısicas comumente utilizadas na identificação de pessoas (imagens adaptadas da internet). Tabela 2.1: Critérios desejáveis de um sistema de reconhecimento de pessoas. Requisito Descrição Universalidade Todo indiv́ıduo deve ter a caracteŕıstica. Unicidade Todo indiv́ıduo deve possuir caracteŕısticas únicas. Permanência A caracteŕıstica deve ser invariante ao longo do tempo. Mensurabilidade A caracteŕıstica deve ser posśıvel de ser coletada. Desempenho Refere-se à precisão e velocidade do reconhecimento, bem como fatores operacionais e ambientais. Aceitabilidade Os indiv́ıduos a serem identificados devem aceitar fornecer suas caracteŕısticas. Fraude Refere-se a facilidade de burlar o sistema por métodos fraudulentos. 2.3 Sistemas Biométricos 7 Figura 2.2: Exemplos de Caracteŕısticas Comportamentais (imagens adaptadas da internet). 2.3 Sistemas Biométricos Um sistema biométrico é um sistema de reconhecimento de padrões que opera através de dados biométricos do indiv́ıduo, adquiridos e comparados com os padrões armazenados na sua base de dados [14]. Dependendo do caso, um sistema biométrico opera como um sistema de verificação ou de identificação. Independente do tipo de sistema biométrico, em ambos os casos, existe a fase de cadastramento ou registro. Nesta fase são captadas as caracteŕısticas dos indiv́ıduos que são processadas, a fim de se obter uma representação compactada e expressiva do indiv́ıduo, chamada de template [ver figura (2.3)]. Figura 2.3: Fase de registro ou cadastramento em Sistemas Biométricos, adaptada de http://www.metropoledigital.ufrn.br, acessado em 09/06/2014. Na fase de verificação, o sistema busca na base de dados as informações sobre o indiv́ıduo e investiga se a pessoa é realmente quem ela afirma ser. Neste sistema, a pessoa deseja ser reconhecida e solicita sua identificação. O processo é o seguinte: 2.3 Sistemas Biométricos 8 1. inicialmente, o indiv́ıduo fornece sua identidade ao sistema; 2. o leitor biométrico captura as caracteŕısticas deste indiv́ıduo e as converte para o formato digital, utilizando as mesmas técnicas empregadas no processo de cadastramento; 3. em seguida, o sistema compara as caracteŕısticas capturadas do indiv́ıduo com a informação guardada na base de dados (compara com somente um template registrado na base de dados). De posse dessas informações, o sistema decide se aceita ou rejeita a pessoa que está se identificando [ver figura (2.4)]. Figura 2.4: Fase de verificação ou comparação em Sistemas Biométricos, adaptada de http://www.metropoledigital.ufrn.br, acessado em 09/06/2014. Na etapa de identificação, o sistema busca em toda a base de dados registros sobre o indiv́ıduo até que ele seja encontrado ou não. Neste caso, procura-se estabelecer a identidade da pessoa sem que ela forneça sua identidade. Neste tipo de sistema biométrico, nenhuma informação prévia em relação à identidade do indiv́ıduo é fornecida ao sistema. O processo é o seguinte: 1. inicialmente, obtém-se as informações biométricas do indiv́ıduo, através do leitor biométrico; 2. em seguida, essas informações são comparadas com todos os templates registrados na base de dados; 3. por último, é feita a identificação. 2.4 Tipos de Biometria 9 O sistema fornecerá a identidade do indiv́ıduo baseando-se na maior similaridade encontrada, ou então, informar que o indiv́ıduo não está cadastrado na base de dados [ver figura (2.5)]. Figura 2.5: Fase de Identificação em Sistemas Biométricos, adaptada de http://www.metropoledigital. ufrn.br, acessado em 09/06/2014. 2.4 Tipos de Biometria Existem vários métodos biométricos. Nesta seção, são apresentados inicialmente os de caracteŕısticas fisiológicas, tais como, impressão digital, DNA, ı́ris, retina, face e geometria da mão; em seguida, os de caracteŕısticas comportamentais, como reconhecimento por voz, padrão de digitação e assinatura manuscrita. 2.4.1 Impressão Digital A impressão digital é constituida de uma série de traços e sulcos na região extrema dos dedos [ver figura (2.6)]. Esses traços e sulcos formam as caracteŕısticas inimitáveis presentes nas digitais, chamadas de minúcias, que são formadas pelas bifurcações ou terminações entre esses traços e sulcos. A posição relativa das minúcias são atributos imutáveis e inimitáveis de um indiv́ıduo; pela relação determinada entre elas é posśıvel identificar e distingir uma pessoa [1]. A técnica de reconhecimento através de impressão digital é muito utilizada, devido principalmente ao seu baixo custo, mas apresenta desvantagens, tais como, se no momento do reconhecimento o dedo estiver com as minúcias desgastadas, sujo ou muito seco, podem ocorrer erros no processo de comparação dos dados; deformidades nos dedos (calos, cortes) também podem impedir a correta identificação do indiv́ıduo. 2.4 Tipos de Biometria 10 Figura 2.6: Pontos identificadores das Impressões Digitais. 2.4.2 DNA O DNA (Ácido Desoxirribonucleico) é um aglomerado de moléculas que contém material genético, esse material é determinante para o bom funcionamento dos seres vivos e da formação das caracteŕısticas f́ısicas. É essencialmente um “manual” de instruções para tudo que existe no corpo humano. É um código único definitivo para a individualidade, exceto para gêmeos idênticos que têm o mesmo padrão de DNA [15]. A figura (2.7) ilustra a estrutura do DNA. Por ser uma biometria precisa, o DNA é muito utilizado, principalmente por investigadores criminais, por exemplo, para desvendar crimes, provar a culpa de um criminoso, livrar um inocente. Além disso, ele é utilizado para outras finalidades, tais como: teste de paternidade, identificação de cadáveres, estudo de doenças hereditárias, entre outras. Figura 2.7: Estrutura do DNA. 2.4 Tipos de Biometria 11 2.4.3 Íris A ı́ris é um músculo que faz parte do globo ocular (parte viśıvel do olho humano), cuja função é controlar a quantidade de luz que entra no olho [ver figura (2.8)]. A formação da textura da ı́ris no olho humano começa no peŕıodo pré-natal devido alguns processos biológicos, por esta razão, constitui uma caracteŕıstica única a cada indiv́ıduo, além de ser permanente, isto é, invariante durante toda a vida da pessoa [1]. Os sistemas biométricos que utilizam a ı́ris como meio de identificação, baseando-se na leitura dos anéis coloridos existentes em torno da pupila. Esses anéis formam uma imagem complexa que é usada para a identificação. É uma técnica de reconhecimento simples e muito eficiente. Como comparação, a ı́ris do olho pode promover uma solução para a discriminação biométrica muito melhor do que as oferecidas por impressão digital [28]. Figura 2.8: Imagem de um olho humano com a ı́ris em destaque (à esquerda) e imagem do fundo do olho humano, onde observamos os vasos sangúıneos da retina (à direita). 2.4.4 Retina Retina é a parte posterior do olho formada em geral por células nervosas [ver figura (2.8)]. É o local onde forma a imagem (visão) que é traduzida pelo cérebro. A identificação através da retina é um método seguro, pois as informações da retina não apresentam variação ao longo da vida do indiv́ıduo, entretanto, o sistema apresenta leitura dif́ıcil e incômoda, pois a captura dessa imagem exige que a pessoa olhe fixamente para um ponto de luz de infravermelho até que a câmera focalize os padrões e os capture. 2.4 Tipos de Biometria 12 2.4.5 Face A identificação facial é um sistema biométrico intuitivo aos seres humanos, já que uma pessoa é reconhecida facilmente por suas aparências faciais. A partir da face humana, pode-se extrair algumas caracteŕısticas, como por exemplo, as posições dos olhos, nariz, boca e assim identificar o indiv́ıduo. As caracteŕısticas mais exploradas na face são a boca, o nariz, os olhos e as sobrancelhas [42] [ver figura (2.9)]. A tecnologia de reconhecimento facial considera que as medidas do rosto nunca se alteram, tais como, distância entre os olhos, distância dentre a boca, nariz e olhos e distância entre olhos, queixo, boca e linha dos cabelos. Como caracteŕısticas positivas deste sistema, pode-se destacar que existe larga aceitação pública para este identificador biométrico, já que fotos de faces são usadas em documentos. Além disso, os sistemas de reconhecimento de face são menos intrusivos, não exigindo qualquer contato e nem mesmo a colaboração do usuário. Entretanto, é um processo extremamente complexo que deve levar em consideração as mudanças que o rosto sofre no decorrer do tempo, além de fatores adversos, como condição de iluminação e utilização de acessórios, tais como, chapéu, ocúlos e etc., que podem dificultar o processo de reconhecimento. Figura 2.9: Alguns pontos importantes para o reconhecimento facial. 2.4.6 Geometria da mão Este sistema baseia-se nas informações geométricas da mão. A figura (2.10) mostra uma imagem da mão em que estão representados os pontos caracteŕısticos a serem utilizados na geometria. 2.4 Tipos de Biometria 13 O desenvolvimento de um sistema baseado nessa técnica utiliza um módulo de aquisição de imagens, que captura a imagem da mão, em seguida, são analisadas suas informações geométricas extraindo os principais padrões que permitem identificar uma pessoa. Esses padrões são geralmente o tamanho dos dedos, a largura e sua área [1]. A principal desvantagem desta técnica está na sua baixa discriminação se comparado com outros sistemas. Figura 2.10: Pontos caracteŕısticos utilizados na Geometria da Mão. 2.4.7 Voz Este sistema biométrico consiste em identificar uma pessoa através da constatação de caracteŕısticas comportamentais e fisiológicas do aparelho fonador (orgãos utilizados para produzir o som), como a boca, lábios, ĺıngua e nariz (fossas nasais). O método é desenvolvido a partir da captura de uma amostra de voz de uma pessoa, por exemplo através de um microfone. Em seguida, faz-se uma análise da amostra, aplicando técnicas de processamento de sinais. Dessa forma, diversos sons emitidos por vozes podem ser caracterizados de maneira diferente, possibilitando a identificação de uma pessoa. A figura (2.11) ilustra as vibrações emitidas pela voz. A biometria de voz apresenta alguns problemas. As principais desvantagens são a sensibilidade a rúıdos externos causados por exemplo, por fatores ambientais; e as posśıveis variações da voz causadas por razões f́ısicas, como resfriados ou alterações emocionais, como raiva. 2.4 Tipos de Biometria 14 Figura 2.11: Vibrações emitidas pela voz. 2.4.8 Padrão de Digitação Baseia-se na hipótese de que cada pessoa digita em um teclado de uma forma caracteŕıstica [15] [ver figura (2.12)]. Considerando a variabilidade no modo das pessoas digitarem, é quase imposśıvel obter uma imitação perfeita do padrão de digitação. Considerando esse fato, conclui- se que este sistema biométrico tem um bom grau de segurança e unicidade. 2.4.9 Assinatura Manuscrita A forma como uma pessoa assina seu nome é conhecida por ser uma caracteŕıstica individual [ver figura (2.12)]. Embora assinaturas requerem contato e esforço com o instrumento de escrita, elas são aceitáveis como método de autenticação pessoal [15]. Este sistema é um padrão comportamental (muda ao longo do tempo). A assinatura é aplicada principalmente na identificação de indiv́ıduos e na verificação da autenticidade de documentos formais. O método mais comum utilizado para verificar a veracidade de uma assinatura é o visual, ou seja, a assinatura de uma pessoa é comparada com amostras recolhidas anteriormente e, caso seja similar, é aprovada. Com o avanço tecnológico, surgiram métodos de validação mais avançados, que levam em consideração outros fatores como: formato das letras, ângulo no qual a caneta é segurada, tempo que se leva para assinar, velocidade e aceleração da assinatura, pressão aplicada ao escrever, número de vezes que a caneta é levantada, dentre outros. A tabela (2.2) apresenta uma comparação entre os nove tipos biométricos relatados nas seções anteriores com relação aos critérios desejáveis de um sistema de reconhecimento de 2.5 Reconhecimento Facial 15 Figura 2.12: Forma de digitação em um teclado (à esquerda) e um estilo de um indiv́ıduo escrever (à direita). pessoas. Observa-se que cada um dos sistemas estudados possui vantagens e desvantagens, entretanto cada um tem a sua importância e aplicabilidade. Reforça-se que a face tem uma excelente aceitação, porém apresenta problemas com relação à unicidade e desempenho. Este sistema biométrico encontra-se discutido mais profundamente nas próximas seções. Tabela 2.2: Comparação dos nove tipos biométricos descritos na seção (2.3) segundo Jain et al. [14], onde: A-alta performance, M-média performance, B-baixa performance. S is te m a s B io m é tr ic o s U n iv e rs a li d a d e U n ic id a d e P e rm a n ê n ci a M e n su ra b il id a d e D e se m p e n h o A ce it a b il id a d e F ra u d e Impressão Digital M A A M A M M DNA A A A B A B B Íris A A A M A B B Retina A A M B A B B Face A B M A B A A Geometria da mão M M M A M M M Voz M B B M B A A Padrão de digitação B B B M B M M Assinatura B B B A B A B 2.5 Reconhecimento Facial 16 2.5 Reconhecimento Facial A maneira mais básica e natural utilizada pelo homem para a identificação de pessoas é através do reconhecimento facial. Essa identificação é um dos métodos não-intrusivos em biometria, no entanto, consiste também em um dos maiores desafios para os pesquisadores da área, envolvendo pesquisas em psicof́ısica, neurociência, engenharia, reconhecimento de padrões, análises e processamento de imagens, visão computacional aplicada ao reconhecimento de faces por humanos e máquinas [33]. A formação da base de dados é um fator important́ıssimo para se obter sucesso no processo de reconhecimento. Nesta etapa uma ou mais imagens de faces são agrupadas e codificadas para o uso no modelo, esse conjunto forma o espaço de faces. Depois de selecionar uma face alvo e estabelecer a similaridade com a base de dados, o algoritmo busca caracteŕısticas que definem a face. Como uma imagem é constitúıda de pixels, temos que na verdade a análise é realizada sobre a intensidade luminosa de cada um deles em relação aos que estão na base de faces. O reconhecimento facial, independente do método utilizado, pode ser definido nas seguintes etapas [ver o diagrama mostrado na figura (2.13)]: • Aquisição da Imagem: Utiliza-se, geralmente, uma fotografia ou uma imagem digitalizada obtida por uma câmera; • Pré-Processamento: Elimina-se os rúıdos e distorções da imagem; • Análise da Imagem: Utiliza-se diferentes técnicas para extrair as caracteŕısticas da imagem de cada indiv́ıduo (cria-se um vetor reduzido de caracteŕıstica com dados extráıdos dos objetos adquiridos); • Seleção das caracteŕısticas: Analisa-se o conjunto dos vetores de caracteŕısticas e elimina-se os mais redundantes. • Classificação: Analisa-se o padrão obtido (classificação ou agrupamento) e então toma-se uma decisão. Na classificação, o classificador toma decisões baseando-se no aprendizado realizado a partir do conjunto de treinamento, o qual contém exemplos de padrões de todas as classes existentes no 2.5 Reconhecimento Facial 17 Figura 2.13: Modelo do Processo de Reconhecimento Facial sistema. No reconhecimento estat́ıstico de padrões, a classificação é feita utilizando estimativas de distribuições probabiĺısticas. O reconhecedor de padrões é avaliado através de um conjunto de testes, preferencialmente composto de todas as classes, mas que não estejam no conjunto de treinamento [33]. Em reconhecimento de faces cada classe e suas variações representam uma mesma pessoa, logo o problema de classificação apresenta a seguinte ideia: Dado um indiv́ıduo desconhecido, extrai-se suas caracteŕısticas para obter o vetor x (de caracteŕısticas) e determinar a qual classe esse indiv́ıduo pertence. Pode-se encontrar diversos problemas durante o processo de reconhecimento facial, entre eles, mudanças na iluminação e diferentes poses e expressões faciais. Segundo Atalay [4], pode-se classificar um sistema como robusto se o mesmo for insenśıvel à: • Variância de Escala: A mesma face pode ser apresentada para o sistema de diferentes escalas (a distância entre o rosto e a câmera influencia o reconhecimento); • Variação de Posição: A mesma face pode ser captada sob diferentes perspectivas e orientações, por exemplo, de perfil, frontal; • Variação de Iluminação: Uma mesma imagem da face captada sob diferentes condições de iluminação pode causar dupla interpretação; 2.5 Reconhecimento Facial 18 • Expressões e Detalhes Faciais: Sorrir, fazer caretas, barbas e bigodes, usar óculos, entre outras caracteŕısticas podem influenciar no processo de reconhecimento; • Rúıdos: Rúıdos gerados por granulações da imagem, defeitos de hardware, oclusão da câmera e objetos que interferem na precisão da imagem. A seguir são discutidas algumas técnicas de reconhecimento facial. 2.5.1 Técnicas de Reconhecimento Facial Os métodos de reconhecimento facial são divididos em dois tipos: • Métodos baseados em caracteŕısticas locais; • Métodos hoĺısticos. Os métodos baseados em caracteŕısticas locais, como o próprio nome diz, baseiam-se na identificação através de determinados pontos importantes da face, tais como olhos, nariz, boca e etc. Estes métodos utilizam uma análise matemática extensa para extrair informação das componentes básicas da face e, em seguida, converter essa informação em um vetor de caracteŕısticas [9]. Já os métodos hoĺısticos analisam a imagem facial de forma geral, sem localizar pontos individuais. As técnicas hoĺısticas costumam utilizar a análise estat́ıstica, redes neurais ou transformações lineares. Sua maior vantagem está no fato de utilizar a face como um “todo”, assim o método não destrói nenhuma informação quando determinados pontos importantes da face são processados. Mais detalhes sobre os métodos hoĺısticos são apresentados a seguir. 2.5.2 Métodos Hoĺısticos Como já foi discutido anteriormente, os métodos hoĺısticos analisam a imagem facial como um “todo”, ou seja, considera todos os pixels da imagem ou de algumas regiões importantes da face, logo a dimensionalidade dos dados é exatamente igual ao número de pixels da imagem ou da região em estudo. Por exemplo, considerando no treinamento uma imagem 64 × 64, ela gera uma matriz do tipo 642 × 642 (como será discutido na seção (2.5.4)), o que aumenta muito o esforço computacional e consequentemente pode impossibilitar o reconhecimento, por este motivo, utiliza-se métodos que reduzem a dimensionalidade do conjunto mantendo-se a precisão do classificador. 2.5 Reconhecimento Facial 19 Sendo uma etapa importante no reconhecimento, a redução da dimensionalidade está conectada fortemente à capacidade dos algoritmos em utilizar espaços de caracteŕısticas de tamanhos intratáveis para tamanhos manuseáveis [9]. Dentre as diversas técnicas, destacam-se a Análise de Componentes Principais (PCA) e Análise de Discriminante Linear (LDA). Estes dois métodos são baseados em análises estat́ısticas dos vetores da imagem facial. Cada método tem uma forma própria de atuar e de representar os vetores da base para formar um espaço de dimensão menor. Quando o vetor de face é projetado nos vetores da base do sistema, obtêm-se os coeficientes da projeção definidos como a nova representação caracteŕıstica de cada imagem facial. O reconhecimento da face em teste é executado por meio de um classificador, que compara os coeficientes das faces originais de treinamento com os coeficientes da face em teste, e a partir dáı, classifica a face em teste em alguma classe. A forma mais simples de realizar a classificação é utilizar o cálculo das distâncias entre os vetores, como por exemplo, a distância euclidiana. Nas próximas seções, apresenta-se um detalhamento dos métodos Eigenface e Fisherface (consequentemente um detalhamento das técnicas PCA e LDA); antes porém, são definidos matematicamente os principais conceitos utilizados neste estudo. 2.5.3 Definições Importantes Uma imagem digital é uma matriz m×n, em que cada elemento da matriz é denominado pixel (do inglês picture elements). Cada pixel possui três coordenadas: x e y definem a sua posição na imagem e i representa o ńıvel de cinza ou grau de brilho da imagem. Definição 2.1 (Imagem Digital). Seja uma matriz m × n cujos elementos pertencem a um espaço vetorial, isto é, uma aplicação i : R −→ V , onde R é um subconjunto do plano e V é um espaço vetorial. Para cada pixel (x, y) ∈ R da imagem, i(u, v) contém informações da estrutura do pixel. A seguir, define-se alguns conceitos importantes da Estat́ıstica Multivariada. Consideremos X um vetor aleatório de dimensão p (contém p componentes): X = (X1, X2, X3, ..., Xp) T , (2.1) onde T significa transposto e X1, X2, ..., Xp são variáveis aleatórias. 2.5 Reconhecimento Facial 20 Figura 2.14: Ilustração do pixel - menor elemento da imagem digital. Definição 2.2 (Vetor das Médias). Seja X um vetor aleatório. O vetor das médias de X é definido por: µ = E(X) =  E(X1) E(X2) ... E(Xp)  =  µ1 µ2 ... µp  , (2.2) onde µi = E(Xi), denota a média ou esperança matemática da variável aleatória Xi, i = 1, 2, ..., p. Definição 2.3 (Desvio padrão). Sejam Xp variáveis aleatórias, o desvio padrão σi mede a dispersão dos valores individuais em torno da média, isto é, σi = √∑ (Xi − µ)2 p− 1 , (2.3) onde i=1,2,...,p. Definição 2.4 (Variância). A variância da i-ésima componente do vetor X é calculada por Var(Xi) = σ2 i , onde σi é o desvio padrão. A variância e o desvio padrão são medidas de dispersão e possuem caracteŕısticas distintas: a variância estabelece os desvios em relação à média aritmética µi e o desvio padrão analisa a 2.5 Reconhecimento Facial 21 regularidade dos valores, isto significa que valores grandes de σi indicam uma maior dispersão de valores em relação à média. Quando existirem duas variáveis aleatórias Xi e Xj, dispõe-se de várias medidas estat́ısticas que podem ser utilizadas para analisar como estas variáveis se relacionam ou variam conjuntamente. A medida mais utilizada é a covariância. Definição 2.5 (Covariância). Sejam Xi e Xj duas variáveis aleatórias, a covariância entre elas é definida por: Cov(Xi, Xj) = E [(Xi − µi)(Xj − µj)] = σij, (2.4) isto é, o valor médio do produto dos desvios de Xi e Xj em relação às suas respectivas médias. A covariância verifica a relação entre duas variáveis, logo o seu sinal indica o tipo de relação que as duas variáveis têm. Se a covariância for nula significa que as variáveis analisadas são independentes, mas se for diferente de zero as variáveis podem apresentar determinada dependência entre si. Um sinal positivo indica que elas movem juntas e um negativo que elas movem em direções opostas. Sabe-se que uma imagem tem muitas variáveis, por este motivo, convém guardar os valores das médias numa matriz, chamada de matriz de covariância. Definição 2.6 (Matriz de Covariância). A matriz de covariância ou matriz de dispersão das variáveis aleatórias X1, X2, ..., Xp é definida por: Cov(X) = V ar(X) =  σ2 1 σ12 . . . σ1p σ21 σ2 2 . . . σ2p ... ... . . . ... σp1 σp2 . . . σ2 p  , (2.5) onde σij = Cov(Xi, Xj) e σ2 i = σii, para i = 1, 2, ..., p e j = 1, 2, ..., p. 2.5.4 Método Eigenface (PCA) O método Eigenface foi inicialmente proposto por TURK e PENTLAND, em seu trabalho “Eigenfaces for Recognition”, publicado em 1991 [39]. A proposta de utilização de Eigenfaces (autofaces) para o reconhecimento de faces foi de utilizar atributos diferentes dos métodos 2.5 Reconhecimento Facial 22 baseados em caracteŕısticas (olhos, boca, nariz, entre outros) e passar a utilizar informações mais discriminantes da face (caracteŕısticas globais). Assim, os autores propuseram utilizar à Análise de Componentes Principais (PCA - Principal Component Analysis) para fazer a extração das caracteŕısticas da imagem facial. A PCA é uma técnica bem conhecida e explora a análise de dados lineares multivariados, isto é, analisa um número muito grande de dados. Essa técnica matemática descreve um conjunto de dados usando “componentes principais”, escrita como combinações lineares dos dados originais. As componentes principais são determinadas em ordem decrescente de importância. A primeira componente possui mais informação do que a segunda, e assim por diante. A PCA tenta construir um pequeno conjunto de componentes que resumem os dados originais, reduzindo a dimensionalidade dos mesmos [34]. Os principais objetivos da PCA são: 1. Redução de dimensionalidade; 2. Seleção de Caracteŕısitcas (escolha das Componentes Principais). O método das Autofaces (Eigenface) busca identificar um pequeno número de caracteŕısticas que são relevantes para diferenciar uma face de outras. Essas caracteŕısticas podem ser analisadas apenas com a variação dos valores assumidos pelos pixels, em um conjunto de imagens de faces [34]. Matematicamente, esse processo pode ser obtido através dos autovetores (eigenvectors) que formam as bases ortonormais do subespaço de face e seus respectivos autovalores (eigenvalues) obtidos por meio da matriz de covariância formada de um conjunto de imagens de faces. Esses autovetores podem ser vistos como um conjunto de caracteŕısticas que descrevem a variação entre tais imagens. Em suma, cada imagem de face no conjunto de treinamento pode ser exatamente representada em termos de uma combinação linear dos autovetores; e os coeficientes desta combinação serão os novos representantes da face no subespaço dimensional [33]. Segundo Silva [34], o método Eigenface consiste em: 1. Formar um subespaço X (chamado subespaço PCA ou subespaço de faces), descrito pelos principais autovetores da matriz de covariância de um determinado conjunto de faces; 2. Projetar uma imagem teste (Zteste) neste subespaço, gerando um vetor de pesos x, tal que x = pT · Zteste; 2.5 Reconhecimento Facial 23 3. Comparar o vetor de pesos x obtido da projeção com os vetores obtidos da projeção de faces conhecidas. O objetivo principal do método Eigenface é escolher uma projeção redutora de dimensionalidade (através da PCA) que maximiza o espalhamento de todas as imagens de faces projetadas [7], isto é, classificar e agrupar as imagens de faces em classes, garantindo a máxima separabilidade entre essas classes. A formalização matemática do método Eigenface para o reconhecimento de faces é a seguinte: Consideremos Im(x, y) uma imagem de face como sendo uma matriz de dimensão Nx×Ny, em que Nx é o número de linhas e Ny é o número de colunas. Representa-se a matriz I concatenada em linhas da seguinte forma: Im(x, y) =  x11 x12 · · · x1Ny x21 x22 · · · x2Ny ... ... · · · ... xNx1 xNx2 · · · xNxNy  =  x11 x12 ... x1Ny x21 x22 ... x2Ny xNx1 xNx2 ... xNxNy  . (2.6) Cada vetor tem tamanho N e descreve uma imagem de tamanho Nx × Ny, sendo uma combinação linear das faces originais. Esses vetores são chamados de “autofaces”. Seja Z = {Z1, Z2, ..., ZM} o conjunto das imagens de faces de treinamento e M a quantidade de imagens desse conjunto. As imagens de treinamento são selecionadas a partir de uma base de dados podendo ser todo o conjunto ou algumas imagens. Há informações redundantes na face, logo ela pode ser representada somente pela variância que ocorre em torno de uma média (componentes principais). Assim, a média do conjunto Z (face média) é definida pela expressão: 2.5 Reconhecimento Facial 24 Z = 1 M · M∑ i=1 Zi. (2.7) Note que Z tem a mesma dimensão das imagens de treinamento. Cada imagem do conjunto de treinamento diferencia-se em relação à face média (Z) pela relação: Φi = Zi − Z, i = 1, 2, ...,M. (2.8) O vetor Φi contém todas as variações de uma determinada face Zi em relação à face média Z. Dessa forma, levando em consideração que todas as faces serão subtráıdas da face média, tem-se uma nova matriz A que contém somente as variações de cada face em relação à face média [34]: A = [Φ1,Φ2, ...,ΦM ] (2.9) e, o cálculo da matriz de covariância R é dado por: R = 1 M · M∑ i=1 (Zi − Z)(Zi − Z)T = 1 M · M∑ i=1 ΦiΦ T i = (A · AT ). (2.10) A matriz R é de dimensão N2×N2 e determinar os autovetores e autovalores desta matriz é um problema dif́ıcil de ser resolvido em virtude do seu tamanho. Para solucionar esse problema (alta dimensionalidade dos dados), considera-se: Seja λi e vi os autovalores e autovetores de R = A · AT , respectivamente. Logo: (A · AT ) · vi = λi · vi. (2.11) Para determinar os λi autovalores associados aos vi autovetores, utiliza-se o seguinte artif́ıcio de Álgebra Linear: seja λk e vk, os autovalores e autovetores de AT ·A, respectivamente, isto é, (AT · A) · vk = λk · vk. (2.12) Multiplicando ambos os lados da equação (2.12) por A, obtêm-se: A · (AT · A) · vk = A · λk · vk, (2.13) 2.5 Reconhecimento Facial 25 isto é, (A · AT ) · (A · vk) = λk · (A · vk). (2.14) Nota-se das equações (2.11) e (2.14) que os autovetores vi ∈ A ·AT satisfazem Avk = λk, ou seja, Avk são os autovetores de R. Logo, conhecendo vk conhece-se λk. Portanto, uma matriz de dimensão M ×M é utilizada nos cálculos ao invés da matriz de dimensão N ×N , reduzindo substancialmente e de forma eficiente os cálculos computacionais [34]. Para continuar a análise, tem-se que cada autoface pk será escrita como combinação linear dos autovetores que representam as imagens do conjunto de treinamento com as faces do conjunto de imagens, isto é: pk = M∑ j=1 vjkΦk. (2.15) Depois de determinar as autofaces, as imagens do conjunto de treinamento são projetadas no subespaço de faces, chamado de subespaço PCA, através da seguinte relação: xi = pTi (Zi − Z), i = 1, 2, ...,M ′ , (2.16) em que M ′ é o número de autovetores associados aos maiores autovalores e xi representam a contribuição de cada autoface em relação às imagens do conjunto de treinamento. Para saber qual classe pertence uma imagem teste, é preciso verificar a contribuição de cada autoface em relação à essa nova imagem. Seja Zteste a face teste de dimensão N2 = Nx ×Ny. A diferença entre essa face e a face média, é calculada por: Φteste = Zteste − Z, (2.17) onde Φteste tem dimensão N . A projeção no subespaço PCA será dada por: xteste = pTi · Φteste, para i = 1, 2, ...,M ′ . (2.18) A classificação é feita utilizando os pesos da equação (2.16) para procurar quais faces do conjunto de treinamento são similares à essa nova imagem teste. Para o processo de similaridade, utiliza-se o cálculo da distância euclidiana entre os pesos das equações (2.16) 2.5 Reconhecimento Facial 26 e (2.18), isto é, εi = ||(xteste − xi)||, (2.19) em que xteste é o vetor de pesos resultantes da projeção da face teste no subespaço PCA e xi é um vetor que representa a i-ésima face. Portanto, a imagem teste Zteste pertencerá a classe que possui a menor distância euclidiana (εi). 2.5.5 Método Fisherface (PCA+LDA) Fisherface é outro método utilizado para o reconhecimento de faces por meio de caracteŕısticas globais da face. De forma análoga ao Eigenface, esse método baseia-se também na redução de dimensionalidade do espaço de caracteŕısticas. A projeção ótima neste caso é obtida através da Análise de Discriminante Linear (LDA - Linear Discriminant Analysis) ou Análise de Discriminante Linear de Fisher (F-LDA). O método Fisherface foi descrito por Belhumeur et al. [7], no trabalho: “Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection”, publicado em 1997. De acordo com os autores, a LDA consegue encontrar subespaços que distribuem de maneira mais eficaz as classes do sistema. Na Análise de Discrinante Linear, o conjunto de imagens faciais de treinamento é constitúıdo por várias classes. Cada classe representa a identidade de uma pessoa e com base num conjunto de classes previamente conhecidas, o problema de reconhecimento é formulado de modo a determinar a que classe pertence uma determinada imagem desconhecida. A LDA pode ser entendida como uma técnica (para o reconhecimento de faces) que busca maximizar o raio de variância entre as classes (between - class) e paralelamente minimizar a variância dentro das classes (within-class) garantindo a máxima separabilidade entre as classes de um conjunto particular de imagens de faces, sendo aplicada uma transformação linear visando encontrar um sistema de coordenadas ótimas, que melhor represente as imagens com máxima separabilidade [33]. O método Fisherface é formado por duas fases: primeiro projeta-se o conjunto de imagem para um espaço de menor dimensão utilizando a PCA e depois é seguido pela fase da LDA [21]. Na PCA é feita a projeção do conjunto de imagens de treinamento para um subespaço de 2.5 Reconhecimento Facial 27 menor dimensão. Depois da redução de dimensionalidade, na técnica LDA, os vetores próprios obtidos são usados para projetar as imagens faciais num subespaço de dimensão ainda menor. O reconhecimento de uma face de teste se dá com a projeção no subespaço dos vetores próprios criados e utilizando uma medida de semelhança, para efetuar a comparação com as outras faces projetadas no mesmo subespaço [9]. Matematicamente, seja Zij uma imagem de face como sendo uma matriz de tamanho N (da mesma forma que (2.6)) projetada no subespaço PCA, em que a j-ésima imagem de uma classe de imagens Ci. A média total (µ) dessas faces é dada por: µ = 1∑r i=1Ni r∑ i=1 Ni∑ j=1 Zij, (2.20) onde Ni é o número de faces pertencentes a cada uma das r classes pré determinadas C1, C2, ..., Cr e Ci = xij, ..., xiCi . Além disso, a face média (µi) da classe Ci, é obtida pela expressão: µi = 1 Ni Ni∑ j=1 Zij. (2.21) A matriz de dispersão interclasse (entre classes) SB é definida por: SB = r∑ i=1 Ni(µi − µ)(µi − µ)T , (2.22) ou seja, SB representa a dispersão das faces médias de cada classe em relação à média total. A matriz de dispersão intraclasse (dentro de cada classe) SW é definida por: SW = r∑ i=1 Ci∑ j=1 (Zij − µi)(Zij − µi) T = r∑ i=1 SWi , (2.23) onde SWi é uma matriz de covariância da classe Ci e SW representa a dispersão das imagens de faces Zij em relação à face média de sua classe. A técnica LDA buscar encontrar uma matriz de projeção ótima que maximize a razão do determinante da matriz de dispersão interclasse das imagens de faces projetadas e também que minimize o determinante da matriz de dispersão intraclasse dessas mesmas imagens [19]. A matriz de projeção ótima (Wotima) é dada por: 2.6 Considerações Finais 28 Wotima = arg max︸ ︷︷ ︸ W |W T · SB ·W | |W T · SW ·W | = [W1 W2 ... WM ], (2.24) onde {Wi|i = 1, 2, ...,M} é o conjunto generalizado de autovetores de SB e SW correspondente aos M maiores autovalores {λi|i = 1, 2, ...,M}. Note que o método Fisherface projeta o conjunto de imagens em um espaço de dimensão menor tal que a matriz de dispersão intraclasse SW resultante seja não-singular (logo a projeção ótima (2.24) pode ser calculada). Em resumo, o método Fisherface utiliza a técnica PCA para reduzir a dimensionalidade projetando as faces originais em um espaço de dimensão menor. Em seguida, a técnica LDA é aplicada para procurar a melhor caracteŕıstica discriminante linear naquele subespaço PCA [34]. Formalmente, a matriz de projeção ótima Wotima pode ser calculada da seguinte forma: Wotima = WLDA ·WPCA, (2.25) onde WPCA = arg max︸ ︷︷ ︸ W |W T · SBW ·W |, (2.26) para SBW = SB + SW e WLDA é dada por: WLDA = arg max︸ ︷︷ ︸ W |W T ·W T PCA · SB ·WPCA ·W | |W T ·W T PCA · SW ·WPCA ·W | . (2.27) A classificação é feita procurando quais faces do conjunto de treinamento são similares às novas imagens de faces testes, do mesmo modo como foi descrito na seção (2.5.4). 2.6 Considerações Finais Através deste caṕıtulo, pode-se observar que com o surgimento dos computadores, houve crescentes estudos na área de identificação (autenticação) de uma pessoa no campo da biometria, como por exemplo, estudos no reconhecimento por impressão digital, retina, voz, geometria da mão e análise de imagens faciais. Em seguida, foram discutidos o processo de reconhecimento facial, que é realizado em cinco etapas. Inicialmente, utiliza-se uma base de imagens de faces (aquisição da imagem), em seguida 2.6 Considerações Finais 29 é realizado o pré-processamento das imagens faciais para a remoção de rúıdos e imperfeições. Na segunda etapa, são extráıdos os vetores de caracteŕısticas da imagem facial (análise da imagem) e faz-se uma seleção dessas caracteŕısticas. Por último é feita a classificação. Entre os métodos de reconhecimento de faces convencionais, foram estudados dois métodos hoĺısticos: Eigenface e Fisherface. O Eigenface utiliza a técnica da Análise de Componentes Principais (PCA) para extrair as caracteŕısticas da imagem facial e reduzir a dimensionalidade do conjunto de faces, preservando a variação do mesmo. O método Fisherface, assim com o Eigenface, baseia-se na redução da dimensão do espaço de caracteŕısticas, mas utiliza como técnica principal, a Análise de Discriminante Linear (LDA). Este método busca maximizar a dispersão entre as classes de imagens e paralelamente, busca minimizar a dispersão dentro de cada classe. No próximo caṕıtulo, é analizado o método Fisherface Fuzzy, que é a complementação do método Fisherface com graus de pertinência fuzzy. São estudados o método, suas principais caracteŕısticas e funções de pertinência fuzzy. Caṕıtulo 3 Estudo do Método Fisherface Fuzzy e das Funções de Pertinência 3.1 Introdução Neste caṕıtulo serão tratados os detalhes do método Fisherface Fuzzy para o reconhecimento de faces. Para identificar faces, foi visto que existem diversos fatores que influenciam na performance do reconhecimento, como iluminação, variação de posição, expressões e detalhes faciais. A fim de driblar estes fatores e melhorar as taxas de reconhecimento, diversos pesquisadores começaram a modelar e criar novas estratégias para tornar os métodos já conhecidos, mais eficientes. Em 1985, Keller et al. [20] propõem a utilização do algoritmo dos k-vizinhos mais Próximos Fuzzy para melhorar o método de classificação de padrões. A partir dessa nova ideia, em 2005 foi desenvolvido o método Fisherface Fuzzy. Nas próximas seções, são desenvolvidos as técnicas utilizadas no método Fisherface Fuzzy e estudados alguns tipos de função de pertinência fuzzy. 3.2 Algoritmo dos k-vizinhos mais próximos (KNN) O algoritmo dos k-vizinhos mais próximos (KNN - K-Nearest Neighbours) é utilizado em problemas de classificação para obter resultados mais eficientes. Esta eficiência na classificação 30 3.3 Lógica Fuzzy 31 depende da dimensionalidade e complexidade dos dados. Dado um padrão de teste x (desconhecido), a classificação é feita da seguinte maneira: 1. Calcula-se a distância entre x e todos os padrões de treinamento. 2. Verifica-se a quais classes pertencem os k padrões mais próximos; 3. A classificação é realizada associando-se o padrão de teste à classe que for mais frequente entre os k padrões mais próximos de x. Quando as caracteŕısticas são numéricas (como é o nosso caso), no item (1) utiliza-se a distância Euclidiana. Definição 3.1 (Distância Euclidiana). A distância euclidiana entre dois vetores x = (x1, x2, ..., xn) e y = (y1, y2, ..., yn) é definida por: dE(x, y) = ||x− y|| = √ (x− y)T (x− y). (3.1) A principal vantagem desse método é que ele cria uma superf́ıcie de decisão que se adapta à forma de distribuição dos dados de treinamento de maneira detalhada, possibilitando a obtenção de boas taxas de acerto quando o conjunto de treinamento é grande. Utilizando k > 1, reduz-se a ocorrência de erros causados por rúıdos nos padrões de treinamento. Entretanto, o uso de valores grandes em k pode reduzir a qualidade dos resultados de classificação quando a distribuição das classes possuir muitas sobreposições [37]. Geralmente, o algoritmo KNN apresenta bons resultados na classificação de padrões, entretanto, ele apresenta alguns problemas, como por exemplo, a performance do KNN depende da escolha do número de vizinhos (k). Para um caso prático, não há uma regra para realizar essa escolha, a estratégia mais recomendada é a de tentativa e erro. Através de inúmeros testes realizados e com o objetivo de determinar um padrão para a escolha do número de k vizinhos mais próximos, neste trabalho, a quantidade de vizinhos (k > 1) foi escolhida através da seguinte relação: 1 < k ≤ c, (3.2) sendo c o número de classes do problema. 3.3 Lógica Fuzzy 32 3.3 Lógica Fuzzy A lógica Fuzzy, também conhecida como lógica nebulosa ou lógica difusa, representa um esquema de traduzir informações vagas, imprecisas em valores numéricos [5]. A palavra “fuzzy” é de origem inglesa e significa incerto, vago, impreciso, subjetivo, nebuloso, difuso, entre outras. A lógica convencional lida com problemas assumindo sempre verdadeiro ou falso, mas as vezes, esta forma de modelagem de problemas não é suficiente, portanto necessita-se a solução de problemas com valores intermediários. A fim de ajudar a solucionar esses problemas, surgiu a lógica fuzzy. A Teoria dos Conjuntos “Fuzzy” foi proposta pelo matemático Lotfi Asker Zadeh no artigo “Fuzzy Sets”publicado em 1965 [43], com a principal intenção de dar um tratamento matemático a certos termos lingúısticos subjetivos, como “aproximadamente”, “em torno de”, dentre outros [6]. Esta lógica considera os elementos pertencentes a um determinado conjunto com um certo grau de pertinência. Enquanto que na lógica tradicional, um elemento pertence ou não a um determinado conjunto, isto é, tem valores de pertinência 0 ou 1, na lógica fuzzy, um dado elemento pode pertencer a um conjunto com grau de pertinência em um intervalo de 0 a 1. Para formalizar matematicamente um conjunto fuzzy, Zadeh baseou-se no fato de que qualquer conjunto clássico pode ser caracterizado por uma função: sua função caracteŕıstica. Definição 3.2 (Função Caracteŕıstica). Seja U um conjunto e A um subconjunto de U. A função caracteŕıstica de A é dada por: χA(x) =  1, se x ∈ A 0, se x /∈ A. (3.3) Assim, χA é uma função cujo domı́nio é U e a imagem está contida no conjunto {0, 1}, onde χA(x) = 1 significa que o elemento x está em A, enquanto χA(x) = 0 indica que x não é elemento de A. Portanto, a função caracteŕıstica descreve completamente o conjunto A já que tal função indica quais elementos do conjunto universo U são elementos também de A. Entretanto, existem casos em que a função de pertinência entre elementos e conjuntos não é precisa, ou seja, não se sabe se um elemento pertence efetivamente a um conjunto ou não. Nestes casos, o recomendado é dizer qual elemento do conjunto universo se enquadra “melhor” ao termo que caracteriza o subconjunto. A seguir, são definidos os conceitos da Lógica Fuzzy utilizados neste trabalho. 3.4 Funções de Pertinência Fuzzy 33 Definição 3.3 (Função de Pertinência Fuzzy). Seja U um conjunto universo. Um subconjunto fuzzy F de U é caracterizado pela função: µF : U → [0, 1], (3.4) pré-fixada, chamada função de pertinência do subconjunto fuzzy F . O valor da função µF (x) ∈ [0, 1] indica o grau com que o elemento x de U está no conjunto fuzzy F . µF (x) = 0 e µF (x) = 1 significam, respectivamente, a não pertinência e a pertinência completa de x ao conjunto fuzzy F . Do ponto de vista formal, a definição de subconjunto fuzzy foi obtida ampliando-se o contra-domı́nio da função caracteŕıstica, que é o conjunto {0, 1}, para o intervalo [0, 1]. Neste contexto, conclúımos que um conjunto universo (clássico) é um caso particular de um conjunto fuzzy, cuja função de pertinência µF é uma função caracteŕıstica χF [6]. Definição 3.4 (Subconjunto Crisp). Um subconjunto universo (clássico), na linguagem fuzzy, é denominado subconjunto crisp. Um subconjunto fuzzy F é composto de elementos de x de um conjunto universo U , providos de um valor de pertinência à F , dado por µF (x). Assim: F = {(µF (x) \ x), com x ∈ U}. (3.5) onde µF (x) representa o grau de pertinência de x em F . A figura (3.1) ilustra a diferença entre os conjuntos fuzzy e crisp. Nota-se que o conjunto crisp (ćırculo) determina somente se os elementos (pontos) pertencem ou não ao conjunto, já o conjunto fuzzy indica quantitativamente, no intervalo [0, 1] o quanto cada elemento pertence ao conjunto, este ı́ndice é o grau de pertinência (escala de cinza). Figura 3.1: Ilustração da diferença entre os conjuntos fuzzy e crisp. 3.4 Funções de Pertinência Fuzzy 34 3.4 Funções de Pertinência Fuzzy As funções de pertinência são usadas para calcular o grau que uma determinada variável pertence ou não ao conjunto relacionado. Elas podem ter forma padrão, ou podem ser definidas de acordo com o problema, desde que sejam estabelecidas suas propriedades. A escolha de qual função usar é feita normalmente de forma emṕırica, analisando casos passados semelhantes e vendo qual obteve melhor resultado [32]. Existem diversos tipos de funções de pertinência fuzzy que são utilizadas em problemas de modelagem matemática. O formato do conjunto fuzzy é definido de acordo com a função de pertinência utilizada. As funções mais utilizadas são a trapezoidal, a triangular e a gaussiana. A função trapezoidal apresenta como caracteŕısticas o rápido processamento e a presença de descontinuidades. Sua forma é ilustrada na figura (3.2). A equação deste tipo de função de pertinência é da forma: µ(x) =  0, se x ≤ a 1− (b− x)/(b− a), se a < x ≤ b 1, se b < x ≤ c (d− x)/(d− c), se c < x ≤ d 0, se x > d. (3.6) Figura 3.2: Função de Pertinência do tipo Trapezoidal. A função de pertinência do tipo triangular é muito semelhante à função trapezoidal, entretamento, não apresenta descontinuidades na mudança de crescimento da função (veja figura (3.3)). Sua função de pertinência é da forma: 3.4 Funções de Pertinência Fuzzy 35 µ(x) =  0, se x ≤ a 1− (b− x)/(b− a), se a < x ≤ b (c− x)/(c− b), se b < x ≤ c 0, se x > c. (3.7) Figura 3.3: Função de Pertinência do tipo Triangular. A função do tipo Gaussiano, tem como caracteŕıstica a distribuição normal, isto é, resultados muito maiores ou muito menores em relação à média tendem a zero (observe o gráfico na figura (3.4)). Sua função é representada abaixo, onde x é a média e σ é o desvio padrão. µ(x) = e− (x−x)2 σ2 . (3.8) Figura 3.4: Função de Pertinência do tipo Gaussiano. A seguir, é apresentado o método Fisherface Fuzzy, cujo alicerce principal está na definição 3.5 Abordagem do Método Fisherface Fuzzy 36 de uma função de pertinência fuzzy. São estudados alguns tipos de funções que podem ser utilizadas no método, afim de torná-lo mais eficaz no reconhecimento de faces. 3.5 Abordagem do Método Fisherface Fuzzy Esta seção tem como principal objetivo apresentar o método Fisherface Fuzzy para o reconhecimento de faces. Sabe-se que o método já bem conhecido Fisherface é muito utilizado no reconhecimento de faces, no entanto, assim como outros métodos, apresenta problemas no reconhecimento quando há fatores que podem influenciar as faces, tais como iluminação, diferentes poses e expressões faciais, utilização de acessórios como óculos, chapéu, ou ainda, quando homens estão com bigode ou não. Isto ocorre, tanto na Análise de Componentes Principais (PCA), quanto na Análise de Discriminante Linear (LDA). Foi visto também, que os conjuntos fuzzy têm a vantagem dos graus de pertinência serem espećıficos (sempre estão no intervalo de 0 a 1), ao invés de serem somente 0 ou 1, este fato pode ser vantajoso especificamente em reconhecimento de padrões, onde frequentemente objetos não pertencem claramente à uma classe ou outra [20]. A ideia geral do método Fisherface Fuzzy é “sofisticar” a classificação utilizando graus de pertinência fuzzy, de modo a afetar as matrizes de dispersão interclasse e intraclasse fuzzy e melhorar a performance do classificador. Para isso, define-se uma função de pertinência, que gera uma matriz formada por graus de pertinência (chamada de matriz de partição fuzzy) juntamente com a regra dos k-vizinhos mais próximos (KNN). Matematicamente, dado um conjunto X de imagens de faces transformadas pela PCA; uma partição “c-classes” fuzzy destes vetores especifica o grau de pertinência de cada vetor à cada classe Ci. Denota-se a matriz de partição fuzzy por U = [µij], onde i = 1, 2, ..., C, j = 1, 2, ..., N e µij é o grau de pertinência da imagem Zij na classe Ci. Como U é partição fuzzy, então satisfaz as propriedades matemáticas: C∑ i=1 µij = 1; (3.9) ou seja, a soma dos graus de pertinência de uma imagem em todas as classes deve ser igual a um. Além disso: 3.5 Abordagem do Método Fisherface Fuzzy 37 0 < N∑ j=1 µij < N e µij ∈ [0, 1]; (3.10) ou seja, a soma dos graus de pertinência de todas as imagens de uma classe deve ser menor que o número de imagens de faces existentes em todo o conjunto. Por exemplo, consideremos o conjunto X = {x1, x2, x3} tal que:  A1 ⇒ 0, 6/x1 1/x2 0, 1/x3 A2 ⇒ 0, 4/x1 0/x2 0, 9/x3 (3.11) Note que,  0, 6 + 0, 4 = 1 1 + 0 = 1 0, 1 + 0, 9 = 1 (3.12) o que satisfaz (3.9), e que:  0, 6 + 1 + 0, 1 = 1, 7 < 3 0, 4 + 0 + 0, 9 = 1, 3 < 3 (3.13) o que satisfaz (3.10). Portanto, U =  A1 A2  é uma matriz de partição fuzzy. Os cálculos dos graus de pertinência fuzzy são realizados através da seguinte sequência de passos [21]: • Passo 1: Calcular a matriz da distância euclidiana entre os pares de vetores caracteŕısticas do conjunto de treinamento; • Passo 2: Atribuir infinito em todos os elementos da diagonal principal desta matriz; • Passo 3: (i) Ordenar a matriz da distância (tratar cada uma de suas colunas separadamente) em ordem crescente. (ii) Coletar o rótulo das classes correspondentes do dado localizado mais próximo da vizinhança do dado em consideração (o que gera uma lista de k inteiros); • Passo 4: Calcular o grau de pertinência das classes i para o j-ésimo dado usando uma função de pertinência fuzzy. 3.5 Abordagem do Método Fisherface Fuzzy 38 Após o cálculo dos graus de pertinência, prossegue-se com o método Fisherface Fuzzy. A diferença fundamental entre este método e o Fisherface convencional, está na utilização dos graus de pertinência no cálculo da face média de cada classe Ci. Assim, a face média (µ̃i) da classe Ci é definida por: µ̃i = ∑N j=1 µijZij∑N j=1 µij , (3.14) onde i = 1, 2, ..., r. A matriz de dispersão interclasse fuzzy SFB incorporadas com os valores de pertinência em seus cálculos é redefinida da seguinte forma: SFB = r∑ i=1 Ni(µ̃i − µ)(µ̃i − µ)T , (3.15) onde Ni é o número de faces pertencentes a cada umas das r classes pré determinadas e µ é a média total das faces. Da mesma forma, a matriz de dispersão intraclasse fuzzy SFW é redefinida por: SFW = r∑ i=1 Ci∑ j=1 (Zij − µ̃i)(Zij − µ̃i) T = r∑ i=1 SFWi , (3.16) onde SFWi é a matriz de covariância fuzzy da classe Ci. A projeção ótima fuzzy (WF−otima) é dada por: WF−otima = arg max︸ ︷︷ ︸ W |W T · SFB ·W | |W T · SFW ·W | , (3.17) onde {Wi|i = 1, 2, ...,M} é o conjunto generalizado de autovetores de SFB e SFW correspondente aos M maiores autovalores {λi|i = 1, 2, ...,M}. A partir da projeção ótima fuzzy (WF−otima) é realizado o procedimento de classificação das imagens testes, da mesma forma que foi descrito da seção (2.5.5). A figura (3.5) ilustra o diagrama de blocos do funcionamento do método Fisherface Fuzzy. 3.5.1 Modelo Proposto Como foi obvervado na seção anterior, para o cálculo dos graus de pertinência fuzzy, utiliza-se a sequência de passos descrita por Kwak e Pedrycz [21], o qual no passo 4, associa-se uma função de pertinência fuzzy. Na seção (3.4), foi visto que existem diversos tipos de função de 3.5 Abordagem do Método Fisherface Fuzzy 39 Figura 3.5: Diagrama de Funcionamento do Método Fisherface Fuzzy. 3.5 Abordagem do Método Fisherface Fuzzy 40 pertinência fuzzy e que para cada tipo de problema, utiliza-se uma função diferente, ou seja, escolhe-se uma função que se adapta melhor ao problema. Portanto, a escolha de tal função é um requisito importante no desempenho do método. Em diversos estudos [21], [42] e [17], foi utilizada a mesma função de pertinência para o método Fisherface Fuzzy, essa função, proposta por Keller et al. [20], em 1985, é expressa por: µij =  0, 51 + 0, 49(nij/k), se i = j 0, 49(nij/k), se i 6= j (3.18) onde k é o número de vizinhos e nij representa o número de vizinhos do j-ésimo dado que pertence à i-ésima classe. Observando a função de pertinência fuzzy (3.18), nota-se que ela apresenta parâmetros fixos (0, 51 e 0, 49), porém, não foi feita nenhuma explanação de como foram obtidos ou escolhidos estes valores. Na prática, existem diversos fatores que influenciam a classificação de faces, além disso, as bases de dados apresentam caracteŕısticas distintas com o objetivo de simular a realidade, tais como, quantidade diferente de imagens, as imagens são pré classificadas em quantidades distintas de classes e etc., logo esses parâmetros fixos, podem não ser eficientes em alguns casos. Portanto, procura-se novas propostas de funções de pertinência fuzzy que apresentam parâmetros que levam em consideração caracteŕısticas das bases de dados em estudo. Estudos mais recentes propõem a utilização de outras funções de pertinência fuzzy no reconhecimento de faces. Song et al., propõem em seu trabalho, publicado em 2010 uma técnica diferente de reconhecimento facial, intitulada A complete fuzzy discriminant analysis [36]. Sem levar em consideração sua teoria e considerando somente a função de pertinência utilizada pelos autores, Song et al. [36] propõem a utilização de uma outra função de pertinência (3.18) para calcular a matriz de pertinência fuzzy. Essa função é definida por: µij =  α + (1− α)(nij/k), se i = j (1− α)(nij/k), se i 6= j (3.19) onde k é o número de vizinhos, nij representa o número de vizinhos do j-ésimo dado que pertence à i-ésima classe e α = N − C 2mN , (3.20) 3.5 Abordagem do Método Fisherface Fuzzy 41 onde m e α são parâmetros que tem a finalidade de controlar os valores de µij, m ∈ (0, 1) e α ∈ (0, 1), além disso, N é o número de imagens do conjunto e C o número de classes. Observando a função de pertinência fuzzy (3.19) proposta por Song et al. [36], nota-se que ela apresenta parâmetros mais gerais e espećıficos para cada base de dados em estudo. Para o cálculo do parâmetro α, leva-se em consideração a quantidade de imagens da base de dados e a quantidade de classes do problema. No entanto, apresenta um parâmetro m variável e aleatório, pois a única informação que tem-se, é que o mesmo deve controlar os valores de µij e estar entre o intervalo 0 e 1. A proposta deste trabalho de pesquisa é encontrar uma função de pertinência fuzzy que apresenta somente parâmetros gerais e espećıficos para cada base de dados, com a finalidade de ser eficiente no reconhecimento de faces. Partindo deste prinćıpio, procurou-se determinar parâmetros que são essenciais e importantes no método Fisherface Fuzzy, a tabela (3.1) descreve alguns desses parâmetros. Tabela 3.1: Parâmetros importantes do método Fisherface Fuzzy para o reconhecimento de faces. Parâmetro Descrição N Número de imagens da base de dados. C Número de classes pré determinadas. Nic Número de imagens por classe. Nit Número de imagens de treinamento. Cit Conjunto de imagens teste. k Número de vizinhos mais próximos. Através de inúmeros testes, observou-se que a quantidade de imagens do conjunto de treinamento é um fator importante para o método. Utilizando a mesma ideia da função (3.19), foi proposta a definição da seguinte função de pertinência: µij =  α + (1− α)(nij/k), se i = j (1− α)(nij/k), se i 6= j (3.21) onde nij representa o número de vizinhos do j-ésimo dado que pertence à i-ésima classe e α = 0, 5 + 0, 25/(Nit)i, (3.22) onde α ∈ (0, 1) e (Nit)i é o número de imagens de treinamento por classe para i = 1, 2, ..., r. A justificativa da escolha de tal função e os testes com todas as funções de pertinência fuzzy 3.5 Abordagem do Método Fisherface Fuzzy 42 descritas nesta seção, encontram-se no próximo caṕıtulo. 3.5.2 Exemplo - Cálculo das matrizes de dispersão interclasse e intraclasse Fuzzy Para exemplificar o cálculo das matrizes de dispersão interclasse e intraclasse fuzzy, considere o exemplo adaptado de Kwak e Pedrycz [21]. Neste exemplo, o conjunto é formado por 9 dados bidimensionais pertencentes a três classes, mostrados na tabela (3.2). Tabela 3.2: Exemplo de Conjunto de Dados. Número Caracteŕıstica 1 Caracteŕıstica 2 Classe 1 0,2 0,3 1 2 0,3 0,2 1 3 0,4 0,3 1 4 0,5 0,5 2 5 0,6 0,4 2 6 0,5 0,6 2 7 0,7 0,3 3 8 0,8 0,4 3 9 0,7 0,5 3 Primeiramente, calcula-se os graus de pertinência através da sequência de passos descritas na seção (3.5). Pelo Passo 1, calcula-se a matriz de distância euclidiana entre os pares de dados [ver tabela (3.3)]. No passo 2, os elementos da diagonal principal (nulos) são substitúıdos por infinito (∞) [ver tabela (3.4)]. No passo 3, inicialmente, ordena-se os dados de cada coluna em ordem crescente [ver tabela (3.5)]. Tabela 3.3: Descrição do Passo 1. Número 1 2 3 4 5 6 7 8 9 1 0 0,1414 0,2000 0,3606 0,4123 0,4243 0,5000 0,6083 0,5385 2 0,1414 0 0,1414 0,3606 0,3606 0,4472 0,4123 0,5385 0,5000 3 0,2000 0,1414 0 0,2236 0,2236 0,3162 0,3000 0,4123 0,3606 4 0,3606 0,3606 0,2236 0 0,1414 0,1000 0,2828 0,3162 0,2000 5 0,4123 0,3606 0,2236 0,1414 0 0,2236 0,1414 0,2000 0,1414 6 0,4243 0,4472 0,3162 0,1000 0,2236 0 0,3606 0,3606 0,2236 7 0,5000 0,4123 0,3000 0,2828 0,1414 0,3606 0 0,1414 0,2000 8 0,6083 0,5385 0,4123 0,3162 0,2000 0,3606 0,1414 0 0,1414 9 0,5385 0,5000 0,3606 0,2000 0,1414 0,2236 0,2000 0,1414 0 Para o passo 3, determina-se a quantidade de k vizinhos mais próximos utilizada na análise 3.5 Abordagem do Método Fisherface Fuzzy 43 Tabela 3.4: Descrição do Passo 2. Número 1 2 3 4 5 6 7 8 9 1 ∞ 0,1414 0,2000 0,3606 0,4123 0,4243 0,5000 0,6083 0,5385 2 0,1414 ∞ 0,1414 0,3606 0,3606 0,4472 0,4123 0,5385 0,5000 3 0,2000 0,1414 ∞ 0,2236 0,2236 0,3162 0,3000 0,4123 0,3606 4 0,3606 0,3606 0,2236 ∞ 0,1414 0,1000 0,2828 0,3162 0,2000 5 0,4123 0,3606 0,2236 0,1414 ∞ 0,2236 0,1414 0,2000 0,1414 6 0,4243 0,4472 0,3162 0,1000 0,2236 ∞ 0,3606 0,3606 0,2236 7 0,5000 0,4123 0,3000 0,2828 0,1414 0,3606 ∞ 0,1414 0,2000 8 0,6083 0,5385 0,4123 0,3162 0,2000 0,3606 0,1414 ∞ 0,1414 9 0,5385 0,5000 0,3606 0,2000 0,1414 0,2236 0,2000 0,1414 ∞ Tabela 3.5: Descrição do Passo 3 - Primeira Parte. Número 1 2 3 4 5 6 7 8 9 1 0,1414 0,1414 0,1414 0,1000 0,1414 0,1000 0,1414 0,1414 0,1414 2 0,2000 0,1414 0,2000 0,1414 0,1414 0,2236 0,1414 0,1414 0,1414 3 0,3606 0,3606 0,2236 0,2000 0,1414 0,2236 0,2000 0,2000 0,2000 4 0,4123 0,3606 0,2236 0,2236 0,2000 0,3162 0,2828 0,3162 0,2000 5 0,4243 0,4123 0,3000 0,2828 0,2236 0,3606 0,3000 0,3606 0,2236 6 0,5000 0,4472 0,3162 0,3162 0,2236 0,3606 0,3606 0,4123 0,3606 7 0,5385 0,5000 0,3606 0,3606 0,3606 0,4243 0,4123 0,5385 0,5000 8 0,6083 0,5385 0,4123 0,3606 0,4123 0,4472 0,5000 0,6083 0,5383 9 ∞ ∞ ∞ ∞ ∞ ∞ ∞ ∞ ∞ dos dados. Neste exemplo, considera-se 3 vizinhos (k = 3), pois como têm-se 3 classes, pela relação (3.2), deve-se escolher entre 1 < k ≤ 3. Logo, os ı́ndices associados com cada valor da distância dão origem à tabela (3.6). Tabela 3.6: Descrição do Passo 3 - Segunda Parte. k=1 ⇒ 2 1 2 6 4 4 5 9 5 k=2 ⇒ 3 3 1 5 9 5 8 7 8 k=3 ⇒ 4 4 5 9 7 9 9 5 4 Tem-se que os dados são pré classificados, ou seja, os dados 1, 2, 3 estão na classe 1; 4, 5, 6 estão na classe 2 e 7, 8, 9 estão na classe 3. Portanto, os dados da tabela (3.6) estão nas classes mostradas na tabela (3.7). Tabela 3.7: Classe dos dados da tabela (3.6). k=1 ⇒ 1 1 1 2 2 2 2 3 2 k=2 ⇒ 1 1 1 2 3 2 3 3 3 k=3 ⇒ 2 2 2 3 3 3 3 2 2 3.5 Abordagem do Método Fisherface Fuzzy 44 Cada coluna da tabela (3.7) representa os vizinhos mais próximos do dado, por exemplo, a terceira coluna representa os vizinhos mais próximos do dado 3. Logo, o número das classes mais frenquentes para cada dado, é representado na tabela (3.8). Tabela 3.8: Número de vizinhos do j-ésimo dado que pertence a i-ésima classe (nij). Classe / Dado 1 2 3 4 5 6 7 8 9 Classe 1 2 2 2 0 0 0 0 0 0 Classe 2 1 1 1 2 1 2 1 1 2 Classe 3 0 0 0 1 2 1 2 2 1 No passo 4, calcula-se os graus de pertinência fuzzy, para isto, utiliza-se uma função de pertinência. Neste trabalho, estudou-se três funções de pertinência, logo, para o passo 4 foram considerados três casos, calculando três matrizes dos graus de pertinência fuzzy. Caso 1. Considera-se a função de pertinência (3.18) proposta por Keller et al. [20]. Por exemplo, para calcular os graus de pertinência do 4o dado do conjunto (que está rotulado a pertencer à classe 2), têm-se: (1) classe 1 6= atribúıdo à classe 2 0, 49(nij/k) = 0, 49(0/3) = 0. (2) classe 2 = atribúıdo à classe 2 0, 51 + 0, 49(nij/k) = 0, 51 + 0, 49(2/3) = 0, 8367. (3) classe 3 6= atribúıdo à classe 2 0, 49(nij/k) = 0, 49(1/3) = 0, 1633. Portanto, a matriz U dos graus de pertinência fuzzy é: 3.5 Abordagem do Método Fisherface Fuzzy 45 U = [µij] =  0, 8367 0, 8367 0, 8367 0 0 0 0 0 0 0, 1633 0, 1633 0, 1633 0,8367 0, 6733 0, 8367 0, 1633 0, 1633 0, 3267 0 0 0 0,1633 0, 3267 0, 1633 0, 8367 0, 8367 0, 6733  (3.23) Os vetores médios são: µ̃1 =  0, 3000 0, 2667  , µ̃2 =  0, 5333 0, 4579  e µ̃3 =  0, 6952 0, 4109  . (3.24) Logo, as matrizes de dispersão intraclasse e interclasse fuzzy são, respectivamente: SFW =  0, 0126 −0, 0037 −0, 0037 0, 0174  e SFB =  0, 1592 0, 1017 0, 1017 0, 0833  . (3.25) Caso 2. Considera-se a função de pertinência (3.19) proposta por Song et al. [36] . Neste exemplo, têm-se 9 dados bidimensionais subdivididos em 3 classses, logo N = 9 e C = 3. Além disso, considera-se m = 0, 3 (m ∈ (0, 1)), logo: α = N − C 2m ·N = 9− 3 20,3 · 9 = 0, 54. (3.26) Portanto, a função será: µij =  0, 54 + 0, 46(nij/k), se i = j 0, 46(nij/k), se i 6= j. (3.27) Por exemplo, para calcular os graus de pertinência do 3o dado do conjunto (que está rotulado a pertencer à classe 1), têm-se: (1) classe 1 = atribúıdo à classe 1 0, 54 + 0, 46(nij/k) = 0, 54 + 0, 46(2/3) = 0, 8467. (2) classe 2 6= atribúıdo à classe 1 0, 46(nij/k) = 0, 46(1/3) = 0, 1533. 3.5 Abordagem do Método Fisherface Fuzzy 46 (3) classe 3 6= atribúıdo à classe 1 0, 46(nij/k) = 0, 46(0/3) = 0. Portanto, a matriz U dos graus de pertinência fuzzy é: U = [µij] =  0, 8467 0, 8467 0,8467 0 0 0 0 0 0 0, 1533 0, 1533 0,1533 0, 8467 0, 6933 0, 8467 0, 1533 0, 1533 0, 3067 0 0 0 0, 1533 0, 3067 0, 1533 0, 8467 0, 8467 0, 6933  (3.28) Os vetores médios são: µ̃1 =  0, 3000 0, 2667  , µ̃2 =  0, 5333 0, 4601  e µ̃3 =  0, 6976 0, 4102  . (3.29) Logo, as matrizes de dispersão intraclasse e interclasse fuzzy são, respectivamente: SFW =  0, 0124 −0, 0037 −0, 0037 0, 0173  e SFB =  0, 1591 0, 1016 0, 1016 0, 0833  . (3.30) Caso 3. Utilizando-se a função de pertinência (3.21). Neste exemplo, sabe-se que o número de imagens por classe é 3, além disso, as imagens que serão treinadas (Nit)i estão numa mesma classe, logo, considera-se (Nit)i = 2 (1 < (Nit)i < 3). Assim, α é definido por: α = 0, 5 + 0, 25/(Nit)i = 0, 5 + 0, 25/2 = 0, 625. (3.31) Portanto, a função é: µij =  0, 625 + 0, 375(nij/k), se i = j 0, 375(nij/k), se i 6= j. (3.32) Por exemplo, para calcular os graus de pertinência do 8o dado do conjunto (que está rotulado a pertencer à classe 3), têm-se: 3.6 Considerações Finais 47 (1) classe 1 6= atribúıdo à classe 3 0, 375(nij/k) = 0, 375(0/3) = 0. (2) classe 2 6= atribúıdo à classe 3 0, 375(nij/k) = 0, 375(1/3) = 0, 1250. (3) classe 3 6= atribúıdo à classe 3 0, 625 + 0, 375(nij/k) = 0, 625 + 0, 375(2/3) = 0, 8750. Portanto, a matriz U dos graus de pertinência fuzzy é: U = [µij] =  0, 8750 0, 8750 0, 8750 0 0 0 0 0 0 0, 1250 0, 1250 0, 1250 0, 8750 0, 7500 0, 8750 0, 1250 0,1250 0, 2500 0 0 0 0, 1250 0, 2500 0, 1250 0, 8750 0,8750 0, 7500  (3.33) Os vetores médios são: µ̃1 =  0, 3000 0, 2667  , µ̃2 =  0, 5333 0, 4667  e µ̃3 =  0, 7042 0, 4083  . (3.34) Logo, as matrizes de dispersão intraclasse e interclasse fuzzy serão, respectivamente: SFW =  0, 0120 −0, 0036 −0, 0036 0, 0167  e SFB =  0, 1583 0, 1012 0, 1012 0, 0830  . (3.35) De modo geral, nota-se pouca variação das matrizes de dispersão interclasse e intraclasse quando se alteram as funções de pertinência; entretanto, esta variação é significativa e influencia a performance do método Fisherface Fuzzy para o reconhecimento de faces. 3.6 Considerações Finais 48 3.6 Considerações Finais Neste caṕıtulo, foi apresentada a metodologia utilizada neste trabalho para o reconhecimento de faces, chamado de método Fisherface Fuzzy. Foi visto que o método é constitúıdo a partir da técnica convencional Fisherface acrescida do algoritmo dos k-vizinhos mais próximos, onde através deste, calcula-se os graus de pertinência fuzzy que auxiliam o desempenho do método. Em seguida, foram apresentados alguns resultados utilizando-se as funções de pertinência fuzzy propostas por Keller et al. [20], Song et al. [36] e foi definida uma nova função. No próximo caṕıtulo, são apresentadas as implementações dos modelos abordados neste trabalho. São apresentadas as bases de dados utilizadas para os testes realizados e seus respectivos resultados. Caṕıtulo 4 Implementação dos Algoritmos, Testes e Resultados 4.1 Introdução O reconhecimento de faces busca desenvolver algoritmos matemáticos que autentifi- cam/identificam faces. Inicialmente, extrai-se as caracteŕısticas importantes para o reconhecimento da face e encaminha a busca na base de dados. Cada algoritmo possui vantagens e desvantagens (deficiências), e alguns são mais eficientes para determinadas classes de problemas. O objetivo desse caṕıtulo é mostrar as implementações num ambiente computacional dos modelos de reconhecimento facial abordados neste trabalho, com a finalidade de analisar o comportamento em relação à performance dos métodos e suas taxas de reconhecimento. 4.2 Modelo Avaliado A intenção deste trabalho é avaliar o desempenho do método Fisherface Fuzzy (alterando suas funções de pertinência) em relação ao método Fisherface para o reconhecimento de faces. O modelo extrai as caracteŕısticas de uma imagem facial e determina a qual classe esse indiv́ıduo pertence na base de dados. O diagrama (4.1) ilustra o modelo detalhado do método Fisherface e Fisherface Fuzzy para 49 4.2 Modelo Avaliado 50 a fase de treinamento. Na etapa inicial, constrói-se o subespaço PCA e posteriormente o subespaço LDA baseados nas amostras de treinamento. Para a construção do subespaço LDA, considera-se os graus de pertinência fuzzy, que são obtidos através da técnica de k-vizinhos mais próximos e de uma função de pertinência. Nos cálculos relacionados à construção do subespaço PCA e LDA, calcula-se os autovetores e autovalores da matriz de covariância dos dados de entrada. Esses autovetores são ordenados a partir dos maiores autovalores associados e em seguida é feita a projeção das imagens faciais no novo espaço gerado (reduzindo a dimensão do espaço inicial). Pentland et al. [30] demonstrou empiricamente que os resultados de reconhecimento de faces são superiores quando os três primeiros autovetores não são usados para a construção do subespaço PCA, visto que os três primeiros autovetores estão relacionados a mudanças de iluminação. Foi demonstrado em 1998, por Moon et al. [25], que a eliminação de mais de três autovetores, em geral, produz piores resultados. 4.2 Modelo Avaliado 51 Figura 4.1: Diagrama detalhado do modelo avaliado - Fase de treinamento. 4.3 Implementação dos Algoritmos 52 4.3 Implementação dos Algoritmos Todos os algoritmos envolvem três partes: 1. Leitura das imagens de faces na base; 2. Aplicação do Método; 3. Cálculo da taxa de reconhecimento. 4.3.1 Algoritmo do método Fisherface O algoritmo do método Fisherface foi programado no Matlab da seguinte forma: 1. Inicialmente, define-se o valor de três variáveis: o número de imagens do conjunto de treinamento para cada classe (o restante das imagens de cada classe formarão o conjunto de imagens testes), a dimensão do subespaço PCA (dPCA) e a dimensão do subespaço LDA (dLDA), observando que dLDA ≤ dPCA; 2. As imagens são redimensionadas para 32× 32 pixels (pré-processamento); 3. As imagens são agrupadas em classes de acordo com a base de dados uti