Flávio Lima de Souza

Classificador Fisherface Fuzzy para o
Reconhecimento de Faces

São José do Rio Preto

2014


Flávio Lima de Souza

Classificador Fisherface Fuzzy para o Reconhecimento de Faces

Dissertação apresentada para obtenção do t́ıtulo de
Mestre em Matemática, área de Modelagem Matemática,
junto ao Programa de Pós Graduação em Matemática
do Instituto de Biociências, Letras e Ciências Exatas
da Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Campus São José do Rio Preto.

Orientador: Prof. Dr. Mauŕılio Boaventura

Coorientadora: Profa. Dra. Inês Aparecida Gasparotto

Boaventura

São José do Rio Preto

2014


Flávio Lima de Souza

Classificador Fisherface Fuzzy para o Reconhecimento de Faces

Dissertação apresentada para obtenção do t́ıtulo de
Mestre em Matemática, área de Modelagem Matemática,
junto ao Programa de Pós Graduação em Matemática
do Instituto de Biociências, Letras e Ciências Exatas
da Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Campus São José do Rio Preto.

COMISSÃO EXAMINADORA

Prof. Dr. Mauŕılio Boaventura
Professor Adjunto
UNESP - São José do Rio Preto
Orientador

Profa. Dra. Alessandra Aparecida Paulino
Professora Doutora
UNESP - Bauru

Prof. Dr. Evanivaldo Castro Silva Júnior
Professor Doutor
FATEC - São José do Rio Preto

São José do Rio Preto, 25 de julho de 2014.


Dedico este trabalho a meu avô

Eufrázio Eleutério, exemplo de trabalho,

dedicação e honestidade.


Agradecimentos

Essa é uma parte extremamente importante desta dissertação, uma vez que tenho a

oportunidade de agradecer às pessoas que de alguma forma, direta ou indiretamente

participaram da realização da mesma, em especial, agradeço:

A Deus, pelo dom da vida.

Ao meu orientador Prof. Dr. Mauŕılio Boaventura, por todas as informações que

me forneceu, pela disponibilidade de tempo, por me compreender e me ajudar nos

momentos dif́ıceis que enfrentei e acima de tudo, pelos seus ensinamentos e conselhos

que foram cruciais para a realização deste trabalho. À Profa. Dra. Inês Aparecida

Gasparotto Boaventura, pelas sugestões, apoio e dedicação à esse projeto.

À minha mãe, Aparecida, pelo amor, carinho, orações e amparo incondicional.

À minha irmã, Adrieli, pelo apoio e ajuda ao longo desta etapa da minha vida.

À minha sobrinha, Amanda, pelas alegrias, discontrações, teimosias e por me tornar

o tio mais coruja do mundo.

Aos meus avós, Maria Marinete, Elena e Eteuvino, pelos incentivos constantes e

em especial ao meu querido avô Eufrázio, que recentemente foi embora, mas deixou

muitas saudades. Aos meus familiares em geral que sempre me apoiaram.

Agradeço também ao meu grande amigo João Carlos e seu filho Arthur, duas pessoas

maravilhosas que ficarão marcadas sempre em minha vida. As minhas amigas de

longa dada: Andressa, Camilla e Eiva. Aos meus eternos amigos: Aline, Cristina,

Felipe, Janaina, Jéssica, Robson e Silmara. A todos vocês, quero registrar aqui,

meus singelos agradecimentos.


Agradecimentos vi

Quero agradecer também a todos os meus professores de ensino médio, graduação e

pós-graduação, por valiosos ensinamentos, em especial à professora Zulmira Afonso

(Escola Estadual Armel Miranda) e ao Prof. Dr. Lúıs Antônio (UNESP-FEIS).

À todas as pessoas e funcionários do IBILCE/UNESP que contribúıram de diferentes

formas para a elaboração deste trabalho, em especial, ao André Luiz pela ajuda na

implementação do algoritmo.

À CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nı́vel Superior, pelo

apoio financeiro.

Obrigado a todos.


“Quem quer fazer alguma coisa encontra um meio.

Quem não quer fazer nada, encontra uma desculpa.”

Aforisma Árabe


Resumo

A presente dissertação é um estudo do método Fisherface Fuzzy e das funções de

pertinência fuzzy para o reconhecimento de faces. O tradicional método Fisherface

é constitúıdo de duas técnicas de redução de dimensionalidade de dados: Análise

de Componentes Principais (PCA) e Análise de Discriminante Linear (LDA). O

método é relativamente insenśıvel a diversos fatores que atuam sobre as imagens,

como variação na iluminação e diferentes expressões faciais. A fim de superar esses

fatores e melhorar as taxas de reconhecimento do método Fisherface, é incorporado

ao seu algoritmo graus de pertinência fuzzy, que são calculados a partir da técnica

de k-vizinhos mais próximos (KNN), dando origem ao método Fisherface Fuzzy.

O objetivo deste trabalho é avaliar o desempenho desses dois métodos e propor a

utilização de uma nova função de pertinência para o método Fisherface Fuzzy. Os

testes são realizados em duas bases de imagens faciais: Yale e ORL.

Palavras-chave: Computação - Matemática, Modelos matemáticos, Reconheci-

mento facial (computação), Sistemas difusos, Biometria.


Abstract

This dissertation is a study of the Fuzzy Fisherface method and fuzzy membership

functions for recognizing faces. The traditional Fisherface method consists of two

techniques of data dimensionality reduction: Principal Components Analysis (PCA)

and Linear Discriminant Analysis (LDA). The method is relatively insensitive to

many factors that influence the images, such as variation in illumination and

different facial expressions. In order to overcome these factors and improve

recognition rates of the Fisherface method, fuzzy membership degrees are embedded

in your algorithm, and they are which are calculated from the technique of k-nearest

neighbors (KNN) to give the Fuzzy Fisherface method. The objective of this study

is to evaluate the performance of these two methods and propose the use of a new

membership function for the Fuzzy Fisherface method. The tests are conducted on

two bases of facial images: Yale and ORL.

Keywords: Computing - Mathematics, Mathematical models, Face Recognition

(computing), Fuzzy systems, Biometrics.


Lista de Figuras

2.1 Caracteŕısticas F́ısicas comumente utilizadas na identificação de pessoas (imagens

adaptadas da internet). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Exemplos de Caracteŕısticas Comportamentais (imagens adaptadas da internet). . . . 7

2.3 Fase de registro ou cadastramento em Sistemas Biométricos, adaptada de

http://www.metropoledigital.ufrn.br, acessado em 09/06/2014. . . . . . . . . . . . . 7

2.4 Fase de verificação ou comparação em Sistemas Biométricos, adaptada de

http://www.metropoledigital.ufrn.br, acessado em 09/06/2014. . . . . . . . . . . . . 8

2.5 Fase de Identificação em Sistemas Biométricos, adaptada de http://www.metropoledigital.

ufrn.br, acessado em 09/06/2014. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.6 Pontos identificadores das Impressões Digitais. . . . . . . . . . . . . . . . . . . . . . 10

2.7 Estrutura do DNA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.8 Imagem de um olho humano com a ı́ris em destaque (à esquerda) e imagem do fundo

do olho humano, onde observamos os vasos sangúıneos da retina (à direita). . . . . . 11

2.9 Alguns pontos importantes para o reconhecimento facial. . . . . . . . . . . . . . . . 12

2.10 Pontos caracteŕısticos utilizados na Geometria da Mão. . . . . . . . . . . . . . . . . 13

2.11 Vibrações emitidas pela voz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.12 Forma de digitação em um teclado (à esquerda) e um estilo de um indiv́ıduo escrever

(à direita). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.13 Modelo do Processo de Reconhecimento Facial . . . . . . . . . . . . . . . . . . . . . 17

2.14 Ilustração do pixel - menor elemento da imagem digital. . . . . . . . . . . . . . . . . 20

3.1 Ilustração da diferença entre os conjuntos fuzzy e crisp. . . . . . . . . . . . . . . . . 33

3.2 Função de Pertinência do tipo Trapezoidal. . . . . . . . . . . . . . . . . . . . . . . 34

x


LISTA DE FIGURAS xi

3.3 Função de Pertinência do tipo Triangular. . . . . . . . . . . . . . . . . . . . . . . . 35

3.4 Função de Pertinência do tipo Gaussiano. . . . . . . . . . . . . . . . . . . . . . . . 35

3.5 Diagrama de Funcionamento do Método Fisherface Fuzzy. . . . . . . . . . . . . . . . 39

4.1 Diagrama detalhado do modelo avaliado - Fase de treinamento. . . . . . . . . . . . . 51

4.2 Exemplo de imagens faciais femininas e masculinas da base Yale. . . . . . . . . . . . 56

4.3 Médias das taxas de reconhecimento para o método Fisherface Fuzzy. . . . . . . . . . 59

4.4 Taxas de Reconhecimento para a Base Yale - Caso 1. . . . . . . . . . . . . . . . . . 61

4.5 Taxas de Reconhecimento para a Base Yale - Caso 2. . . . . . . . . . . . . . . . . . 61

4.6 Taxas de Reconhecimento para a Base Yale - Caso 3. . . . . . . . . . . . . . . . . . 62

4.7 Taxas de Reconhecimento para a Base Yale - Caso 4. . . . . . . . . . . . . . . . . . 62

4.8 Taxas de Reconhecimento para a Base Yale - Caso 5. . . . . . . . . . . . . . . . . . 63

4.9 Taxas de Reconhecimento para a Base Yale - Caso 6. . . . . . . . . . . . . . . . . . 63

4.10 Taxas de Reconhecimento para a Base Yale - Caso 7. . . . . . . . . . . . . . . . . . 64

4.11 Taxas de Reconhecimento para a Base Yale - Caso 8. . . . . . . . . . . . . . . . . . 64

4.12 Taxas de Reconhecimento para a Base Yale - Caso 9. . . . . . . . . . . . . . . . . . 65

4.13 Comparação das médias das taxas de reconhecimento para a Base Yale - Caso 1, 2 e 3. 65

4.14 Comparação das médias das taxas de reconhecimento para a Base Yale - Caso 4, 5 e 6. 66

4.15 Comparação das médias das taxas de reconhecimento para a Base Yale - Caso 7, 8 e 9. 66

4.16 Comparação das médias gerais das taxas de reconhecimento para a Base Yale. . . . . 67

4.17 Exemplo de imagens faciais masculinas da base ORL. . . . . . . . . . . . . . . . . . 69

4.18 Exemplo de imagens faciais femininas da base ORL. . . . . . . . . . . . . . . . . . . 70

4.19 Médias das taxas de reconhecimento para o método Fisherface Fuzzy. . . . . . . . . . 72

4.20 Taxas de Reconhecimento para a Base ORL - Caso 1. . . . . . . . . . . . . . . . . . 73

4.21 Taxas de Reconhecimento para a Base ORL - Caso 2. . . . . . . . . . . . . . . . . . 74

4.22 Taxas de Reconhecimento para a Base ORL - Caso 3. . . . . . . . . . . . . . . . . . 74

4.23 Taxas de Reconhecimento para a Base ORL - Caso 4. . . . . . . . . . . . . . . . . . 75

4.24 Taxas de Reconhecimento para a Base ORL - Caso 5. . . . . . . . . . . . . . . . . . 75

4.25 Taxas de Reconhecimento para a Base ORL - Caso 6. . . . . . . . . . . . . . . . . . 76

4.26 Taxas de Reconhecimento para a Base ORL - Caso 7. . . . . . . . . . . . . . . . . . 76

4.27 Taxas de Reconhecimento para a Base ORL - Caso 8. . . . . . . . . . . . . . . . . . 77

4.28 Taxas de Reconhecimento para a Base ORL - Caso 9. . . . . . . . . . . . . . . . . . 77


LISTA DE FIGURAS xii

4.29 Comparação das médias das taxas de reconhecimento para a Base ORL - Caso 1, 2 e 3. 78

4.30 Comparação das médias das taxas de reconhecimento para a Base ORL - Caso 4, 5 e 6. 78

4.31 Comparação das médias das taxas de reconhecimento para a Base ORL - Caso 7, 8 e 9. 79

4.32 Comparação das médias gerais das taxas de reconhecimento para a Base ORL. . . . . 80


Lista de Tabelas

2.1 Critérios desejáveis de um sistema de reconhecimento de pessoas. . . . . . . . . . . . 6

2.2 Comparação dos nove tipos biométricos descritos na seção (2.3) segundo Jain et al.

[14], onde: A-alta performance, M-média performance, B-baixa performance. . . . . . 15

3.1 Parâmetros importantes do método Fisherface Fuzzy para o reconhecimento de faces. 41

3.2 Exemplo de Conjunto de Dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.3 Descrição do Passo 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.4 Descrição do Passo 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.5 Descrição do Passo 3 - Primeira Parte. . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.6 Descrição do Passo 3 - Segunda Parte. . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.7 Classe dos dados da tabela (3.6). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.8 Número de vizinhos do j-ésimo dado que pertence a i-ésima classe (nij). . . . . . . . 44

4.1 Conjunto de treinamento e Conjunto de teste para a Base Yale. . . . . . . . . . . . . 57

4.2 Comparação das médias para as taxas de reconhecimento do método Fisherface Fuzzy

com a variação do parâmetro m da função de pertinência proposta por Song et al. [36]

(Base Yale). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.3 Comparação das médias das taxas de reconhecimento do Fisherface Fuzzy com a função

de pertinência proposta por Song et al. [36]. . . . . . . . . . . . . . . . . . . . . . . 59

4.4 Comparação das médias para as taxas de reconhecimento (Base Yale). . . . . . . . . 67

4.5 Comparação dos desvios padrão para as taxas de reconhecimento (Base Yale). . . . . 67

4.6 Conjunto de Treinamento e Conjunto de Teste para a Base ORL. . . . . . . . . . . . 70

xiii


LISTA DE TABELAS xiv

4.7 Comparação das médias para as taxas de reconhecimento do método Fisherface Fuzzy

com a variação do parâmetro m da função de pertinência proposta por Song et al. [36]

(Base ORL). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.8 Comparação das médias das taxas de reconhecimento do Fisherface Fuzzy com a função

de pertinência proposta por Song et al. [36]. . . . . . . . . . . . . . . . . . . . . . . 72

4.9 Comparação das médias para as taxas de reconhecimento (Base ORL). . . . . . . . . 79

4.10 Comparação dos desvios padrão para as taxas de reconhecimento (Base ORL). . . . . 79


Sumário

1 Introdução 1

1.1 Introdução e Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Reconhecimento Facial Convencional 4

2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.3 Sistemas Biométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.4 Tipos de Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4.1 Impressão Digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4.2 DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.4.3 Íris . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4.4 Retina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4.5 Face . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4.6 Geometria da mão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4.7 Voz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.4.8 Padrão de Digitação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.4.9 Assinatura Manuscrita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.5 Reconhecimento Facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.5.1 Técnicas de Reconhecimento Facial . . . . . . . . . . . . . . . . . . . . . 18

2.5.2 Métodos Hoĺısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.5.3 Definições Importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

xv


SUMÁRIO xvi

2.5.4 Método Eigenface (PCA) . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.5.5 Método Fisherface (PCA+LDA) . . . . . . . . . . . . . . . . . . . . . . . 26

2.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3 Estudo do Método Fisherface Fuzzy e das Funções de Pertinência 30

3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2 Algoritmo dos k-vizinhos mais próximos (KNN) . . . . . . . . . . . . . . . . . . 30

3.3 Lógica Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4 Funções de Pertinência Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.5 Abordagem do Método Fisherface Fuzzy . . . . . . . . . . . . . . . . . . . . . . 36

3.5.1 Modelo Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.5.2 Exemplo - Cálculo das matrizes de dispersão interclasse e intraclasse Fuzzy 42

3.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4 Implementação dos Algoritmos, Testes e Resultados 49

4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2 Modelo Avaliado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.3 Implementação dos Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3.1 Algoritmo do método Fisherface . . . . . . . . . . . . . . . . . . . . . . . 52

4.3.2 Algoritmo do método Fisherface Fuzzy . . . . . . . . . . . . . . . . . . . 53

4.4 Testes e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.4.1 Base de Imagens Faciais Yale . . . . . . . . . . . . . . . . . . . . . . . . 55

4.4.2 Base de Imagens Faciais ORL . . . . . . . . . . . . . . . . . . . . . . . . 69

4.5 Justificativa do Modelo Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5 Considerações Finais 83

5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5.2 Contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5.3 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

REFERÊNCIAS BIBLIOGRÁFICAS 86


Caṕıtulo

1

Introdução

1.1 Introdução e Motivação

A identificação facial é uma tarefa fácil para os seres humanos. O nosso cérebro memoriza mais

facilmente um rosto de uma pessoa do que um nome e ele pode realizar esta tarefa mesmo em

situações adversas, tais como, variação de iluminação, variação de expressões faciais e utilização

de acessórios. Pouco se sabe como é realizada esta tarefa cerebral, o que torna mais dif́ıcil

capacitar uma máquina para realizar tal tarefa.

Implementar um algoritmo que seja capaz de identificar e classificar uma face não é um

processo simples. Por este motivo, nos últimos anos o reconhecimento de faces tornou-se uma

área popular entre as pesquisas de visão computacional, reconhecimento de padrões, engenharia,

matemática aplicada e computacional e etc., e seu maior desafio está em obter bons resultados

de reconhecimento mesmo diante de diversos fatores que atuam sobre as imagens.

Os métodos de reconhecimento facial deste trabalho baseiam-se na seguinte ideia: Dada uma

imagem da face de um ind́ıviduo desconhecido, deve-se extrair suas caracteŕısticas para obter

o vetor de caracteŕısticas e determinar a qual classe esse indiv́ıduo pertence (classificação).

Para a finalidade de extração de caracteŕısticas e classificar faces foram utilizados métodos

hoĺısticos, isto é, métodos que analisam a face de forma geral, sem localizar pontos individuais.

Esses métodos são eficazes quando aplicados ao reconhecimento de faces em bases de imagens

faciais com variação de iluminação e de expressões faciais, considerando que estes fatores estão

1


1.1 Introdução e Motivação 2

presentes no mundo real (dia-a-dia). Os métodos hoĺısticos mais conhecidos são Eigenface e

Fisherface.

Os métodos hoĺısticos em reconhecimento de faces utilizam como vetor de caracteŕıstica os

pixels da imagen facial em teste e em seguida, para evitar o problema da alta dimensionalidade

dos dados, são utilizados algoritmos estat́ısticos de redução de dimensionalidade, sendo os mais

comuns: Análise de Componentes Principais (PCA) e Análise de Discriminante Linear (LDA).

A técnica Eigenface (PCA) é mais simples devido à sua facilidade de implementação. Em

1997, Belhumeur et al. [7], propôs a utilização da LDA juntamente com a PCA no método

Eigenface. Este método ficou conhecido como Fisherface (PCA + LDA). Em seu trabalho, os

autores fizeram uma comparação da PCA com o subespaço LDA e mostraram que o espaço

de caracteŕısticas criado pela transformação LDA, proporciona resultados de classificação bem

melhores que o subespaço criado somente pela transformação PCA para o reconhecimento de

faces com grandes variações de iluminação e expressões faciais.

Em 1985, Keller et al. [20] propôs a utilização do algoritmo dos k-vizinhos mais próximos

fuzzy (F-KNN) na classificação de padrões. Vinte anos mais tarde, Kwak e Pedrycz [21]

incrementaram o método Fisherface juntamente com o algoritmo proposto por Keller et al.

[20], obtendo o método Fisherface Fuzzy.

A técnica Fisherface Fuzzy tem como prinćıpio incrementar a classificação de faces utilizando

graus de pertinência, que afetam significativamente as matrizes de dispersão interclasse e

intraclasse fuzzy e melhoram a performance do classificador. O cálculo dos graus de pertinência

fuzzy é realizado através de uma sequência de passos proposta por Kwak e Pedrycz [21].

No cálculo dos graus de pertinência, utiliza-se uma função de pertinência fuzzy, sendo a

mais utilizada, a função proposta por Keller et al. [20]:

µij =

 0, 51 + 0, 49(nij/k), se i = j

0, 49(nij/k), se i 6= j
(1.1)

onde k é o número de vizinhos mais próximo escolhido e nij representa o número de vizinhos

do j-ésimo dado que pertence à i-ésima classe.

Não há informações à respeito da origem desta função de pertinência. Diante desse fato,

surgiram alguns questionamentos à respeito desta função, como por exemplo, por que esta

função apresenta parâmetros fixos? Existem outras funções de pertinência que podem ser


1.2 Objetivos 3

utilizadas no processo de reconhecimento de faces? Essas e outras questões contribuiram como

motivação deste trabalho.

1.2 Objetivos

Esta dissertação tem como principal objetivo, o estudo, a implementação e a comparação de

dois métodos de reconhecimento de faces: Fisherface e Fisherface Fuzzy, em meio à fatores que

dificultam o processo de reconhecimento facial. Além disso, é dada especial atenção ao método

Fisherface Fuzzy, avaliando o seu desempenho quando é alterada a função de pertinência fuzzy,

bem como a proposta de uma outra função de pertinência que não depende de parâmetros

aleatórios.

Neste trabalho, foram utilizados como base principalmente os artigos de Keller et al. [20],

Kwak e Pedrycz [21] e Song et al. [36].

1.3 Organização da Dissertação

Neste primeiro caṕıtulo encontram-se descritas algumas considerações iniciais e o contexto no

qual se insere este trabalho. São apresentados também os objetivos. O texto a seguir está

organizado da seguinte forma:

No caṕıtulo 2 apresenta-se algumas considerações à respeito do reconhecimento facial

convencional e são introduzidos os conceitos de biometria e sistemas biométricos. Na sequência

são ilustradas as principais técnicas utilizadas no reconhecimento facial visando ressaltar

os métodos de maior interesse na elaboração deste trabalho, além de toda a conceituação

matemática envolvida nesta dissertação.

No caṕıtulo 3 são apresentados os conceitos relacionados ao método Fisherface Fuzzy,

incluindo os conceitos de k-vizinhos mais próximos, lógica fuzzy e funções de pertinência fuzzy.

O caṕıtulo 4 refere-se a implementação dos algoritmos, no qual são apresentados os detalhes

da sua estrutura. Além disso, são realizados os testes nas bases de dados e por último é realizada

uma discussão dos resultados.

O caṕıtulo 5 contém a finalização do trabalho com as considerações finais, contribuições e

trabalhos futuros.


Caṕıtulo

2

Reconhecimento Facial Convencional

2.1 Introdução

Identificar significa determinar a identidade de alguém ou algo, distinguir os traços

caracteŕısticos de alguém [13], logo identificar pessoas é associar uma identidade a um indiv́ıduo.

Através de tal identificação, pode-se permitir ou negar o acesso à uma determinada informação

(controle de acesso), ou à documentos, áreas restritas, informações, entre outros. Um dos

exemplos mais antigos e básicos de uma caracteŕıstica que é utilizada para o reconhecimento

de uma pessoa é o rosto [29].

Outras caracteŕısticas também têm sido utilizadas ao longo da história como meio mais

formal de identificação de pessoas. Há evidências de que impressões digitais foram usadas

como identificação biométrica na Babilônia, aproximadamente a 500 anos a.C. Os comerciantes

chineses utilizavam impressões digitais para resolver transações comerciais no século XIV. No

Egito antigo, comerciantes eram identificados por seus registros f́ısicos para diferenciar entre os

comerciantes confiáveis e com reputação conhecida, dos comerciantes novos no mercado [29].

Identificar pessoas, embora pareça algo simples, tornou-se uma tarefa complicada,

principalmente devido ao crescimento rápido das cidades na revolução industrial (meados dos

anos 1800). Diante da dificuldade no reconhecimento de pessoas a partir apenas de habilidades

humanas é que se iniciou a busca de métodos mais robustos para a realização desta tarefa

[19]. Comerciantes e autoridades tiveram que criar outras formas de identificação de pessoas,

4


2.2 Biometria 5

pois não poderiam mais depender exclusivamente da sua própria experiência e do conhecimento

do local para fazer essa tarefa. Neste peŕıodo, os tribunais de justiça começaram a registrar

caracteŕısticas da identidade de criminosos, a fim de tratar de modo mais brando criminosos

novatos e de forma mais rigorosa os criminosos reincidentes. Registravam em cartões detalhes

das descrições f́ısicas de infratores, como altura, comprimento do braço, ou qualquer outro

padrão, além de fotografias. Mais tarde, na América do Sul, Ásia e Europa, os departamentos

de poĺıcia começaram a utilizar formalmente impressões digitais para desvendar crimes [29].

Sistemas biométricos começaram a surgir na segunda metade do século XX, coincidindo com o

surgimento do computador.

A seguir, é apresentado um breve resumo dos principais sistemas biométricos utilizados para

a identificação de pessoas, ganhando maior destaque o reconhecimento por faces.

2.2 Biometria

A biometria é uma ciência que estuda a mensuração dos seres vivos [1]. Pode ser definida como o

estudo das medidas e de estruturas e órgãos de seres vivos, bem como da importância funcional

dessas medidas [13]. A palavra biometria vem do grego bios (vida) e metrikos (medida). De

maneira geral, pode-se definir a biometria como o reconhecimento automático de uma pessoa

com base em caracteŕısticas f́ısicas e/ou comportamentais que a distingue das demais [40].

A biometria também pode ser definida como sendo o reconhecimento pessoal baseado

nas caracteŕısticas fisiológicas ou comportamentais de um indiv́ıduo [31]. Como exemplo de

caracteŕısticas fisiológicas, pode-se destacar a identificação por impressão digital, ı́ris, retina,

geometria da mão, dedos e palma da mão, DNA e face. A figura (2.1) mostra alguns

exemplos desse tipo de caracteŕıstica. As caracteŕısticas comportamentais, diferentemente das

caracteŕısticas f́ısicas, podem ser aprendidas ou treinadas ao longo do tempo [19]. São exemplos

deste tipo de caracteŕıstica: reconhecimento por voz, modo de andar, assinatura manuscrita e

dinâmica de digitação. A figura (2.2) mostra algumas caracteŕısticas comportamentais.

Qualquer um dos dois tipos de caracteŕısticas (f́ısica ou comportamental) podem ser

utilizados para identificar uma pessoa, contudo, deve-se seguir alguns critérios no momento da

escolha, obedecendo aos critérios desejáveis que possibilitará o desenvolvimento de um sistema

de reconhecimento de pessoas [1]. Os critérios desejáveis estão descritos na tabela (2.1).


2.2 Biometria 6

Figura 2.1: Caracteŕısticas F́ısicas comumente utilizadas na identificação de pessoas (imagens
adaptadas da internet).

Tabela 2.1: Critérios desejáveis de um sistema de reconhecimento de pessoas.

Requisito Descrição

Universalidade Todo indiv́ıduo deve ter a caracteŕıstica.
Unicidade Todo indiv́ıduo deve possuir caracteŕısticas únicas.

Permanência A caracteŕıstica deve ser invariante ao longo do tempo.
Mensurabilidade A caracteŕıstica deve ser posśıvel de ser coletada.

Desempenho Refere-se à precisão e velocidade do reconhecimento, bem como
fatores operacionais e ambientais.

Aceitabilidade Os indiv́ıduos a serem identificados devem aceitar fornecer suas
caracteŕısticas.

Fraude Refere-se a facilidade de burlar o sistema por métodos fraudulentos.


2.3 Sistemas Biométricos 7

Figura 2.2: Exemplos de Caracteŕısticas Comportamentais (imagens adaptadas da internet).

2.3 Sistemas Biométricos

Um sistema biométrico é um sistema de reconhecimento de padrões que opera através de dados

biométricos do indiv́ıduo, adquiridos e comparados com os padrões armazenados na sua base de

dados [14]. Dependendo do caso, um sistema biométrico opera como um sistema de verificação

ou de identificação. Independente do tipo de sistema biométrico, em ambos os casos, existe a

fase de cadastramento ou registro. Nesta fase são captadas as caracteŕısticas dos indiv́ıduos que

são processadas, a fim de se obter uma representação compactada e expressiva do indiv́ıduo,

chamada de template [ver figura (2.3)].

Figura 2.3: Fase de registro ou cadastramento em Sistemas Biométricos, adaptada de
http://www.metropoledigital.ufrn.br, acessado em 09/06/2014.

Na fase de verificação, o sistema busca na base de dados as informações sobre o indiv́ıduo

e investiga se a pessoa é realmente quem ela afirma ser. Neste sistema, a pessoa deseja ser

reconhecida e solicita sua identificação. O processo é o seguinte:


2.3 Sistemas Biométricos 8

1. inicialmente, o indiv́ıduo fornece sua identidade ao sistema;

2. o leitor biométrico captura as caracteŕısticas deste indiv́ıduo e as converte para o formato

digital, utilizando as mesmas técnicas empregadas no processo de cadastramento;

3. em seguida, o sistema compara as caracteŕısticas capturadas do indiv́ıduo com a

informação guardada na base de dados (compara com somente um template registrado na

base de dados).

De posse dessas informações, o sistema decide se aceita ou rejeita a pessoa que está se

identificando [ver figura (2.4)].

Figura 2.4: Fase de verificação ou comparação em Sistemas Biométricos, adaptada de
http://www.metropoledigital.ufrn.br, acessado em 09/06/2014.

Na etapa de identificação, o sistema busca em toda a base de dados registros sobre o

indiv́ıduo até que ele seja encontrado ou não. Neste caso, procura-se estabelecer a identidade

da pessoa sem que ela forneça sua identidade. Neste tipo de sistema biométrico, nenhuma

informação prévia em relação à identidade do indiv́ıduo é fornecida ao sistema. O processo é o

seguinte:

1. inicialmente, obtém-se as informações biométricas do indiv́ıduo, através do leitor

biométrico;

2. em seguida, essas informações são comparadas com todos os templates registrados na base

de dados;

3. por último, é feita a identificação.


2.4 Tipos de Biometria 9

O sistema fornecerá a identidade do indiv́ıduo baseando-se na maior similaridade encontrada,

ou então, informar que o indiv́ıduo não está cadastrado na base de dados [ver figura (2.5)].

Figura 2.5: Fase de Identificação em Sistemas Biométricos, adaptada de http://www.metropoledigital.
ufrn.br, acessado em 09/06/2014.

2.4 Tipos de Biometria

Existem vários métodos biométricos. Nesta seção, são apresentados inicialmente os de

caracteŕısticas fisiológicas, tais como, impressão digital, DNA, ı́ris, retina, face e geometria

da mão; em seguida, os de caracteŕısticas comportamentais, como reconhecimento por voz,

padrão de digitação e assinatura manuscrita.

2.4.1 Impressão Digital

A impressão digital é constituida de uma série de traços e sulcos na região extrema dos dedos

[ver figura (2.6)]. Esses traços e sulcos formam as caracteŕısticas inimitáveis presentes nas

digitais, chamadas de minúcias, que são formadas pelas bifurcações ou terminações entre esses

traços e sulcos. A posição relativa das minúcias são atributos imutáveis e inimitáveis de um

indiv́ıduo; pela relação determinada entre elas é posśıvel identificar e distingir uma pessoa [1].

A técnica de reconhecimento através de impressão digital é muito utilizada, devido

principalmente ao seu baixo custo, mas apresenta desvantagens, tais como, se no momento

do reconhecimento o dedo estiver com as minúcias desgastadas, sujo ou muito seco, podem

ocorrer erros no processo de comparação dos dados; deformidades nos dedos (calos, cortes)

também podem impedir a correta identificação do indiv́ıduo.


2.4 Tipos de Biometria 10

Figura 2.6: Pontos identificadores das Impressões Digitais.

2.4.2 DNA

O DNA (Ácido Desoxirribonucleico) é um aglomerado de moléculas que contém material

genético, esse material é determinante para o bom funcionamento dos seres vivos e da formação

das caracteŕısticas f́ısicas. É essencialmente um “manual” de instruções para tudo que existe

no corpo humano. É um código único definitivo para a individualidade, exceto para gêmeos

idênticos que têm o mesmo padrão de DNA [15]. A figura (2.7) ilustra a estrutura do DNA.

Por ser uma biometria precisa, o DNA é muito utilizado, principalmente por investigadores

criminais, por exemplo, para desvendar crimes, provar a culpa de um criminoso, livrar um

inocente. Além disso, ele é utilizado para outras finalidades, tais como: teste de paternidade,

identificação de cadáveres, estudo de doenças hereditárias, entre outras.

Figura 2.7: Estrutura do DNA.


2.4 Tipos de Biometria 11

2.4.3 Íris

A ı́ris é um músculo que faz parte do globo ocular (parte viśıvel do olho humano), cuja função

é controlar a quantidade de luz que entra no olho [ver figura (2.8)]. A formação da textura

da ı́ris no olho humano começa no peŕıodo pré-natal devido alguns processos biológicos, por

esta razão, constitui uma caracteŕıstica única a cada indiv́ıduo, além de ser permanente, isto é,

invariante durante toda a vida da pessoa [1].

Os sistemas biométricos que utilizam a ı́ris como meio de identificação, baseando-se na

leitura dos anéis coloridos existentes em torno da pupila. Esses anéis formam uma imagem

complexa que é usada para a identificação. É uma técnica de reconhecimento simples e muito

eficiente. Como comparação, a ı́ris do olho pode promover uma solução para a discriminação

biométrica muito melhor do que as oferecidas por impressão digital [28].

Figura 2.8: Imagem de um olho humano com a ı́ris em destaque (à esquerda) e imagem do fundo do
olho humano, onde observamos os vasos sangúıneos da retina (à direita).

2.4.4 Retina

Retina é a parte posterior do olho formada em geral por células nervosas [ver figura (2.8)]. É

o local onde forma a imagem (visão) que é traduzida pelo cérebro. A identificação através da

retina é um método seguro, pois as informações da retina não apresentam variação ao longo

da vida do indiv́ıduo, entretanto, o sistema apresenta leitura dif́ıcil e incômoda, pois a captura

dessa imagem exige que a pessoa olhe fixamente para um ponto de luz de infravermelho até que

a câmera focalize os padrões e os capture.


2.4 Tipos de Biometria 12

2.4.5 Face

A identificação facial é um sistema biométrico intuitivo aos seres humanos, já que uma pessoa

é reconhecida facilmente por suas aparências faciais. A partir da face humana, pode-se extrair

algumas caracteŕısticas, como por exemplo, as posições dos olhos, nariz, boca e assim identificar

o indiv́ıduo.

As caracteŕısticas mais exploradas na face são a boca, o nariz, os olhos e as sobrancelhas

[42] [ver figura (2.9)]. A tecnologia de reconhecimento facial considera que as medidas do rosto

nunca se alteram, tais como, distância entre os olhos, distância dentre a boca, nariz e olhos e

distância entre olhos, queixo, boca e linha dos cabelos.

Como caracteŕısticas positivas deste sistema, pode-se destacar que existe larga aceitação

pública para este identificador biométrico, já que fotos de faces são usadas em documentos.

Além disso, os sistemas de reconhecimento de face são menos intrusivos, não exigindo qualquer

contato e nem mesmo a colaboração do usuário. Entretanto, é um processo extremamente

complexo que deve levar em consideração as mudanças que o rosto sofre no decorrer do tempo,

além de fatores adversos, como condição de iluminação e utilização de acessórios, tais como,

chapéu, ocúlos e etc., que podem dificultar o processo de reconhecimento.

Figura 2.9: Alguns pontos importantes para o reconhecimento facial.

2.4.6 Geometria da mão

Este sistema baseia-se nas informações geométricas da mão. A figura (2.10) mostra uma imagem

da mão em que estão representados os pontos caracteŕısticos a serem utilizados na geometria.


2.4 Tipos de Biometria 13

O desenvolvimento de um sistema baseado nessa técnica utiliza um módulo de aquisição

de imagens, que captura a imagem da mão, em seguida, são analisadas suas informações

geométricas extraindo os principais padrões que permitem identificar uma pessoa. Esses padrões

são geralmente o tamanho dos dedos, a largura e sua área [1]. A principal desvantagem desta

técnica está na sua baixa discriminação se comparado com outros sistemas.

Figura 2.10: Pontos caracteŕısticos utilizados na Geometria da Mão.

2.4.7 Voz

Este sistema biométrico consiste em identificar uma pessoa através da constatação de

caracteŕısticas comportamentais e fisiológicas do aparelho fonador (orgãos utilizados para

produzir o som), como a boca, lábios, ĺıngua e nariz (fossas nasais).

O método é desenvolvido a partir da captura de uma amostra de voz de uma pessoa, por

exemplo através de um microfone. Em seguida, faz-se uma análise da amostra, aplicando

técnicas de processamento de sinais. Dessa forma, diversos sons emitidos por vozes podem ser

caracterizados de maneira diferente, possibilitando a identificação de uma pessoa. A figura

(2.11) ilustra as vibrações emitidas pela voz.

A biometria de voz apresenta alguns problemas. As principais desvantagens são a

sensibilidade a rúıdos externos causados por exemplo, por fatores ambientais; e as posśıveis

variações da voz causadas por razões f́ısicas, como resfriados ou alterações emocionais, como

raiva.


2.4 Tipos de Biometria 14

Figura 2.11: Vibrações emitidas pela voz.

2.4.8 Padrão de Digitação

Baseia-se na hipótese de que cada pessoa digita em um teclado de uma forma caracteŕıstica

[15] [ver figura (2.12)]. Considerando a variabilidade no modo das pessoas digitarem, é quase

imposśıvel obter uma imitação perfeita do padrão de digitação. Considerando esse fato, conclui-

se que este sistema biométrico tem um bom grau de segurança e unicidade.

2.4.9 Assinatura Manuscrita

A forma como uma pessoa assina seu nome é conhecida por ser uma caracteŕıstica individual

[ver figura (2.12)]. Embora assinaturas requerem contato e esforço com o instrumento de

escrita, elas são aceitáveis como método de autenticação pessoal [15]. Este sistema é um padrão

comportamental (muda ao longo do tempo).

A assinatura é aplicada principalmente na identificação de indiv́ıduos e na verificação

da autenticidade de documentos formais. O método mais comum utilizado para verificar a

veracidade de uma assinatura é o visual, ou seja, a assinatura de uma pessoa é comparada com

amostras recolhidas anteriormente e, caso seja similar, é aprovada. Com o avanço tecnológico,

surgiram métodos de validação mais avançados, que levam em consideração outros fatores

como: formato das letras, ângulo no qual a caneta é segurada, tempo que se leva para assinar,

velocidade e aceleração da assinatura, pressão aplicada ao escrever, número de vezes que a

caneta é levantada, dentre outros.

A tabela (2.2) apresenta uma comparação entre os nove tipos biométricos relatados nas

seções anteriores com relação aos critérios desejáveis de um sistema de reconhecimento de


2.5 Reconhecimento Facial 15

Figura 2.12: Forma de digitação em um teclado (à esquerda) e um estilo de um indiv́ıduo escrever (à
direita).

pessoas.

Observa-se que cada um dos sistemas estudados possui vantagens e desvantagens, entretanto

cada um tem a sua importância e aplicabilidade. Reforça-se que a face tem uma excelente

aceitação, porém apresenta problemas com relação à unicidade e desempenho. Este sistema

biométrico encontra-se discutido mais profundamente nas próximas seções.

Tabela 2.2: Comparação dos nove tipos biométricos descritos na seção (2.3) segundo Jain et al. [14],
onde: A-alta performance, M-média performance, B-baixa performance.

S
is

te
m

a
s

B
io

m
é
tr

ic
o
s

U
n
iv

e
rs

a
li
d
a
d
e

U
n
ic

id
a
d
e

P
e
rm

a
n

ê
n

ci
a

M
e
n

su
ra

b
il
id

a
d

e

D
e
se

m
p

e
n
h
o

A
ce

it
a
b

il
id

a
d

e

F
ra

u
d
e

Impressão Digital M A A M A M M
DNA A A A B A B B

Íris A A A M A B B
Retina A A M B A B B

Face A B M A B A A
Geometria da mão M M M A M M M

Voz M B B M B A A
Padrão de digitação B B B M B M M

Assinatura B B B A B A B


2.5 Reconhecimento Facial 16

2.5 Reconhecimento Facial

A maneira mais básica e natural utilizada pelo homem para a identificação de pessoas é

através do reconhecimento facial. Essa identificação é um dos métodos não-intrusivos em

biometria, no entanto, consiste também em um dos maiores desafios para os pesquisadores da

área, envolvendo pesquisas em psicof́ısica, neurociência, engenharia, reconhecimento de padrões,

análises e processamento de imagens, visão computacional aplicada ao reconhecimento de faces

por humanos e máquinas [33].

A formação da base de dados é um fator important́ıssimo para se obter sucesso no processo

de reconhecimento. Nesta etapa uma ou mais imagens de faces são agrupadas e codificadas

para o uso no modelo, esse conjunto forma o espaço de faces. Depois de selecionar uma face

alvo e estabelecer a similaridade com a base de dados, o algoritmo busca caracteŕısticas que

definem a face. Como uma imagem é constitúıda de pixels, temos que na verdade a análise é

realizada sobre a intensidade luminosa de cada um deles em relação aos que estão na base de

faces.

O reconhecimento facial, independente do método utilizado, pode ser definido nas seguintes

etapas [ver o diagrama mostrado na figura (2.13)]:

• Aquisição da Imagem: Utiliza-se, geralmente, uma fotografia ou uma imagem

digitalizada obtida por uma câmera;

• Pré-Processamento: Elimina-se os rúıdos e distorções da imagem;

• Análise da Imagem: Utiliza-se diferentes técnicas para extrair as caracteŕısticas da

imagem de cada indiv́ıduo (cria-se um vetor reduzido de caracteŕıstica com dados extráıdos

dos objetos adquiridos);

• Seleção das caracteŕısticas: Analisa-se o conjunto dos vetores de caracteŕısticas e

elimina-se os mais redundantes.

• Classificação: Analisa-se o padrão obtido (classificação ou agrupamento) e então toma-se

uma decisão.

Na classificação, o classificador toma decisões baseando-se no aprendizado realizado a partir

do conjunto de treinamento, o qual contém exemplos de padrões de todas as classes existentes no


2.5 Reconhecimento Facial 17

Figura 2.13: Modelo do Processo de Reconhecimento Facial

sistema. No reconhecimento estat́ıstico de padrões, a classificação é feita utilizando estimativas

de distribuições probabiĺısticas. O reconhecedor de padrões é avaliado através de um conjunto

de testes, preferencialmente composto de todas as classes, mas que não estejam no conjunto de

treinamento [33].

Em reconhecimento de faces cada classe e suas variações representam uma mesma

pessoa, logo o problema de classificação apresenta a seguinte ideia: Dado um indiv́ıduo

desconhecido, extrai-se suas caracteŕısticas para obter o vetor x (de caracteŕısticas)

e determinar a qual classe esse indiv́ıduo pertence.

Pode-se encontrar diversos problemas durante o processo de reconhecimento facial, entre

eles, mudanças na iluminação e diferentes poses e expressões faciais. Segundo Atalay [4], pode-se

classificar um sistema como robusto se o mesmo for insenśıvel à:

• Variância de Escala: A mesma face pode ser apresentada para o sistema de diferentes

escalas (a distância entre o rosto e a câmera influencia o reconhecimento);

• Variação de Posição: A mesma face pode ser captada sob diferentes perspectivas e

orientações, por exemplo, de perfil, frontal;

• Variação de Iluminação: Uma mesma imagem da face captada sob diferentes condições

de iluminação pode causar dupla interpretação;


2.5 Reconhecimento Facial 18

• Expressões e Detalhes Faciais: Sorrir, fazer caretas, barbas e bigodes, usar óculos,

entre outras caracteŕısticas podem influenciar no processo de reconhecimento;

• Rúıdos: Rúıdos gerados por granulações da imagem, defeitos de hardware, oclusão da

câmera e objetos que interferem na precisão da imagem.

A seguir são discutidas algumas técnicas de reconhecimento facial.

2.5.1 Técnicas de Reconhecimento Facial

Os métodos de reconhecimento facial são divididos em dois tipos:

• Métodos baseados em caracteŕısticas locais;

• Métodos hoĺısticos.

Os métodos baseados em caracteŕısticas locais, como o próprio nome diz, baseiam-se na

identificação através de determinados pontos importantes da face, tais como olhos, nariz,

boca e etc. Estes métodos utilizam uma análise matemática extensa para extrair informação

das componentes básicas da face e, em seguida, converter essa informação em um vetor de

caracteŕısticas [9].

Já os métodos hoĺısticos analisam a imagem facial de forma geral, sem localizar pontos

individuais. As técnicas hoĺısticas costumam utilizar a análise estat́ıstica, redes neurais ou

transformações lineares. Sua maior vantagem está no fato de utilizar a face como um “todo”,

assim o método não destrói nenhuma informação quando determinados pontos importantes da

face são processados. Mais detalhes sobre os métodos hoĺısticos são apresentados a seguir.

2.5.2 Métodos Hoĺısticos

Como já foi discutido anteriormente, os métodos hoĺısticos analisam a imagem facial como um

“todo”, ou seja, considera todos os pixels da imagem ou de algumas regiões importantes da

face, logo a dimensionalidade dos dados é exatamente igual ao número de pixels da imagem

ou da região em estudo. Por exemplo, considerando no treinamento uma imagem 64 × 64,

ela gera uma matriz do tipo 642 × 642 (como será discutido na seção (2.5.4)), o que aumenta

muito o esforço computacional e consequentemente pode impossibilitar o reconhecimento, por

este motivo, utiliza-se métodos que reduzem a dimensionalidade do conjunto mantendo-se a

precisão do classificador.


2.5 Reconhecimento Facial 19

Sendo uma etapa importante no reconhecimento, a redução da dimensionalidade está

conectada fortemente à capacidade dos algoritmos em utilizar espaços de caracteŕısticas de

tamanhos intratáveis para tamanhos manuseáveis [9]. Dentre as diversas técnicas, destacam-se

a Análise de Componentes Principais (PCA) e Análise de Discriminante Linear (LDA).

Estes dois métodos são baseados em análises estat́ısticas dos vetores da imagem facial. Cada

método tem uma forma própria de atuar e de representar os vetores da base para formar um

espaço de dimensão menor. Quando o vetor de face é projetado nos vetores da base do sistema,

obtêm-se os coeficientes da projeção definidos como a nova representação caracteŕıstica de cada

imagem facial. O reconhecimento da face em teste é executado por meio de um classificador,

que compara os coeficientes das faces originais de treinamento com os coeficientes da face em

teste, e a partir dáı, classifica a face em teste em alguma classe. A forma mais simples de

realizar a classificação é utilizar o cálculo das distâncias entre os vetores, como por exemplo, a

distância euclidiana.

Nas próximas seções, apresenta-se um detalhamento dos métodos Eigenface e Fisherface

(consequentemente um detalhamento das técnicas PCA e LDA); antes porém, são definidos

matematicamente os principais conceitos utilizados neste estudo.

2.5.3 Definições Importantes

Uma imagem digital é uma matriz m×n, em que cada elemento da matriz é denominado pixel

(do inglês picture elements). Cada pixel possui três coordenadas: x e y definem a sua posição

na imagem e i representa o ńıvel de cinza ou grau de brilho da imagem.

Definição 2.1 (Imagem Digital). Seja uma matriz m × n cujos elementos pertencem a um

espaço vetorial, isto é, uma aplicação i : R −→ V , onde R é um subconjunto do plano e V

é um espaço vetorial. Para cada pixel (x, y) ∈ R da imagem, i(u, v) contém informações da

estrutura do pixel.

A seguir, define-se alguns conceitos importantes da Estat́ıstica Multivariada. Consideremos

X um vetor aleatório de dimensão p (contém p componentes):

X = (X1, X2, X3, ..., Xp)
T , (2.1)

onde T significa transposto e X1, X2, ..., Xp são variáveis aleatórias.


2.5 Reconhecimento Facial 20

Figura 2.14: Ilustração do pixel - menor elemento da imagem digital.

Definição 2.2 (Vetor das Médias). Seja X um vetor aleatório. O vetor das médias de X é

definido por:

µ = E(X) =


E(X1)

E(X2)
...

E(Xp)

 =


µ1

µ2

...

µp

 , (2.2)

onde µi = E(Xi), denota a média ou esperança matemática da variável aleatória Xi, i =

1, 2, ..., p.

Definição 2.3 (Desvio padrão). Sejam Xp variáveis aleatórias, o desvio padrão σi mede a

dispersão dos valores individuais em torno da média, isto é,

σi =

√∑
(Xi − µ)2

p− 1
, (2.3)

onde i=1,2,...,p.

Definição 2.4 (Variância). A variância da i-ésima componente do vetor X é calculada por

Var(Xi) = σ2
i , onde σi é o desvio padrão.

A variância e o desvio padrão são medidas de dispersão e possuem caracteŕısticas distintas:

a variância estabelece os desvios em relação à média aritmética µi e o desvio padrão analisa a


2.5 Reconhecimento Facial 21

regularidade dos valores, isto significa que valores grandes de σi indicam uma maior dispersão

de valores em relação à média.

Quando existirem duas variáveis aleatórias Xi e Xj, dispõe-se de várias medidas estat́ısticas

que podem ser utilizadas para analisar como estas variáveis se relacionam ou variam

conjuntamente. A medida mais utilizada é a covariância.

Definição 2.5 (Covariância). Sejam Xi e Xj duas variáveis aleatórias, a covariância entre

elas é definida por:

Cov(Xi, Xj) = E [(Xi − µi)(Xj − µj)] = σij, (2.4)

isto é, o valor médio do produto dos desvios de Xi e Xj em relação às suas respectivas médias.

A covariância verifica a relação entre duas variáveis, logo o seu sinal indica o tipo de relação

que as duas variáveis têm. Se a covariância for nula significa que as variáveis analisadas

são independentes, mas se for diferente de zero as variáveis podem apresentar determinada

dependência entre si. Um sinal positivo indica que elas movem juntas e um negativo que elas

movem em direções opostas.

Sabe-se que uma imagem tem muitas variáveis, por este motivo, convém guardar os valores

das médias numa matriz, chamada de matriz de covariância.

Definição 2.6 (Matriz de Covariância). A matriz de covariância ou matriz de dispersão das

variáveis aleatórias X1, X2, ..., Xp é definida por:

Cov(X) = V ar(X) =


σ2
1 σ12 . . . σ1p

σ21 σ2
2 . . . σ2p

...
...

. . .
...

σp1 σp2 . . . σ2
p

 , (2.5)

onde σij = Cov(Xi, Xj) e σ2
i = σii, para i = 1, 2, ..., p e j = 1, 2, ..., p.

2.5.4 Método Eigenface (PCA)

O método Eigenface foi inicialmente proposto por TURK e PENTLAND, em seu trabalho

“Eigenfaces for Recognition”, publicado em 1991 [39]. A proposta de utilização de Eigenfaces

(autofaces) para o reconhecimento de faces foi de utilizar atributos diferentes dos métodos


2.5 Reconhecimento Facial 22

baseados em caracteŕısticas (olhos, boca, nariz, entre outros) e passar a utilizar informações

mais discriminantes da face (caracteŕısticas globais). Assim, os autores propuseram utilizar

à Análise de Componentes Principais (PCA - Principal Component Analysis) para fazer a

extração das caracteŕısticas da imagem facial.

A PCA é uma técnica bem conhecida e explora a análise de dados lineares multivariados, isto

é, analisa um número muito grande de dados. Essa técnica matemática descreve um conjunto de

dados usando “componentes principais”, escrita como combinações lineares dos dados originais.

As componentes principais são determinadas em ordem decrescente de importância. A primeira

componente possui mais informação do que a segunda, e assim por diante. A PCA tenta

construir um pequeno conjunto de componentes que resumem os dados originais, reduzindo a

dimensionalidade dos mesmos [34].

Os principais objetivos da PCA são:

1. Redução de dimensionalidade;

2. Seleção de Caracteŕısitcas (escolha das Componentes Principais).

O método das Autofaces (Eigenface) busca identificar um pequeno número de caracteŕısticas

que são relevantes para diferenciar uma face de outras. Essas caracteŕısticas podem ser

analisadas apenas com a variação dos valores assumidos pelos pixels, em um conjunto de

imagens de faces [34]. Matematicamente, esse processo pode ser obtido através dos autovetores

(eigenvectors) que formam as bases ortonormais do subespaço de face e seus respectivos

autovalores (eigenvalues) obtidos por meio da matriz de covariância formada de um conjunto

de imagens de faces. Esses autovetores podem ser vistos como um conjunto de caracteŕısticas

que descrevem a variação entre tais imagens. Em suma, cada imagem de face no conjunto

de treinamento pode ser exatamente representada em termos de uma combinação linear dos

autovetores; e os coeficientes desta combinação serão os novos representantes da face no

subespaço dimensional [33].

Segundo Silva [34], o método Eigenface consiste em:

1. Formar um subespaço X (chamado subespaço PCA ou subespaço de faces), descrito pelos

principais autovetores da matriz de covariância de um determinado conjunto de faces;

2. Projetar uma imagem teste (Zteste) neste subespaço, gerando um vetor de pesos x, tal

que x = pT · Zteste;


2.5 Reconhecimento Facial 23

3. Comparar o vetor de pesos x obtido da projeção com os vetores obtidos da projeção de

faces conhecidas.

O objetivo principal do método Eigenface é escolher uma projeção redutora de

dimensionalidade (através da PCA) que maximiza o espalhamento de todas as imagens de

faces projetadas [7], isto é, classificar e agrupar as imagens de faces em classes, garantindo a

máxima separabilidade entre essas classes. A formalização matemática do método Eigenface

para o reconhecimento de faces é a seguinte:

Consideremos Im(x, y) uma imagem de face como sendo uma matriz de dimensão Nx×Ny,

em que Nx é o número de linhas e Ny é o número de colunas. Representa-se a matriz I

concatenada em linhas da seguinte forma:

Im(x, y) =


x11 x12 · · · x1Ny

x21 x22 · · · x2Ny
...

... · · · ...

xNx1 xNx2 · · · xNxNy

 =



x11

x12
...

x1Ny

x21

x22
...

x2Ny

xNx1

xNx2
...

xNxNy



. (2.6)

Cada vetor tem tamanho N e descreve uma imagem de tamanho Nx × Ny, sendo uma

combinação linear das faces originais. Esses vetores são chamados de “autofaces”.

Seja Z = {Z1, Z2, ..., ZM} o conjunto das imagens de faces de treinamento e M a quantidade

de imagens desse conjunto. As imagens de treinamento são selecionadas a partir de uma base

de dados podendo ser todo o conjunto ou algumas imagens. Há informações redundantes na

face, logo ela pode ser representada somente pela variância que ocorre em torno de uma média

(componentes principais). Assim, a média do conjunto Z (face média) é definida pela expressão:


2.5 Reconhecimento Facial 24

Z =
1

M
·

M∑
i=1

Zi. (2.7)

Note que Z tem a mesma dimensão das imagens de treinamento. Cada imagem do conjunto

de treinamento diferencia-se em relação à face média (Z) pela relação:

Φi = Zi − Z, i = 1, 2, ...,M. (2.8)

O vetor Φi contém todas as variações de uma determinada face Zi em relação à face média

Z. Dessa forma, levando em consideração que todas as faces serão subtráıdas da face média,

tem-se uma nova matriz A que contém somente as variações de cada face em relação à face

média [34]:

A = [Φ1,Φ2, ...,ΦM ] (2.9)

e, o cálculo da matriz de covariância R é dado por:

R =
1

M
·

M∑
i=1

(Zi − Z)(Zi − Z)T =
1

M
·

M∑
i=1

ΦiΦ
T
i = (A · AT ). (2.10)

A matriz R é de dimensão N2×N2 e determinar os autovetores e autovalores desta matriz é

um problema dif́ıcil de ser resolvido em virtude do seu tamanho. Para solucionar esse problema

(alta dimensionalidade dos dados), considera-se:

Seja λi e vi os autovalores e autovetores de R = A · AT , respectivamente. Logo:

(A · AT ) · vi = λi · vi. (2.11)

Para determinar os λi autovalores associados aos vi autovetores, utiliza-se o seguinte artif́ıcio

de Álgebra Linear: seja λk e vk, os autovalores e autovetores de AT ·A, respectivamente, isto é,

(AT · A) · vk = λk · vk. (2.12)

Multiplicando ambos os lados da equação (2.12) por A, obtêm-se:

A · (AT · A) · vk = A · λk · vk, (2.13)


2.5 Reconhecimento Facial 25

isto é,

(A · AT ) · (A · vk) = λk · (A · vk). (2.14)

Nota-se das equações (2.11) e (2.14) que os autovetores vi ∈ A ·AT satisfazem Avk = λk, ou

seja, Avk são os autovetores de R. Logo, conhecendo vk conhece-se λk. Portanto, uma matriz

de dimensão M ×M é utilizada nos cálculos ao invés da matriz de dimensão N ×N , reduzindo

substancialmente e de forma eficiente os cálculos computacionais [34].

Para continuar a análise, tem-se que cada autoface pk será escrita como combinação linear

dos autovetores que representam as imagens do conjunto de treinamento com as faces do

conjunto de imagens, isto é:

pk =
M∑
j=1

vjkΦk. (2.15)

Depois de determinar as autofaces, as imagens do conjunto de treinamento são projetadas

no subespaço de faces, chamado de subespaço PCA, através da seguinte relação:

xi = pTi (Zi − Z), i = 1, 2, ...,M
′
, (2.16)

em que M
′

é o número de autovetores associados aos maiores autovalores e xi representam a

contribuição de cada autoface em relação às imagens do conjunto de treinamento.

Para saber qual classe pertence uma imagem teste, é preciso verificar a contribuição de cada

autoface em relação à essa nova imagem. Seja Zteste a face teste de dimensão N2 = Nx ×Ny.

A diferença entre essa face e a face média, é calculada por:

Φteste = Zteste − Z, (2.17)

onde Φteste tem dimensão N . A projeção no subespaço PCA será dada por:

xteste = pTi · Φteste, para i = 1, 2, ...,M
′
. (2.18)

A classificação é feita utilizando os pesos da equação (2.16) para procurar quais faces

do conjunto de treinamento são similares à essa nova imagem teste. Para o processo de

similaridade, utiliza-se o cálculo da distância euclidiana entre os pesos das equações (2.16)


2.5 Reconhecimento Facial 26

e (2.18), isto é,

εi = ||(xteste − xi)||, (2.19)

em que xteste é o vetor de pesos resultantes da projeção da face teste no subespaço PCA e xi

é um vetor que representa a i-ésima face.

Portanto, a imagem teste Zteste pertencerá a classe que possui a menor distância euclidiana

(εi).

2.5.5 Método Fisherface (PCA+LDA)

Fisherface é outro método utilizado para o reconhecimento de faces por meio de caracteŕısticas

globais da face. De forma análoga ao Eigenface, esse método baseia-se também na redução de

dimensionalidade do espaço de caracteŕısticas. A projeção ótima neste caso é obtida através

da Análise de Discriminante Linear (LDA - Linear Discriminant Analysis) ou Análise de

Discriminante Linear de Fisher (F-LDA).

O método Fisherface foi descrito por Belhumeur et al. [7], no trabalho: “Eigenfaces vs.

Fisherfaces: Recognition using class specific linear projection”, publicado em 1997. De acordo

com os autores, a LDA consegue encontrar subespaços que distribuem de maneira mais eficaz

as classes do sistema.

Na Análise de Discrinante Linear, o conjunto de imagens faciais de treinamento é constitúıdo

por várias classes. Cada classe representa a identidade de uma pessoa e com base num conjunto

de classes previamente conhecidas, o problema de reconhecimento é formulado de modo a

determinar a que classe pertence uma determinada imagem desconhecida.

A LDA pode ser entendida como uma técnica (para o reconhecimento de faces) que busca

maximizar o raio de variância entre as classes (between - class) e paralelamente minimizar a

variância dentro das classes (within-class) garantindo a máxima separabilidade entre as classes

de um conjunto particular de imagens de faces, sendo aplicada uma transformação linear visando

encontrar um sistema de coordenadas ótimas, que melhor represente as imagens com máxima

separabilidade [33].

O método Fisherface é formado por duas fases: primeiro projeta-se o conjunto de imagem

para um espaço de menor dimensão utilizando a PCA e depois é seguido pela fase da LDA

[21]. Na PCA é feita a projeção do conjunto de imagens de treinamento para um subespaço de


2.5 Reconhecimento Facial 27

menor dimensão. Depois da redução de dimensionalidade, na técnica LDA, os vetores próprios

obtidos são usados para projetar as imagens faciais num subespaço de dimensão ainda menor.

O reconhecimento de uma face de teste se dá com a projeção no subespaço dos vetores próprios

criados e utilizando uma medida de semelhança, para efetuar a comparação com as outras faces

projetadas no mesmo subespaço [9].

Matematicamente, seja Zij uma imagem de face como sendo uma matriz de tamanho N (da

mesma forma que (2.6)) projetada no subespaço PCA, em que a j-ésima imagem de uma classe

de imagens Ci. A média total (µ) dessas faces é dada por:

µ =
1∑r

i=1Ni

r∑
i=1

Ni∑
j=1

Zij, (2.20)

onde Ni é o número de faces pertencentes a cada uma das r classes pré determinadas

C1, C2, ..., Cr e Ci = xij, ..., xiCi . Além disso, a face média (µi) da classe Ci, é obtida pela

expressão:

µi =
1

Ni

Ni∑
j=1

Zij. (2.21)

A matriz de dispersão interclasse (entre classes) SB é definida por:

SB =
r∑

i=1

Ni(µi − µ)(µi − µ)T , (2.22)

ou seja, SB representa a dispersão das faces médias de cada classe em relação à média total.

A matriz de dispersão intraclasse (dentro de cada classe) SW é definida por:

SW =
r∑

i=1

Ci∑
j=1

(Zij − µi)(Zij − µi)
T =

r∑
i=1

SWi
, (2.23)

onde SWi
é uma matriz de covariância da classe Ci e SW representa a dispersão das imagens de

faces Zij em relação à face média de sua classe.

A técnica LDA buscar encontrar uma matriz de projeção ótima que maximize a razão do

determinante da matriz de dispersão interclasse das imagens de faces projetadas e também que

minimize o determinante da matriz de dispersão intraclasse dessas mesmas imagens [19]. A

matriz de projeção ótima (Wotima) é dada por:


2.6 Considerações Finais 28

Wotima = arg max︸ ︷︷ ︸
W

|W T · SB ·W |
|W T · SW ·W |

= [W1 W2 ... WM ], (2.24)

onde {Wi|i = 1, 2, ...,M} é o conjunto generalizado de autovetores de SB e SW correspondente

aos M maiores autovalores {λi|i = 1, 2, ...,M}.

Note que o método Fisherface projeta o conjunto de imagens em um espaço de dimensão

menor tal que a matriz de dispersão intraclasse SW resultante seja não-singular (logo a projeção

ótima (2.24) pode ser calculada).

Em resumo, o método Fisherface utiliza a técnica PCA para reduzir a dimensionalidade

projetando as faces originais em um espaço de dimensão menor. Em seguida, a técnica LDA

é aplicada para procurar a melhor caracteŕıstica discriminante linear naquele subespaço PCA

[34]. Formalmente, a matriz de projeção ótima Wotima pode ser calculada da seguinte forma:

Wotima = WLDA ·WPCA, (2.25)

onde

WPCA = arg max︸ ︷︷ ︸
W

|W T · SBW ·W |, (2.26)

para SBW = SB + SW e WLDA é dada por:

WLDA = arg max︸ ︷︷ ︸
W

|W T ·W T
PCA · SB ·WPCA ·W |

|W T ·W T
PCA · SW ·WPCA ·W |

. (2.27)

A classificação é feita procurando quais faces do conjunto de treinamento são similares às

novas imagens de faces testes, do mesmo modo como foi descrito na seção (2.5.4).

2.6 Considerações Finais

Através deste caṕıtulo, pode-se observar que com o surgimento dos computadores, houve

crescentes estudos na área de identificação (autenticação) de uma pessoa no campo da biometria,

como por exemplo, estudos no reconhecimento por impressão digital, retina, voz, geometria da

mão e análise de imagens faciais.

Em seguida, foram discutidos o processo de reconhecimento facial, que é realizado em cinco

etapas. Inicialmente, utiliza-se uma base de imagens de faces (aquisição da imagem), em seguida


2.6 Considerações Finais 29

é realizado o pré-processamento das imagens faciais para a remoção de rúıdos e imperfeições. Na

segunda etapa, são extráıdos os vetores de caracteŕısticas da imagem facial (análise da imagem)

e faz-se uma seleção dessas caracteŕısticas. Por último é feita a classificação.

Entre os métodos de reconhecimento de faces convencionais, foram estudados dois métodos

hoĺısticos: Eigenface e Fisherface. O Eigenface utiliza a técnica da Análise de Componentes

Principais (PCA) para extrair as caracteŕısticas da imagem facial e reduzir a dimensionalidade

do conjunto de faces, preservando a variação do mesmo. O método Fisherface, assim com o

Eigenface, baseia-se na redução da dimensão do espaço de caracteŕısticas, mas utiliza como

técnica principal, a Análise de Discriminante Linear (LDA). Este método busca maximizar a

dispersão entre as classes de imagens e paralelamente, busca minimizar a dispersão dentro de

cada classe.

No próximo caṕıtulo, é analizado o método Fisherface Fuzzy, que é a complementação do

método Fisherface com graus de pertinência fuzzy. São estudados o método, suas principais

caracteŕısticas e funções de pertinência fuzzy.


Caṕıtulo

3

Estudo do Método Fisherface Fuzzy e das

Funções de Pertinência

3.1 Introdução

Neste caṕıtulo serão tratados os detalhes do método Fisherface Fuzzy para o reconhecimento

de faces.

Para identificar faces, foi visto que existem diversos fatores que influenciam na performance

do reconhecimento, como iluminação, variação de posição, expressões e detalhes faciais. A fim de

driblar estes fatores e melhorar as taxas de reconhecimento, diversos pesquisadores começaram

a modelar e criar novas estratégias para tornar os métodos já conhecidos, mais eficientes. Em

1985, Keller et al. [20] propõem a utilização do algoritmo dos k-vizinhos mais Próximos Fuzzy

para melhorar o método de classificação de padrões. A partir dessa nova ideia, em 2005 foi

desenvolvido o método Fisherface Fuzzy.

Nas próximas seções, são desenvolvidos as técnicas utilizadas no método Fisherface Fuzzy e

estudados alguns tipos de função de pertinência fuzzy.

3.2 Algoritmo dos k-vizinhos mais próximos (KNN)

O algoritmo dos k-vizinhos mais próximos (KNN - K-Nearest Neighbours) é utilizado em

problemas de classificação para obter resultados mais eficientes. Esta eficiência na classificação

30


3.3 Lógica Fuzzy 31

depende da dimensionalidade e complexidade dos dados.

Dado um padrão de teste x (desconhecido), a classificação é feita da seguinte maneira:

1. Calcula-se a distância entre x e todos os padrões de treinamento.

2. Verifica-se a quais classes pertencem os k padrões mais próximos;

3. A classificação é realizada associando-se o padrão de teste à classe que for mais frequente

entre os k padrões mais próximos de x.

Quando as caracteŕısticas são numéricas (como é o nosso caso), no item (1) utiliza-se a

distância Euclidiana.

Definição 3.1 (Distância Euclidiana). A distância euclidiana entre dois vetores x =

(x1, x2, ..., xn) e y = (y1, y2, ..., yn) é definida por:

dE(x, y) = ||x− y|| =
√

(x− y)T (x− y). (3.1)

A principal vantagem desse método é que ele cria uma superf́ıcie de decisão que se adapta à

forma de distribuição dos dados de treinamento de maneira detalhada, possibilitando a obtenção

de boas taxas de acerto quando o conjunto de treinamento é grande.

Utilizando k > 1, reduz-se a ocorrência de erros causados por rúıdos nos padrões de

treinamento. Entretanto, o uso de valores grandes em k pode reduzir a qualidade dos resultados

de classificação quando a distribuição das classes possuir muitas sobreposições [37].

Geralmente, o algoritmo KNN apresenta bons resultados na classificação de padrões,

entretanto, ele apresenta alguns problemas, como por exemplo, a performance do KNN depende

da escolha do número de vizinhos (k). Para um caso prático, não há uma regra para realizar

essa escolha, a estratégia mais recomendada é a de tentativa e erro. Através de inúmeros

testes realizados e com o objetivo de determinar um padrão para a escolha do número de k

vizinhos mais próximos, neste trabalho, a quantidade de vizinhos (k > 1) foi escolhida através

da seguinte relação:

1 < k ≤ c, (3.2)

sendo c o número de classes do problema.


3.3 Lógica Fuzzy 32

3.3 Lógica Fuzzy

A lógica Fuzzy, também conhecida como lógica nebulosa ou lógica difusa, representa um

esquema de traduzir informações vagas, imprecisas em valores numéricos [5]. A palavra “fuzzy”

é de origem inglesa e significa incerto, vago, impreciso, subjetivo, nebuloso, difuso, entre outras.

A lógica convencional lida com problemas assumindo sempre verdadeiro ou falso, mas as vezes,

esta forma de modelagem de problemas não é suficiente, portanto necessita-se a solução de

problemas com valores intermediários. A fim de ajudar a solucionar esses problemas, surgiu a

lógica fuzzy.

A Teoria dos Conjuntos “Fuzzy” foi proposta pelo matemático Lotfi Asker Zadeh no artigo

“Fuzzy Sets”publicado em 1965 [43], com a principal intenção de dar um tratamento matemático

a certos termos lingúısticos subjetivos, como “aproximadamente”, “em torno de”, dentre outros

[6]. Esta lógica considera os elementos pertencentes a um determinado conjunto com um certo

grau de pertinência. Enquanto que na lógica tradicional, um elemento pertence ou não a um

determinado conjunto, isto é, tem valores de pertinência 0 ou 1, na lógica fuzzy, um dado

elemento pode pertencer a um conjunto com grau de pertinência em um intervalo de 0 a 1.

Para formalizar matematicamente um conjunto fuzzy, Zadeh baseou-se no fato de que

qualquer conjunto clássico pode ser caracterizado por uma função: sua função caracteŕıstica.

Definição 3.2 (Função Caracteŕıstica). Seja U um conjunto e A um subconjunto de U. A

função caracteŕıstica de A é dada por:

χA(x) =

 1, se x ∈ A

0, se x /∈ A.
(3.3)

Assim, χA é uma função cujo domı́nio é U e a imagem está contida no conjunto {0, 1},

onde χA(x) = 1 significa que o elemento x está em A, enquanto χA(x) = 0 indica que x não

é elemento de A. Portanto, a função caracteŕıstica descreve completamente o conjunto A já

que tal função indica quais elementos do conjunto universo U são elementos também de A.

Entretanto, existem casos em que a função de pertinência entre elementos e conjuntos não é

precisa, ou seja, não se sabe se um elemento pertence efetivamente a um conjunto ou não.

Nestes casos, o recomendado é dizer qual elemento do conjunto universo se enquadra “melhor”

ao termo que caracteriza o subconjunto.

A seguir, são definidos os conceitos da Lógica Fuzzy utilizados neste trabalho.


3.4 Funções de Pertinência Fuzzy 33

Definição 3.3 (Função de Pertinência Fuzzy). Seja U um conjunto universo. Um subconjunto

fuzzy F de U é caracterizado pela função:

µF : U → [0, 1], (3.4)

pré-fixada, chamada função de pertinência do subconjunto fuzzy F .

O valor da função µF (x) ∈ [0, 1] indica o grau com que o elemento x de U está no conjunto

fuzzy F . µF (x) = 0 e µF (x) = 1 significam, respectivamente, a não pertinência e a pertinência

completa de x ao conjunto fuzzy F . Do ponto de vista formal, a definição de subconjunto fuzzy

foi obtida ampliando-se o contra-domı́nio da função caracteŕıstica, que é o conjunto {0, 1}, para

o intervalo [0, 1]. Neste contexto, conclúımos que um conjunto universo (clássico) é um caso

particular de um conjunto fuzzy, cuja função de pertinência µF é uma função caracteŕıstica χF

[6].

Definição 3.4 (Subconjunto Crisp). Um subconjunto universo (clássico), na linguagem fuzzy,

é denominado subconjunto crisp.

Um subconjunto fuzzy F é composto de elementos de x de um conjunto universo U , providos

de um valor de pertinência à F , dado por µF (x). Assim:

F = {(µF (x) \ x), com x ∈ U}. (3.5)

onde µF (x) representa o grau de pertinência de x em F .

A figura (3.1) ilustra a diferença entre os conjuntos fuzzy e crisp. Nota-se que o conjunto

crisp (ćırculo) determina somente se os elementos (pontos) pertencem ou não ao conjunto, já

o conjunto fuzzy indica quantitativamente, no intervalo [0, 1] o quanto cada elemento pertence

ao conjunto, este ı́ndice é o grau de pertinência (escala de cinza).

Figura 3.1: Ilustração da diferença entre os conjuntos fuzzy e crisp.


3.4 Funções de Pertinência Fuzzy 34

3.4 Funções de Pertinência Fuzzy

As funções de pertinência são usadas para calcular o grau que uma determinada variável

pertence ou não ao conjunto relacionado. Elas podem ter forma padrão, ou podem ser definidas

de acordo com o problema, desde que sejam estabelecidas suas propriedades. A escolha de qual

função usar é feita normalmente de forma emṕırica, analisando casos passados semelhantes e

vendo qual obteve melhor resultado [32].

Existem diversos tipos de funções de pertinência fuzzy que são utilizadas em problemas de

modelagem matemática. O formato do conjunto fuzzy é definido de acordo com a função de

pertinência utilizada. As funções mais utilizadas são a trapezoidal, a triangular e a gaussiana.

A função trapezoidal apresenta como caracteŕısticas o rápido processamento e a presença

de descontinuidades. Sua forma é ilustrada na figura (3.2). A equação deste tipo de função de

pertinência é da forma:

µ(x) =



0, se x ≤ a

1− (b− x)/(b− a), se a < x ≤ b

1, se b < x ≤ c

(d− x)/(d− c), se c < x ≤ d

0, se x > d.

(3.6)

Figura 3.2: Função de Pertinência do tipo Trapezoidal.

A função de pertinência do tipo triangular é muito semelhante à função trapezoidal,

entretamento, não apresenta descontinuidades na mudança de crescimento da função (veja

figura (3.3)). Sua função de pertinência é da forma:


3.4 Funções de Pertinência Fuzzy 35

µ(x) =



0, se x ≤ a

1− (b− x)/(b− a), se a < x ≤ b

(c− x)/(c− b), se b < x ≤ c

0, se x > c.

(3.7)

Figura 3.3: Função de Pertinência do tipo Triangular.

A função do tipo Gaussiano, tem como caracteŕıstica a distribuição normal, isto é, resultados

muito maiores ou muito menores em relação à média tendem a zero (observe o gráfico na figura

(3.4)). Sua função é representada abaixo, onde x é a média e σ é o desvio padrão.

µ(x) = e−
(x−x)2

σ2 . (3.8)

Figura 3.4: Função de Pertinência do tipo Gaussiano.

A seguir, é apresentado o método Fisherface Fuzzy, cujo alicerce principal está na definição


3.5 Abordagem do Método Fisherface Fuzzy 36

de uma função de pertinência fuzzy. São estudados alguns tipos de funções que podem ser

utilizadas no método, afim de torná-lo mais eficaz no reconhecimento de faces.

3.5 Abordagem do Método Fisherface Fuzzy

Esta seção tem como principal objetivo apresentar o método Fisherface Fuzzy para o

reconhecimento de faces.

Sabe-se que o método já bem conhecido Fisherface é muito utilizado no reconhecimento de

faces, no entanto, assim como outros métodos, apresenta problemas no reconhecimento quando

há fatores que podem influenciar as faces, tais como iluminação, diferentes poses e expressões

faciais, utilização de acessórios como óculos, chapéu, ou ainda, quando homens estão com bigode

ou não. Isto ocorre, tanto na Análise de Componentes Principais (PCA), quanto na Análise

de Discriminante Linear (LDA). Foi visto também, que os conjuntos fuzzy têm a vantagem dos

graus de pertinência serem espećıficos (sempre estão no intervalo de 0 a 1), ao invés de serem

somente 0 ou 1, este fato pode ser vantajoso especificamente em reconhecimento de padrões,

onde frequentemente objetos não pertencem claramente à uma classe ou outra [20].

A ideia geral do método Fisherface Fuzzy é “sofisticar” a classificação utilizando graus de

pertinência fuzzy, de modo a afetar as matrizes de dispersão interclasse e intraclasse fuzzy e

melhorar a performance do classificador. Para isso, define-se uma função de pertinência, que

gera uma matriz formada por graus de pertinência (chamada de matriz de partição fuzzy)

juntamente com a regra dos k-vizinhos mais próximos (KNN).

Matematicamente, dado um conjunto X de imagens de faces transformadas pela PCA; uma

partição “c-classes” fuzzy destes vetores especifica o grau de pertinência de cada vetor à cada

classe Ci. Denota-se a matriz de partição fuzzy por U = [µij], onde i = 1, 2, ..., C, j = 1, 2, ..., N

e µij é o grau de pertinência da imagem Zij na classe Ci.

Como U é partição fuzzy, então satisfaz as propriedades matemáticas:

C∑
i=1

µij = 1; (3.9)

ou seja, a soma dos graus de pertinência de uma imagem em todas as classes deve ser igual a

um. Além disso:


3.5 Abordagem do Método Fisherface Fuzzy 37

0 <
N∑
j=1

µij < N e µij ∈ [0, 1]; (3.10)

ou seja, a soma dos graus de pertinência de todas as imagens de uma classe deve ser menor que

o número de imagens de faces existentes em todo o conjunto.

Por exemplo, consideremos o conjunto X = {x1, x2, x3} tal que:

 A1 ⇒ 0, 6/x1 1/x2 0, 1/x3

A2 ⇒ 0, 4/x1 0/x2 0, 9/x3
(3.11)

Note que,


0, 6 + 0, 4 = 1

1 + 0 = 1

0, 1 + 0, 9 = 1

(3.12)

o que satisfaz (3.9), e que:

 0, 6 + 1 + 0, 1 = 1, 7 < 3

0, 4 + 0 + 0, 9 = 1, 3 < 3
(3.13)

o que satisfaz (3.10). Portanto, U =

 A1

A2

 é uma matriz de partição fuzzy.

Os cálculos dos graus de pertinência fuzzy são realizados através da seguinte sequência de

passos [21]:

• Passo 1: Calcular a matriz da distância euclidiana entre os pares de vetores

caracteŕısticas do conjunto de treinamento;

• Passo 2: Atribuir infinito em todos os elementos da diagonal principal desta matriz;

• Passo 3: (i) Ordenar a matriz da distância (tratar cada uma de suas colunas

separadamente) em ordem crescente. (ii) Coletar o rótulo das classes correspondentes

do dado localizado mais próximo da vizinhança do dado em consideração (o que gera

uma lista de k inteiros);

• Passo 4: Calcular o grau de pertinência das classes i para o j-ésimo dado usando uma

função de pertinência fuzzy.


3.5 Abordagem do Método Fisherface Fuzzy 38

Após o cálculo dos graus de pertinência, prossegue-se com o método Fisherface Fuzzy. A

diferença fundamental entre este método e o Fisherface convencional, está na utilização dos

graus de pertinência no cálculo da face média de cada classe Ci. Assim, a face média (µ̃i) da

classe Ci é definida por:

µ̃i =

∑N
j=1 µijZij∑N
j=1 µij

, (3.14)

onde i = 1, 2, ..., r. A matriz de dispersão interclasse fuzzy SFB incorporadas com os valores de

pertinência em seus cálculos é redefinida da seguinte forma:

SFB =
r∑

i=1

Ni(µ̃i − µ)(µ̃i − µ)T , (3.15)

onde Ni é o número de faces pertencentes a cada umas das r classes pré determinadas e µ é a

média total das faces.

Da mesma forma, a matriz de dispersão intraclasse fuzzy SFW é redefinida por:

SFW =
r∑

i=1

Ci∑
j=1

(Zij − µ̃i)(Zij − µ̃i)
T =

r∑
i=1

SFWi
, (3.16)

onde SFWi
é a matriz de covariância fuzzy da classe Ci.

A projeção ótima fuzzy (WF−otima) é dada por:

WF−otima = arg max︸ ︷︷ ︸
W

|W T · SFB ·W |
|W T · SFW ·W |

, (3.17)

onde {Wi|i = 1, 2, ...,M} é o conjunto generalizado de autovetores de SFB e SFW correspondente

aos M maiores autovalores {λi|i = 1, 2, ...,M}.

A partir da projeção ótima fuzzy (WF−otima) é realizado o procedimento de classificação das

imagens testes, da mesma forma que foi descrito da seção (2.5.5).

A figura (3.5) ilustra o diagrama de blocos do funcionamento do método Fisherface Fuzzy.

3.5.1 Modelo Proposto

Como foi obvervado na seção anterior, para o cálculo dos graus de pertinência fuzzy, utiliza-se

a sequência de passos descrita por Kwak e Pedrycz [21], o qual no passo 4, associa-se uma

função de pertinência fuzzy. Na seção (3.4), foi visto que existem diversos tipos de função de


3.5 Abordagem do Método Fisherface Fuzzy 39

Figura 3.5: Diagrama de Funcionamento do Método Fisherface Fuzzy.


3.5 Abordagem do Método Fisherface Fuzzy 40

pertinência fuzzy e que para cada tipo de problema, utiliza-se uma função diferente, ou seja,

escolhe-se uma função que se adapta melhor ao problema. Portanto, a escolha de tal função é

um requisito importante no desempenho do método.

Em diversos estudos [21], [42] e [17], foi utilizada a mesma função de pertinência para o

método Fisherface Fuzzy, essa função, proposta por Keller et al. [20], em 1985, é expressa por:

µij =

 0, 51 + 0, 49(nij/k), se i = j

0, 49(nij/k), se i 6= j
(3.18)

onde k é o número de vizinhos e nij representa o número de vizinhos do j-ésimo dado que

pertence à i-ésima classe.

Observando a função de pertinência fuzzy (3.18), nota-se que ela apresenta parâmetros fixos

(0, 51 e 0, 49), porém, não foi feita nenhuma explanação de como foram obtidos ou escolhidos

estes valores. Na prática, existem diversos fatores que influenciam a classificação de faces,

além disso, as bases de dados apresentam caracteŕısticas distintas com o objetivo de simular

a realidade, tais como, quantidade diferente de imagens, as imagens são pré classificadas em

quantidades distintas de classes e etc., logo esses parâmetros fixos, podem não ser eficientes

em alguns casos. Portanto, procura-se novas propostas de funções de pertinência fuzzy que

apresentam parâmetros que levam em consideração caracteŕısticas das bases de dados em estudo.

Estudos mais recentes propõem a utilização de outras funções de pertinência fuzzy no

reconhecimento de faces. Song et al., propõem em seu trabalho, publicado em 2010 uma técnica

diferente de reconhecimento facial, intitulada A complete fuzzy discriminant analysis [36]. Sem

levar em consideração sua teoria e considerando somente a função de pertinência utilizada pelos

autores, Song et al. [36] propõem a utilização de uma outra função de pertinência (3.18) para

calcular a matriz de pertinência fuzzy. Essa função é definida por:

µij =

 α + (1− α)(nij/k), se i = j

(1− α)(nij/k), se i 6= j
(3.19)

onde k é o número de vizinhos, nij representa o número de vizinhos do j-ésimo dado que pertence

à i-ésima classe e

α =
N − C
2mN

, (3.20)


3.5 Abordagem do Método Fisherface Fuzzy 41

onde m e α são parâmetros que tem a finalidade de controlar os valores de µij, m ∈ (0, 1) e

α ∈ (0, 1), além disso, N é o número de imagens do conjunto e C o número de classes.

Observando a função de pertinência fuzzy (3.19) proposta por Song et al. [36], nota-se que

ela apresenta parâmetros mais gerais e espećıficos para cada base de dados em estudo. Para o

cálculo do parâmetro α, leva-se em consideração a quantidade de imagens da base de dados e a

quantidade de classes do problema. No entanto, apresenta um parâmetro m variável e aleatório,

pois a única informação que tem-se, é que o mesmo deve controlar os valores de µij e estar entre

o intervalo 0 e 1.

A proposta deste trabalho de pesquisa é encontrar uma função de pertinência fuzzy que

apresenta somente parâmetros gerais e espećıficos para cada base de dados, com a finalidade

de ser eficiente no reconhecimento de faces. Partindo deste prinćıpio, procurou-se determinar

parâmetros que são essenciais e importantes no método Fisherface Fuzzy, a tabela (3.1) descreve

alguns desses parâmetros.

Tabela 3.1: Parâmetros importantes do método Fisherface Fuzzy para o reconhecimento de faces.
Parâmetro Descrição

N Número de imagens da base de dados.
C Número de classes pré determinadas.

Nic Número de imagens por classe.
Nit Número de imagens de treinamento.
Cit Conjunto de imagens teste.
k Número de vizinhos mais próximos.

Através de inúmeros testes, observou-se que a quantidade de imagens do conjunto de

treinamento é um fator importante para o método. Utilizando a mesma ideia da função (3.19),

foi proposta a definição da seguinte função de pertinência:

µij =

 α + (1− α)(nij/k), se i = j

(1− α)(nij/k), se i 6= j
(3.21)

onde nij representa o número de vizinhos do j-ésimo dado que pertence à i-ésima classe e

α = 0, 5 + 0, 25/(Nit)i, (3.22)

onde α ∈ (0, 1) e (Nit)i é o número de imagens de treinamento por classe para i = 1, 2, ..., r.

A justificativa da escolha de tal função e os testes com todas as funções de pertinência fuzzy


3.5 Abordagem do Método Fisherface Fuzzy 42

descritas nesta seção, encontram-se no próximo caṕıtulo.

3.5.2 Exemplo - Cálculo das matrizes de dispersão interclasse e intraclasse

Fuzzy

Para exemplificar o cálculo das matrizes de dispersão interclasse e intraclasse fuzzy, considere o

exemplo adaptado de Kwak e Pedrycz [21]. Neste exemplo, o conjunto é formado por 9 dados

bidimensionais pertencentes a três classes, mostrados na tabela (3.2).

Tabela 3.2: Exemplo de Conjunto de Dados.
Número Caracteŕıstica 1 Caracteŕıstica 2 Classe

1 0,2 0,3 1
2 0,3 0,2 1
3 0,4 0,3 1
4 0,5 0,5 2
5 0,6 0,4 2
6 0,5 0,6 2
7 0,7 0,3 3
8 0,8 0,4 3
9 0,7 0,5 3

Primeiramente, calcula-se os graus de pertinência através da sequência de passos descritas

na seção (3.5). Pelo Passo 1, calcula-se a matriz de distância euclidiana entre os pares de dados

[ver tabela (3.3)]. No passo 2, os elementos da diagonal principal (nulos) são substitúıdos por

infinito (∞) [ver tabela (3.4)]. No passo 3, inicialmente, ordena-se os dados de cada coluna

em ordem crescente [ver tabela (3.5)].

Tabela 3.3: Descrição do Passo 1.
Número 1 2 3 4 5 6 7 8 9

1 0 0,1414 0,2000 0,3606 0,4123 0,4243 0,5000 0,6083 0,5385

2 0,1414 0 0,1414 0,3606 0,3606 0,4472 0,4123 0,5385 0,5000

3 0,2000 0,1414 0 0,2236 0,2236 0,3162 0,3000 0,4123 0,3606

4 0,3606 0,3606 0,2236 0 0,1414 0,1000 0,2828 0,3162 0,2000

5 0,4123 0,3606 0,2236 0,1414 0 0,2236 0,1414 0,2000 0,1414

6 0,4243 0,4472 0,3162 0,1000 0,2236 0 0,3606 0,3606 0,2236

7 0,5000 0,4123 0,3000 0,2828 0,1414 0,3606 0 0,1414 0,2000

8 0,6083 0,5385 0,4123 0,3162 0,2000 0,3606 0,1414 0 0,1414

9 0,5385 0,5000 0,3606 0,2000 0,1414 0,2236 0,2000 0,1414 0

Para o passo 3, determina-se a quantidade de k vizinhos mais próximos utilizada na análise


3.5 Abordagem do Método Fisherface Fuzzy 43

Tabela 3.4: Descrição do Passo 2.
Número 1 2 3 4 5 6 7 8 9

1 ∞ 0,1414 0,2000 0,3606 0,4123 0,4243 0,5000 0,6083 0,5385
2 0,1414 ∞ 0,1414 0,3606 0,3606 0,4472 0,4123 0,5385 0,5000
3 0,2000 0,1414 ∞ 0,2236 0,2236 0,3162 0,3000 0,4123 0,3606
4 0,3606 0,3606 0,2236 ∞ 0,1414 0,1000 0,2828 0,3162 0,2000
5 0,4123 0,3606 0,2236 0,1414 ∞ 0,2236 0,1414 0,2000 0,1414
6 0,4243 0,4472 0,3162 0,1000 0,2236 ∞ 0,3606 0,3606 0,2236
7 0,5000 0,4123 0,3000 0,2828 0,1414 0,3606 ∞ 0,1414 0,2000
8 0,6083 0,5385 0,4123 0,3162 0,2000 0,3606 0,1414 ∞ 0,1414
9 0,5385 0,5000 0,3606 0,2000 0,1414 0,2236 0,2000 0,1414 ∞

Tabela 3.5: Descrição do Passo 3 - Primeira Parte.
Número 1 2 3 4 5 6 7 8 9

1 0,1414 0,1414 0,1414 0,1000 0,1414 0,1000 0,1414 0,1414 0,1414
2 0,2000 0,1414 0,2000 0,1414 0,1414 0,2236 0,1414 0,1414 0,1414
3 0,3606 0,3606 0,2236 0,2000 0,1414 0,2236 0,2000 0,2000 0,2000
4 0,4123 0,3606 0,2236 0,2236 0,2000 0,3162 0,2828 0,3162 0,2000
5 0,4243 0,4123 0,3000 0,2828 0,2236 0,3606 0,3000 0,3606 0,2236
6 0,5000 0,4472 0,3162 0,3162 0,2236 0,3606 0,3606 0,4123 0,3606
7 0,5385 0,5000 0,3606 0,3606 0,3606 0,4243 0,4123 0,5385 0,5000
8 0,6083 0,5385 0,4123 0,3606 0,4123 0,4472 0,5000 0,6083 0,5383
9 ∞ ∞ ∞ ∞ ∞ ∞ ∞ ∞ ∞

dos dados. Neste exemplo, considera-se 3 vizinhos (k = 3), pois como têm-se 3 classes, pela

relação (3.2), deve-se escolher entre 1 < k ≤ 3. Logo, os ı́ndices associados com cada valor da

distância dão origem à tabela (3.6).

Tabela 3.6: Descrição do Passo 3 - Segunda Parte.
k=1 ⇒ 2 1 2 6 4 4 5 9 5
k=2 ⇒ 3 3 1 5 9 5 8 7 8
k=3 ⇒ 4 4 5 9 7 9 9 5 4

Tem-se que os dados são pré classificados, ou seja, os dados 1, 2, 3 estão na classe 1; 4, 5, 6

estão na classe 2 e 7, 8, 9 estão na classe 3. Portanto, os dados da tabela (3.6) estão nas classes

mostradas na tabela (3.7).

Tabela 3.7: Classe dos dados da tabela (3.6).

k=1 ⇒ 1 1 1 2 2 2 2 3 2
k=2 ⇒ 1 1 1 2 3 2 3 3 3
k=3 ⇒ 2 2 2 3 3 3 3 2 2


3.5 Abordagem do Método Fisherface Fuzzy 44

Cada coluna da tabela (3.7) representa os vizinhos mais próximos do dado, por exemplo, a

terceira coluna representa os vizinhos mais próximos do dado 3. Logo, o número das classes

mais frenquentes para cada dado, é representado na tabela (3.8).

Tabela 3.8: Número de vizinhos do j-ésimo dado que pertence a i-ésima classe (nij).

Classe / Dado 1 2 3 4 5 6 7 8 9

Classe 1 2 2 2 0 0 0 0 0 0
Classe 2 1 1 1 2 1 2 1 1 2
Classe 3 0 0 0 1 2 1 2 2 1

No passo 4, calcula-se os graus de pertinência fuzzy, para isto, utiliza-se uma função de

pertinência. Neste trabalho, estudou-se três funções de pertinência, logo, para o passo 4 foram

considerados três casos, calculando três matrizes dos graus de pertinência fuzzy.

Caso 1. Considera-se a função de pertinência (3.18) proposta por Keller et al. [20]. Por

exemplo, para calcular os graus de pertinência do 4o dado do conjunto (que está rotulado a

pertencer à classe 2), têm-se:

(1) classe 1 6= atribúıdo à classe 2

0, 49(nij/k) = 0, 49(0/3) = 0.

(2) classe 2 = atribúıdo à classe 2

0, 51 + 0, 49(nij/k) = 0, 51 + 0, 49(2/3) = 0, 8367.

(3) classe 3 6= atribúıdo à classe 2

0, 49(nij/k) = 0, 49(1/3) = 0, 1633.

Portanto, a matriz U dos graus de pertinência fuzzy é:


3.5 Abordagem do Método Fisherface Fuzzy 45

U = [µij] =


0, 8367 0, 8367 0, 8367 0 0 0 0 0 0

0, 1633 0, 1633 0, 1633 0,8367 0, 6733 0, 8367 0, 1633 0, 1633 0, 3267

0 0 0 0,1633 0, 3267 0, 1633 0, 8367 0, 8367 0, 6733


(3.23)

Os vetores médios são:

µ̃1 =

 0, 3000

0, 2667

 , µ̃2 =

 0, 5333

0, 4579

 e µ̃3 =

 0, 6952

0, 4109

 . (3.24)

Logo, as matrizes de dispersão intraclasse e interclasse fuzzy são, respectivamente:

SFW =

 0, 0126 −0, 0037

−0, 0037 0, 0174

 e SFB =

 0, 1592 0, 1017

0, 1017 0, 0833

 . (3.25)

Caso 2. Considera-se a função de pertinência (3.19) proposta por Song et al. [36] . Neste

exemplo, têm-se 9 dados bidimensionais subdivididos em 3 classses, logo N = 9 e C = 3. Além

disso, considera-se m = 0, 3 (m ∈ (0, 1)), logo:

α =
N − C
2m ·N

=
9− 3

20,3 · 9
= 0, 54. (3.26)

Portanto, a função será:

µij =

 0, 54 + 0, 46(nij/k), se i = j

0, 46(nij/k), se i 6= j.
(3.27)

Por exemplo, para calcular os graus de pertinência do 3o dado do conjunto (que está rotulado

a pertencer à classe 1), têm-se:

(1) classe 1 = atribúıdo à classe 1

0, 54 + 0, 46(nij/k) = 0, 54 + 0, 46(2/3) = 0, 8467.

(2) classe 2 6= atribúıdo à classe 1

0, 46(nij/k) = 0, 46(1/3) = 0, 1533.


3.5 Abordagem do Método Fisherface Fuzzy 46

(3) classe 3 6= atribúıdo à classe 1

0, 46(nij/k) = 0, 46(0/3) = 0.

Portanto, a matriz U dos graus de pertinência fuzzy é:

U = [µij] =


0, 8467 0, 8467 0,8467 0 0 0 0 0 0

0, 1533 0, 1533 0,1533 0, 8467 0, 6933 0, 8467 0, 1533 0, 1533 0, 3067

0 0 0 0, 1533 0, 3067 0, 1533 0, 8467 0, 8467 0, 6933


(3.28)

Os vetores médios são:

µ̃1 =

 0, 3000

0, 2667

 , µ̃2 =

 0, 5333

0, 4601

 e µ̃3 =

 0, 6976

0, 4102

 . (3.29)

Logo, as matrizes de dispersão intraclasse e interclasse fuzzy são, respectivamente:

SFW =

 0, 0124 −0, 0037

−0, 0037 0, 0173

 e SFB =

 0, 1591 0, 1016

0, 1016 0, 0833

 . (3.30)

Caso 3. Utilizando-se a função de pertinência (3.21). Neste exemplo, sabe-se que o número de

imagens por classe é 3, além disso, as imagens que serão treinadas (Nit)i estão numa mesma

classe, logo, considera-se (Nit)i = 2 (1 < (Nit)i < 3). Assim, α é definido por:

α = 0, 5 + 0, 25/(Nit)i = 0, 5 + 0, 25/2 = 0, 625. (3.31)

Portanto, a função é:

µij =

 0, 625 + 0, 375(nij/k), se i = j

0, 375(nij/k), se i 6= j.
(3.32)

Por exemplo, para calcular os graus de pertinência do 8o dado do conjunto (que está rotulado

a pertencer à classe 3), têm-se:


3.6 Considerações Finais 47

(1) classe 1 6= atribúıdo à classe 3

0, 375(nij/k) = 0, 375(0/3) = 0.

(2) classe 2 6= atribúıdo à classe 3

0, 375(nij/k) = 0, 375(1/3) = 0, 1250.

(3) classe 3 6= atribúıdo à classe 3

0, 625 + 0, 375(nij/k) = 0, 625 + 0, 375(2/3) = 0, 8750.

Portanto, a matriz U dos graus de pertinência fuzzy é:

U = [µij] =


0, 8750 0, 8750 0, 8750 0 0 0 0 0 0

0, 1250 0, 1250 0, 1250 0, 8750 0, 7500 0, 8750 0, 1250 0,1250 0, 2500

0 0 0 0, 1250 0, 2500 0, 1250 0, 8750 0,8750 0, 7500


(3.33)

Os vetores médios são:

µ̃1 =

 0, 3000

0, 2667

 , µ̃2 =

 0, 5333

0, 4667

 e µ̃3 =

 0, 7042

0, 4083

 . (3.34)

Logo, as matrizes de dispersão intraclasse e interclasse fuzzy serão, respectivamente:

SFW =

 0, 0120 −0, 0036

−0, 0036 0, 0167

 e SFB =

 0, 1583 0, 1012

0, 1012 0, 0830

 . (3.35)

De modo geral, nota-se pouca variação das matrizes de dispersão interclasse e intraclasse

quando se alteram as funções de pertinência; entretanto, esta variação é significativa e influencia

a performance do método Fisherface Fuzzy para o reconhecimento de faces.


3.6 Considerações Finais 48

3.6 Considerações Finais

Neste caṕıtulo, foi apresentada a metodologia utilizada neste trabalho para o reconhecimento

de faces, chamado de método Fisherface Fuzzy. Foi visto que o método é constitúıdo a partir

da técnica convencional Fisherface acrescida do algoritmo dos k-vizinhos mais próximos, onde

através deste, calcula-se os graus de pertinência fuzzy que auxiliam o desempenho do método.

Em seguida, foram apresentados alguns resultados utilizando-se as funções de pertinência

fuzzy propostas por Keller et al. [20], Song et al. [36] e foi definida uma nova função.

No próximo caṕıtulo, são apresentadas as implementações dos modelos abordados neste

trabalho. São apresentadas as bases de dados utilizadas para os testes realizados e seus

respectivos resultados.


Caṕıtulo

4

Implementação dos Algoritmos, Testes e

Resultados

4.1 Introdução

O reconhecimento de faces busca desenvolver algoritmos matemáticos que autentifi-

cam/identificam faces. Inicialmente, extrai-se as caracteŕısticas importantes para o

reconhecimento da face e encaminha a busca na base de dados. Cada algoritmo possui

vantagens e desvantagens (deficiências), e alguns são mais eficientes para determinadas classes

de problemas.

O objetivo desse caṕıtulo é mostrar as implementações num ambiente computacional dos

modelos de reconhecimento facial abordados neste trabalho, com a finalidade de analisar o

comportamento em relação à performance dos métodos e suas taxas de reconhecimento.

4.2 Modelo Avaliado

A intenção deste trabalho é avaliar o desempenho do método Fisherface Fuzzy (alterando suas

funções de pertinência) em relação ao método Fisherface para o reconhecimento de faces. O

modelo extrai as caracteŕısticas de uma imagem facial e determina a qual classe esse indiv́ıduo

pertence na base de dados.

O diagrama (4.1) ilustra o modelo detalhado do método Fisherface e Fisherface Fuzzy para

49


4.2 Modelo Avaliado 50

a fase de treinamento. Na etapa inicial, constrói-se o subespaço PCA e posteriormente o

subespaço LDA baseados nas amostras de treinamento. Para a construção do subespaço LDA,

considera-se os graus de pertinência fuzzy, que são obtidos através da técnica de k-vizinhos mais

próximos e de uma função de pertinência.

Nos cálculos relacionados à construção do subespaço PCA e LDA, calcula-se os autovetores

e autovalores da matriz de covariância dos dados de entrada. Esses autovetores são ordenados a

partir dos maiores autovalores associados e em seguida é feita a projeção das imagens faciais no

novo espaço gerado (reduzindo a dimensão do espaço inicial). Pentland et al. [30] demonstrou

empiricamente que os resultados de reconhecimento de faces são superiores quando os três

primeiros autovetores não são usados para a construção do subespaço PCA, visto que os três

primeiros autovetores estão relacionados a mudanças de iluminação. Foi demonstrado em 1998,

por Moon et al. [25], que a eliminação de mais de três autovetores, em geral, produz piores

resultados.


4.2 Modelo Avaliado 51

Figura 4.1: Diagrama detalhado do modelo avaliado - Fase de treinamento.


4.3 Implementação dos Algoritmos 52

4.3 Implementação dos Algoritmos

Todos os algoritmos envolvem três partes:

1. Leitura das imagens de faces na base;

2. Aplicação do Método;

3. Cálculo da taxa de reconhecimento.

4.3.1 Algoritmo do método Fisherface

O algoritmo do método Fisherface foi programado no Matlab da seguinte forma:

1. Inicialmente, define-se o valor de três variáveis: o número de imagens do conjunto de

treinamento para cada classe (o restante das imagens de cada classe formarão o conjunto

de imagens testes), a dimensão do subespaço PCA (dPCA) e a dimensão do subespaço

LDA (dLDA), observando que dLDA ≤ dPCA;

2. As imagens são redimensionadas para 32× 32 pixels (pré-processamento);

3. As imagens são agrupadas em classes de acordo com a base de dados uti