Classificação semi-supervisionada com aproximações de campo médio
Carregando...
Data
Autores
Orientador
Breve, Fabricio Aparecido 

Coorientador
Pós-graduação
Curso de graduação
Física - IGCE
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Baseado em trabalhos recentes (WANG et al., 2007; LI; WANG, 2016), é proposto um novo método de aprendizado semi-supervisionado mapeando os pontos de um conjunto de dados em um modelo Ising não homogêneo na presença de um campo externo produzido pelos pontos previamente classificados. A classificação de um ponto é então obtida através do sinal do valor médio do spin associado ao mesmo. Essas médias são obtidas a partir de uma aproximação de campo médio conhecida como expansão de Plefka, de forma que obtem-se uma classe de algoritmos semi-supervisionados, cada um correspondente a uma expansão em série de Taylor de uma energia livre. É construído um diagrama de fases desses algoritmos em função de dois hiperparâmetros e verifica-se que o desempenho optimal ocorre numa fase parcialmente ordenada chamada de superparamagnética. Com base nesse resultado, é mostrado como obter classificações com boa precisão em uma região do espaço de hiperparâmetros. Quando comparado a outros métodos baseados em grafos, o método tem desempenho intermediário em três dos quatro conjuntos de dados utilizados e apresenta a melhor eficácia para o outro. Além disso, a abordagem proposta tem bom desempenho computacional, principalmente por ser mais rápida na região de resultado optimal.
Resumo (inglês)
Inspired by recent work (WANG et al., 2007; LI; WANG, 2016), a new method of semi-supervised learning mapping the points of a dataset to a inhomogeneous Ising model in the presence of an external field produced by the previously labelled points is proposed. The labelling of a point is then obtained through the sign of the mean value of the spin associated to it. These means are calculated using a mean field approximation known as Plefka’s Expansion, in such a way that a family of semi-supervised algorithms is obtained, each corresponding to a Taylor expansion of a free energy. Phase diagrams of these algorithms are constructed as a function of two hyperparameters and is shown that optimal performance occurs in a partially ordered phase known as superparamagnetic. Based on this result, then a way of achieving labellings with good precision in a region of hyperparameter space is introduced. When compared to other graph-based methods, the proposed method shows intermediary accuracy for three of the four studied datasets and the best accuracy on the fourth one. Besides that, the proposed algorithm has good computational efficacy, specially for being faster in the regions with optimal results.
Descrição
Palavras-chave
Aprendizado de máquina, Aprendizado semi-supervisionado, Mecânica estatística, Transições de fase, Semi-supervised learning, Statistical mecanics, Phase transitions
Idioma
Português

