Logo do repositório

Classificação semi-supervisionada com aproximações de campo médio

Carregando...
Imagem de Miniatura

Orientador

Breve, Fabricio Aparecido

Coorientador

Pós-graduação

Curso de graduação

Física - IGCE

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Baseado em trabalhos recentes (WANG et al., 2007; LI; WANG, 2016), é proposto um novo método de aprendizado semi-supervisionado mapeando os pontos de um conjunto de dados em um modelo Ising não homogêneo na presença de um campo externo produzido pelos pontos previamente classificados. A classificação de um ponto é então obtida através do sinal do valor médio do spin associado ao mesmo. Essas médias são obtidas a partir de uma aproximação de campo médio conhecida como expansão de Plefka, de forma que obtem-se uma classe de algoritmos semi-supervisionados, cada um correspondente a uma expansão em série de Taylor de uma energia livre. É construído um diagrama de fases desses algoritmos em função de dois hiperparâmetros e verifica-se que o desempenho optimal ocorre numa fase parcialmente ordenada chamada de superparamagnética. Com base nesse resultado, é mostrado como obter classificações com boa precisão em uma região do espaço de hiperparâmetros. Quando comparado a outros métodos baseados em grafos, o método tem desempenho intermediário em três dos quatro conjuntos de dados utilizados e apresenta a melhor eficácia para o outro. Além disso, a abordagem proposta tem bom desempenho computacional, principalmente por ser mais rápida na região de resultado optimal.

Resumo (inglês)

Inspired by recent work (WANG et al., 2007; LI; WANG, 2016), a new method of semi-supervised learning mapping the points of a dataset to a inhomogeneous Ising model in the presence of an external field produced by the previously labelled points is proposed. The labelling of a point is then obtained through the sign of the mean value of the spin associated to it. These means are calculated using a mean field approximation known as Plefka’s Expansion, in such a way that a family of semi-supervised algorithms is obtained, each corresponding to a Taylor expansion of a free energy. Phase diagrams of these algorithms are constructed as a function of two hyperparameters and is shown that optimal performance occurs in a partially ordered phase known as superparamagnetic. Based on this result, then a way of achieving labellings with good precision in a region of hyperparameter space is introduced. When compared to other graph-based methods, the proposed method shows intermediary accuracy for three of the four studied datasets and the best accuracy on the fourth one. Besides that, the proposed algorithm has good computational efficacy, specially for being faster in the regions with optimal results.

Descrição

Palavras-chave

Aprendizado de máquina, Aprendizado semi-supervisionado, Mecânica estatística, Transições de fase, Semi-supervised learning, Statistical mecanics, Phase transitions

Idioma

Português

Citação

Itens relacionados

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação