Classificação semi-supervisionada com o modelo Potts utilizando uma aproximação de campo médio

Carregando...
Imagem de Miniatura

Data

2022-02-17

Autores

Bergamim Júnior, Emílio

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

O aprendizado semi-supervisionado vem estabelecendo-se como uma área de pesquisa altamente relevante devido à sua capacidade de extrair informação de conjuntos que apresentam dados rotulados e não rotulados. Em particular, abordagens a esse problema que utilizam-se de um grafo para representar tal conjunto constituem um ramo de pesquisa intensamente ativo. Por outro lado, métodos de aprendizado de máquina baseados em modelos oriundos da mecânica estatística também já ocupam um lugar bem estabelecido na literatura, com especial destaque às aproximações de campo médio. Neste trabalho almeja-se realizar um estudo sobre o modelo Potts - originalmente proposto como uma descrição do magnetismo em sólidos - e uma aproximação de campo médio simples aplicados à classificação semi-supervisionada baseada em grafos. Assim, situa-se tal modelo entre outros métodos já aplicados ao problema e então são estudadas duas formas para ajuste do parâmetro β, sendo a inexistência de um procedimento como tal o principal empecilho à aplicabilidade prática deste modelo. Tais abordagens são então avaliadas individualmente e comparadas com algoritmos do estado da arte em cenários nos quais são variadas as construções do grafo de representação e a quantidade de pontos previamente classificados em diferentes conjuntos de dados. Os resultados obtidos indicam que o modelo Potts aproxima-se da acurácia de métodos do estado da arte conforme aumenta-se a quantidade de rótulos conhecidos e o número de arestas no grafo. Além disso, uma dessas abordagens utilizando o modelo Potts apresenta desempenho computacional consistentemente superior, sendo ao menos uma ordem de magnitude mais rápida que as demais quando avaliada em conjuntos comumente utilizados para benchmarks de classificação.
The field of semi-supervised learning has been establishing itself as a highly relevant research area due to its capacity of extracting information from sets that present labeled and unlabeled data. In particular, approaches to this problem that leverage on a graph to represent said sets consist of an active research area. On the other hand, machine learning methods based on models from physics hold a well-established place in the literature, with particular emphasis on mean-field methods. This work aims to study the Potts model - originally proposed as a description of certain types of magnetism in solids - and a mean-field approximation applied to the problem of graph-based semi-supervised classification. So, such model is situated alongside other methods already employed to the problem and then two approaches for tuning its β parameter are studied since the absence of a well defined approach to tune such parameter is the main limitation to its practical application. Such methods are evaluated and compared with state-of-the-art approaches in scenarios where the amount of labeled data available and the graphical representation are evaluated in different datasets. Obtained results point that the accuracy of the Potts model approaches the state-of-the-art as the amount of labeled data and the number of edges on the graph increase. In addition, one of the approaches with the Potts model presented a consistently superior computational performance in comparison to other methods, being at least one order of magnitude faster in sets commonly used for classification benchmarks.

Descrição

Palavras-chave

Aprendizado semi-supervisionado, Semi-supervised learning, Transdução, Transduction, Modelo Potts, Potts model, Aproximações de campo médio, Mean-field approximation

Como citar