Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos

Carregando...
Imagem de Miniatura

Data

2013-02-25

Autores

Pereira, Luís Augusto Martins [UNESP]

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

In conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ...
Em problemas convencionais de reconhecimento de padrões, dado um conjunto de classes, cada instância do problema e associada a uma e somente uma classe. No entanto, alguns problemas reais de classificaço apresentam instâncias que podem ser associadas a mais de uma classe simultaneamente, esses problemas são denotados como classificação com múltiplos rótulos. Entre problemas dessa natureza, podemos destacar categorização de filmes e músicas, classificação de documentos, análise funcional de genes etc. Contudo, os problemas de classificação com múltiplos rótulos não são diretamente tratáveis por técnicas convencionais, o que justifica o interesse da comunidade de reconhecimento de padrões nesses tipos de problemas. Embora muitos métodos tenham sido propostos na literatura, há ainda muito a ser explorado, principalmente no uso de novos algoritmos convencionais de aprendizado de máquinas adaptados ou não aos problemas com múltiplos rótulos. O classificador supervisionado Floresta de Caminhos Otimos (Optimum- Path Forest - OPF) e um algoritmo determinístico aplicado a problemas convencionais de classificação, no entanto, ainda não foi investigado em problemas com múltiplos rótulos. Nesse contexto, investigamos neste trabalho a aplicação de classificadores baseados em OPF em problemas de múltiplos rótulos. Analisamos duas versões do classificador OPF: (i) a tradicional baseada em grafo completo e (ii) a versão baseada no grafo k-vizinhos mais próximos (OPFkNN). Para manipulação das bases com múltiplos rótulos, utilizamos dois métodos de transformação de problemas, o Binary Relevance e Label Powerset. Propusemos também algumas modificações nas fases de treinamento e classificação do OPFkNN com o objetivo de melhor os resultados desse classificador combinado a métodos de transformação de problemas. Os experimentos realizados em sete bases de dados públicas mostraram que as modifica ções ...

Descrição

Palavras-chave

Computação - Matematica, Processamento de imagens - Tecnicas digitais, Reconhecimento de padrões, Floresta de caminhos ótimos, Arvores (Teoria dos grafos), Computer science Mathematics

Como citar

PEREIRA, Luís Augusto Martins. Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos. 2014. 64 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.