Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos

dc.contributor.advisorPapa, João Paulo [UNESP]
dc.contributor.authorPereira, Luís Augusto Martins [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2015-04-09T12:28:25Z
dc.date.available2015-04-09T12:28:25Z
dc.date.issued2013-02-25
dc.description.abstractIn conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ...en
dc.description.abstractEm problemas convencionais de reconhecimento de padrões, dado um conjunto de classes, cada instância do problema e associada a uma e somente uma classe. No entanto, alguns problemas reais de classificaço apresentam instâncias que podem ser associadas a mais de uma classe simultaneamente, esses problemas são denotados como classificação com múltiplos rótulos. Entre problemas dessa natureza, podemos destacar categorização de filmes e músicas, classificação de documentos, análise funcional de genes etc. Contudo, os problemas de classificação com múltiplos rótulos não são diretamente tratáveis por técnicas convencionais, o que justifica o interesse da comunidade de reconhecimento de padrões nesses tipos de problemas. Embora muitos métodos tenham sido propostos na literatura, há ainda muito a ser explorado, principalmente no uso de novos algoritmos convencionais de aprendizado de máquinas adaptados ou não aos problemas com múltiplos rótulos. O classificador supervisionado Floresta de Caminhos Otimos (Optimum- Path Forest - OPF) e um algoritmo determinístico aplicado a problemas convencionais de classificação, no entanto, ainda não foi investigado em problemas com múltiplos rótulos. Nesse contexto, investigamos neste trabalho a aplicação de classificadores baseados em OPF em problemas de múltiplos rótulos. Analisamos duas versões do classificador OPF: (i) a tradicional baseada em grafo completo e (ii) a versão baseada no grafo k-vizinhos mais próximos (OPFkNN). Para manipulação das bases com múltiplos rótulos, utilizamos dois métodos de transformação de problemas, o Binary Relevance e Label Powerset. Propusemos também algumas modificações nas fases de treinamento e classificação do OPFkNN com o objetivo de melhor os resultados desse classificador combinado a métodos de transformação de problemas. Os experimentos realizados em sete bases de dados públicas mostraram que as modifica ções ...pt
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdFAPESP: 2011/14094-1
dc.format.extent64 f. : il. color., tabs.
dc.identifier.aleph000811257
dc.identifier.capes33004153073P2
dc.identifier.citationPEREIRA, Luís Augusto Martins. Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos. 2014. 64 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.
dc.identifier.file000811257.pdf
dc.identifier.urihttp://hdl.handle.net/11449/122160
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.sourceAleph
dc.subjectComputação - Matematicapt
dc.subjectProcessamento de imagens - Tecnicas digitaispt
dc.subjectReconhecimento de padrõespt
dc.subjectFloresta de caminhos ótimospt
dc.subjectArvores (Teoria dos grafos)pt
dc.subjectComputer science Mathematicspt
dc.titleExplorando abordagens de múltiplos rótulos por floresta de caminhos ótimospt
dc.typeDissertação de mestrado
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Pretopt
unesp.graduateProgramCiência da Computação - IBILCEpt
unesp.knowledgeAreaComputação aplicadapt

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
000811257.pdf
Tamanho:
5.78 MB
Formato:
Adobe Portable Document Format