A rank aggregation framework for video multimodal geocoding

Li, Lin Tzy; Pedronette, Daniel Carlos Guimarães [UNESP]; Almeida, Jurandy; Penatti, Otávio A.B.; Calumby, Rodrigo Tripodi; Torres, Ricardo da Silva

doi:10.1007/s11042-013-1588-4

A rank aggregation framework for video multimodal geocoding

dc.contributor.author	Li, Lin Tzy
dc.contributor.author	Pedronette, Daniel Carlos Guimarães [UNESP]
dc.contributor.author	Almeida, Jurandy
dc.contributor.author	Penatti, Otávio A.B.
dc.contributor.author	Calumby, Rodrigo Tripodi
dc.contributor.author	Torres, Ricardo da Silva
dc.contributor.institution	Universidade Estadual de Campinas (UNICAMP)
dc.contributor.institution	CPqD Foundation
dc.contributor.institution	Universidade Estadual Paulista (Unesp)
dc.contributor.institution	Universidade Estadual de Feira de Santana (UEFS)
dc.date.accessioned	2014-05-27T11:30:05Z
dc.date.available	2014-05-27T11:30:05Z
dc.date.issued	2013-08-01
dc.description.abstract	This paper proposes a rank aggregation framework for video multimodal geocoding. Textual and visual descriptions associated with videos are used to define ranked lists. These ranked lists are later combined, and the resulting ranked list is used to define appropriate locations for videos. An architecture that implements the proposed framework is designed. In this architecture, there are specific modules for each modality (e.g, textual and visual) that can be developed and evolved independently. Another component is a data fusion module responsible for combining seamlessly the ranked lists defined for each modality. We have validated the proposed framework in the context of the MediaEval 2012 Placing Task, whose objective is to automatically assign geographical coordinates to videos. Obtained results show how our multimodal approach improves the geocoding results when compared to methods that rely on a single modality (either textual or visual descriptors). We also show that the proposed multimodal approach yields comparable results to the best submissions to the Placing Task in 2012 using no extra information besides the available development/training data. Another contribution of this work is related to the proposal of a new effectiveness evaluation measure. The proposed measure is based on distance scores that summarize how effective a designed/tested approach is, considering its overall result for a test dataset. © 2013 Springer Science+Business Media New York.	en
dc.description.affiliation	RECOD Lab, Institute of Computing University of Campinas (UNICAMP), Campinas, 13083-852
dc.description.affiliation	Telecommunications Res. and Dev. Center CPqD Foundation, Campinas, 13086-902
dc.description.affiliation	Department of Statistics, Applied Mathematics and Computing Universidade Estadual Paulista (UNESP), Rio Claro, 13506-900
dc.description.affiliation	Department of Exact Sciences University of Feira de Santana (UEFS), Feira de Santana, 44036-900
dc.description.affiliationUnesp	Department of Statistics, Applied Mathematics and Computing Universidade Estadual Paulista (UNESP), Rio Claro, 13506-900
dc.format.extent	1-37
dc.identifier	http://dx.doi.org/10.1007/s11042-013-1588-4
dc.identifier.citation	Multimedia Tools and Applications, p. 1-37.
dc.identifier.doi	10.1007/s11042-013-1588-4
dc.identifier.issn	1380-7501
dc.identifier.issn	1573-7721
dc.identifier.scopus	2-s2.0-84880660373
dc.identifier.uri	http://hdl.handle.net/11449/76113
dc.language.iso	eng
dc.relation.ispartof	Multimedia Tools and Applications
dc.relation.ispartofjcr	1.541
dc.relation.ispartofsjr	0,287
dc.rights.accessRights	Acesso restrito
dc.source	Scopus
dc.subject	Effectiveness measure
dc.subject	Multimodal retrieval
dc.subject	Rank aggregation
dc.subject	Video geotagging
dc.title	A rank aggregation framework for video multimodal geocoding	en
dc.type	Artigo
dcterms.license	http://www.springer.com/open+access/authors+rights
dspace.entity.type	Publication
unesp.campus	Universidade Estadual Paulista (UNESP), Instituto de Geociências e Ciências Exatas, Rio Claro	pt
unesp.department	Estatística, Matemática Aplicada e Computação - IGCE	pt

Coleções

Rio Claro - IGCE - Instituto de Geociências e Ciências Exatas

A rank aggregation framework for video multimodal geocoding

Arquivos

Coleções