Uma abordagem de ciência de dados para identificar fake news no âmbito político

Carregando...
Imagem de Miniatura

Data

2019-11-12

Orientador

Albino, João Pedro

Coorientador

Pós-graduação

Curso de graduação

Bauru - FC - Ciência da Computação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Com o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.

Resumo (inglês)

With the advent of the Internet, the amount of available information has grown quickly, transforming itself over the years into a wide network of connected technologies and people. One of the many changes brought by the Internet is the ease with which a user can consume information, and even produce them. However, this accessibility has allowed deceptive information to be conveyed in a larger extent and more easily than it would be in the conventional media. This false information is being called ”fake news”, which aims to give the reader credibility, but without following the guidelines to ensure its accuracy or veracity. These ”fake news” have been getting a lot of attention, specially in the political context, but there are cases related to other topics, such as vaccination, nutrition and even the stock market, which may affect different spheres of society. In order to reduce the misinformation generated by the spread of fake news, this project sought to develop a mobile application to classify, using machine learning, the veracity of news presented to the user. The application has made use of a machine learning model development pipeline, the Python programming language and its libraries, as well as the hybrid mobile application development framework Ionic. In the first step of data collection (referred to as the ”primary data set”) web crawlers were developed to obtain data from three randomly chosen news websites. In a second step of data acquisition, a data set named ”Fake.Br corpus” was used, composed of real and fake news in Portuguese that were collected, cataloged and made available by the University of São Paulo (USP). Finally, both the application and the results obtained with the trained models are presented.

Descrição

Idioma

Português

Como citar

KITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019.

Itens relacionados

Financiadores