Atenção!


O atendimento às questões referentes ao Repositório Institucional será interrompido entre os dias 20 de dezembro de 2024 a 5 de janeiro de 2025.

Pedimos a sua compreensão e aproveitamos para desejar boas festas!

 

Aderência lexical a dados publicados para produtores rurais

Carregando...
Imagem de Miniatura

Data

2023-02-23

Orientador

Sant'Ana, Ricardo César Gonçalves

Coorientador

Pós-graduação

Ciência da Informação - FFC

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso restrito

Resumo

Resumo (português)

A conjuntura contemporânea de abertura de dados governamentais se manifesta em uma ampla gama de opções de recursos disponíveis. O poder público, diante da dinâmica do acesso à informação, publica conjuntos de dados, que ao vir de todas as esferas orgânicas, implica em uma riqueza pelos assuntos tratados. Os usuários dos dados, com as suas caraterísticas estruturais e contextuais, têm cada vez mais possibilidades de utilização de dados disponibilizados. Este processo de investigação identifica como relevante o usufruto pelo uso de dados por parte de pequenos e médios produtores conforme as suas demandas informacionais, focando na transdução de conteúdos da coleta à recuperação de dados sobre agricultura e desenvolvimento rural, publicados em sites de dados de governo. Parte-se da premissa de que para que os dados sejam proveitosos, é necessário que eles estejam publicados com caraterísticas que favoreçam a sua interpretação. A pergunta que norteia a pesquisa é: Qual é a Aderência Lexical da fase de recuperação de dados, do detentor governo, com o campo informacional do sujeito alvo, identificado como produtores rurais, considerando as suas necessidades informacionais? Para responder a tal inquietação, foi proposto como objetivo geral Verificar a viabilidade de um modelo que reconheça a Aderência Lexical a dados publicados pelo detentor governo, usando necessidades informacionais de produtores rurais como marco de análise. A abordagem metodológica inclui pesquisa documental, revisão sistemática de literatura, coleta automatizada de dados textuais e análises de similaridade com linguagem R. As fontes de dados escolhidas foram conjuntos de dados de governo e notícias publicadas para grupos de produtores rurais. Os resultados mostram que o modelo de análise da Aderência Lexical proposto é um instrumento útil para identificar o potencial de interpretação de pequenos e médios produtores, pois permite reconhecer a proximidade entre dados publicados pelo detentor governo e os sujeitos alvo considerando as suas necessidades informacionais. É possível apontar que, na amostra escolhida, existe uma comunicação insuficiente, pois, das cinco categorias de necessidades ponderadas, houve proximidade unicamente com uma, Crédito. Desde o ponto de vista da similaridade entre as duas fontes, é entendida como favorável em um primeiro nível na busca de inteligibilidade entre estas, sem deixar de assinalar a existência de palavras que precisam de esforços adicionais para melhor contextualização e possível interpretação por parte dos sujeitos alvo. Estudos futuros objetivam contrastar a proposta com outras medidas de similaridade, reprodução em outras fontes de dados e em outros contextos socioeconômicos.

Resumo (inglês)

The contemporary situation of open government data is manifested in a wide range of resource options available. The public power, faced with the dynamics of access to information, publishes sets of data, which, when coming from all organic spheres, imply a richness for the subjects dealt with. Data users, with their structural and contextual characteristics, have more and more possibilities to use the available data. This investigation process identifies as relevant the use of data by small and medium producers according to their informational demands, focusing on the transduction of content from the collection to the recovery of data on agriculture and rural development, published on government data sites. It starts from the premise that for the data to be useful, it is necessary that they are published with characteristics that favor their interpretation. The question that guides the research is: What is the Lexical Adherence of the data recovery phase, of the government holder, with the informational field of the target element, identified as rural producers, considering their informational needs? To respond to this concern, it was proposed as a general objective to verify the viability of a model that recognizes Lexical Adherence to data published by the government holder, using informational needs of rural producers as an analysis framework. The methodological approach includes documentary research, systematic literature review, automated collection of textual data and similarity analysis with R language. The chosen data sources were government datasets and news published for groups of rural producers. The results show that the proposed Lexical Adherence analysis model is a useful instrument to identify the interpretation potential of small and medium-sized producers, as it allows recognizing the proximity between data published by the government holder and the target subjects, considering their informational needs. It is possible to point out that, in the chosen sample, there is insufficient communication, since, of the five weighted categories of needs, there was proximity to only one, Credit. From the point of view of the similarity between the two sources, it is understood as favorable at a first level in the search for intelligibility between them, while noting the existence of words that need additional efforts for better contextualization and possible interpretation by the subjects. target. Future studies aim to contrast the proposal with other measures of similarity, reproduction in other data sources and in other socioeconomic contexts.

Resumo (espanhol)

La coyuntura de datos abiertos del gobierno se manifiesta en una amplia gama de opciones en recursos disponibles. El poder público ante la dinámica de acceso a la información, publica conjuntos de datos, que, provenientes de todas las esferas orgánicas, implican una riqueza en cuanto a los temas tratados. Los usuarios de datos, con sus características estructurales y contextuales, tienen cada vez más posibilidades de utilizar los datos disponibles. Este proceso de investigación identifica como relevante el uso de datos por parte de pequeños y medianos productores de acuerdo con sus demandas informacionales, enfocándose en la transducción de contenidos desde la recolección hasta la recuperación de datos sobre agricultura y desarrollo rural, publicados en sitios de datos gubernamentales. Parte de la premisa de que para que los datos sean útiles es necesario que se publiquen con características que favorezcan su interpretación. La pregunta que orienta la investigación es: ¿Cuál es la Adherencia Lexical de la fase de recuperación de datos, del detentor gobierno, con el campo informacional del elemento objetivo, identificados como productores rurales, considerando sus necesidades informacionales? Para dar respuesta a esta inquietud, se planteó como objetivo general verificar la viabilidad de un modelo que reconozca la Adherencia Lexical a datos publicados por el detentor gobierno, utilizando como marco de análisis las necesidades informacionales de los productores rurales. El enfoque metodológico incluye investigación documental, revisión sistemática de literatura, recolección automatizada de datos textuales y análisis de similitud con lenguaje R. Las fuentes de datos elegidas fueron conjuntos de datos gubernamentales y noticias publicadas para grupos de productores rurales. Los resultados muestran que el modelo de análisis de Adherencia Lexical propuesto es una herramienta útil para identificar el potencial de interpretación de los pequeños y medianos productores, ya que permite reconocer la proximidad entre los datos publicados por el detentor gobierno y los sujetos informacionales, considerando sus necesidades. Es posible señalar que, en la muestra escogida, hay comunicación insuficiente, ya que, de las cinco categorías ponderadas de necesidades, hubo proximidad solo a una, Crédito. Desde el punto de vista de la similitud entre ambas fuentes, se entiende favorable en un primer nivel en la búsqueda de la inteligibilidad entre ellas, sin olvidar señalar la existencia de palabras que necesitan esfuerzos adicionales para una mejor contextualización y posible interpretación por parte de los sujetos informacionales. Futuros estudios pretenden contrastar la propuesta con otras medidas de similitud, reproducción en otras fuentes de datos y en otros contextos socioeconómicos.

Descrição

Idioma

Português

Como citar

Itens relacionados