1 UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” FACULDADE DE FILOSOFIA E CIÊNCIAS PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO GUSTAVO LUNARDELLI TREVISAN https://orcid.org/0000-0002-4175-7910 OTIMIZAÇÃO DE CONTEÚDO INFORMACIONAL PARA MECANISMO DE BUSCA ACADÊMICO MARÍLIA – S.P. 2023 https://orcid.org/0000-0002-4175-7910 2 GUSTAVO LUNARDELLI TREVISAN OTIMIZAÇÃO DE CONTEÚDO INFORMACIONAL PARA MECANISMO DE BUSCA ACADÊMICO Tese apresentada ao Programa de Pós-graduação em Ciência da Informação (PPGCI) da Universidade Estadual Paulista “Júlio de Mesquita Filho”, como requisito para a obtenção do título de Doutor em Ciência da Informação. Área de Concentração: Informação, Tecnologia e Conhecimento Linha de pesquisa: Informação e Tecnologia Orientadora: Profa. Dra. Silvana Aparecida Borsetti Gregorio Vidotti Co-orientadora: Profa. Dra. Silvana Drumond Monteiro MARÍLIA – S.P. 2023 T814o Trevisan, Gustavo Lunardelli Otimização de conteúdo informacional para Mecanismo de Busca Acadêmico / Gustavo Lunardelli Trevisan. -- Marília, 2023 291 p. Tese (doutorado) - Universidade Estadual Paulista (Unesp), Faculdade de Filosofia e Ciências, Marília Orientadora: Silvana Aparecida Borsetti Gregorio Vidotti Coorientadora: Silvana Drumond Monteiro 1. SEO Acadêmico. 2. ASEO. 3. Mecanismo de Busca Acadêmico. 4. Comunicação Científica. 5. Marketing Científico Digital. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Biblioteca da Faculdade de Filosofia e Ciências, Marília. Dados fornecidos pelo autor(a). Essa ficha não pode ser modificada. 4 IMPACTO POTENCIAL DA PESQUISA A presente tese, desenvolvida no âmbito da Informação e Tecnologia, possui potencial de contribuição e impacto social, educacional, tecnológico e econômico, dada a criação de uma proposta de boas práticas aplicadas à construção de conteúdos informacionais de Pesquisa Científica, trazendo a Otimização de conteúdos para Mecanismos de Busca Acadêmico (ASEO) no radar da produção científica brasileira, contribuindo à formulação de políticas públicas que venham ao encontro dos Objetivos do Desenvolvimento Sustentável (ODS). Por fim, é resultado de anos de estudos e reflexões, de dias e noites dedicadas a compreensão da ASEO. Aos que se propuseram a leitura, desejo que que os conhecimentos contidos acerca da temática contribuam no processo de fazer ciência e no fomento à visibilidade dos pesquisadores de forma democrática. O autor. POTENTIAL IMPACT OF RESEARCH The thesis, developed in the field of Information and Technology, has potential for contribution and social, educational, technological and economic impact, given the creation of a proposal of good practices applied to the construction of informational contents of Scientific Research, bringing the Optimization of contents to Academic Search Engines (ASEO) on the radar of Brazilian scientific production, contributing to the formulation of public policies that meet the Sustainable Development Goals (SDGs). Finally, it is the result of years of study and reflection, of days and nights devoted to understanding ASEO. To those who proposed to read it, I hope that the knowledge contained on the subject will contribute to the process of doing science and to promoting the visibility of researchers in a democratic way. The author. IMPACTO POTENCIAL DE LA INVESTIGACIÓN La tesis, desarrollada en el campo de las Tecnologías de la Información, tiene potencial de aporte e impacto social, educativo, tecnológico y económico, dada la creación de una propuesta de buenas prácticas aplicadas a la construcción de contenidos informativos para la Investigación Científica, trayendo la Optimización de contenido a los Buscadores Académicos (ASEO) en el radar de la producción científica brasileña, contribuyendo a la formulación de políticas públicas que atiendan a los Objetivos de Desarrollo Sostenible (ODS). Finalmente, es el resultado de años de estudio y reflexión, de días y noches dedicados a entender ASEO. A quienes se propusieron leerlo, espero que los conocimientos contenidos sobre el tema contribuyan al proceso de hacer ciencia ya promover la visibilidad de los investigadores de forma democrática. El autor. 5 GUSTAVO LUNARDELLI TREVISAN OTIMIZAÇÃO DE CONTEÚDO INFORMACIONAL PARA MECANISMO DE BUSCA ACADÊMICO Tese apresentada ao Programa de Pós-graduação em Ciência da Informação (PPGCI) da Universidade Estadual Paulista “Júlio de Mesquita Filho”, como requisito para a obtenção do título de Doutor em Ciência da Informação. Data da defesa: 29/07/2022 MEMBROS COMPONENTES DA BANCA EXAMINADORA: Profª. Drª. Silvana Aparecida Borsetti Gregorio Vidotti Orientadora – Docente do Programa de Pós-Graduação em Ciência da Informação - Unesp Membro Titular: Dra. Renata Gonçalves Curty Research Facilitator - Social Sciences - University of California, Santa Barbara / California – USA Membro Titular: Dr. Ronaldo Ferreira de Araújo Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de Alagoas Membro Titular: Dr. Cecílio Merlotti Rodas Docente do Programa de Pós-Graduação em Ciência da Informação - Unesp Membro Titular: Dr. Edberto Ferneda Docente do Programa de Pós-Graduação em Ciência da Informação - Unesp Universidade. Marília, 29 de Julho de 2022. 6 AGRADECIMENTOS Agradecer sempre é uma preocupação. Pois sempre cometemos o erro de suprimir Pessoas que de alguma forma, contribuíram e auxiliaram no desenvolvimento desta tese. Aos que não consegui me lembrar (sou um péssimo guardador de nomes), reitero meus sinceros agradecimentos e embora não citados, serão presentes em minha memória. Aos meus pais, Regina e Nivaldo, que em toda minha vida sempre me desejaram o melhor. A minhas irmãs; Glauce (que dedicou sua vida à Ciência e Pesquisa), Carolina (minha irmã de coração gigante) e Laura. Aos meus irmãos acadêmicos, Gian Carlo De Carli, Emanuelle Torino (Manu) e Jean Brito. A Rosemari Alves, Sandra Milena Roa Martinez, Ana Ferreira, colegas do Grupo de Pesquisa “Novas Tecnologias em Informação” e demais colegas do PPGCI em nossas aulas presenciais e virtuais, sempre com participações ativas e de alto-nível. Em especial, a minha esposa e companheira, Suzilene Yuriko Ando Trevisan, que me apoiou (sempre!), mesmo diante as adversidades que enfrentamos e colaborou para que este momento fosse possível. Ao meu amado filho, Enzo Ando Trevisan, privado por incontáveis vezes de minha atenção, a quem dedico esta obra. À minha orientadora, Profa. Dra. Silvana Aparecida Borsetti Gregrorio Vidotti, pelas orientações e por sua generosidade em dispor seu tempo e conhecimento (em qualquer horário e dia) para minha formação como Pesquisador da Ciência da Informação, e por fazer parte de minha trajetória acadêmica desde meu Mestrado. A Profa. Dra. Silvana Drumond Monteiro, minha co-orientadora, a qual oportunizou as condições para minha formação como Pesquisador Acadêmico. Uma mulher generosa que nunca hesitou em dispor seu tempo, dedicação e conhecimento e que terá minha gratidão para todo sempre. 7 A Profa. Dra. Renata Gonçalves Curty, pelos ensinamentos ao longo de minha trajetória acadêmica e pelas valiosas contribuições a pesquisa. Uma mulher que terá sempre meu apreço e respeito. Ao Prof. Dr. Cecílio Merlotti Rodas, por contribuir com meus conhecimentos em “nosso” laboratório GPInti, em sua disciplina e por aceitar de prontidão a composição da banca desta Pesquisa. Um Homem ímpar em sua postura profissional e pessoal. Aos Professores Dr. Ronaldo Ferreira de Araújo e Dr. Edberto Ferneda, por sua prontidão em participação de banca e valorosas contribuições para a Pesquisa. Aos Professores do PPGCI Unesp – Marília, aos quais pude aprender e construir minhas reflexões ante as diversas disciplinas e temáticas, sempre profissionais e dedicados, à essência de “nosso PPGCI Unesp”; referência para o Brasil e exterior. Por fim, a Unesp, uma Instituição de Ensino, Pesquisa e Extensão imprescindível à construção da Ciência no Brasil e para sociedade. Muito obrigado. 8 "É a ciência que destruiu a crença em bruxaria, mágica e feitiçaria. É a ciência que fez os velhos credos e as velhas superstições impossíveis para homens inteligentes aceitar. É a ciência que tornou ridículo supor que a Terra fosse o centro do universo e o homem o propósito supremo da criação. É a ciência que está mostrando a falsidade dos velhos dualismos da alma e do corpo, mente e matéria, que têm sua origem na religião. É a ciência que nos ensinou o caminho para substituir a certeza arrogante pela verdade provisória. É o espírito científico, o método científico, a estrutura do mundo científico, que deve ser absorvido por qualquer um que deseja ter uma visão filosófica que pertence ao nosso tempo, não uma filosofia antiga literária tirada de livros antigos." Bertrand Russell, The Art of Philosophizing and other Essays, The Art of Rational Conjecture originally published (1942), p.16. "Feliz aquele que transfere o que sabe e aprende o que ensina." Cora Coralina 9 TREVISAN, GUSTAVO LUNARDELLI. Otimização de conteúdo informacional para Mecanismo de Busca Acadêmico. 2022. 291 f. Tese de doutorado (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista (UNESP), Marília. RESUMO Produzir e comunicar a produção científica é parte de um processo à feitura da ciência. Contempla um modelo paradigmático à forma de organizar e representar a informação e conhecimento. Nesse contexto, entendido como um dos principais pontos de partida para o acesso à informação, a busca na web também abrange os mais diversos ambientes e conteúdos, amparados por instrumentos de busca. Existem técnicas que inferem no processo de recuperação dos conteúdos pelas máquinas e o encontro pelos usuários, como o Search Engine Optimization – SEO e Academic Search Engine Optimization – ASEO. Com base nas ferramentas fornecidas pelo método quadripolar, a presente Pesquisa investiga a construção e otimização de conteúdos voltados à produção científica para ambientes informacionais digitais. Parte do pressuposto que a ASEO, infere no funcionamento dos Mecanismos de Busca Acadêmicos e resultados de busca, possibilitando influenciar o comportamento e a decisão dos usuários no processo de escolha e utilização dos conteúdos trazidos no resultado de busca. Para tanto, apresenta o conceito ASEO, o processo construtivo do conceito e estratégias de fomento à visibilidade da produção acadêmico-científica no ambiente web, a práxis da otimização para conteúdos voltados à produção acadêmico-científica no contexto da CI. Como resultados, identifica as confluências entre ASEO e o Marketing Científico Digital e apresenta as Heurísticas ASEO como instrumento norteador à feitura da produção científica. A ASEO compreende em uma nova abordagem, abrangendo desde o estágio embrionário da produção científica até o processo de disseminação e monitoramento daquilo que se produz e disponibiliza nos ambientes informacionais digitais, impelindo o pressuposto teórico que a ASEO e a utilização de instrumentos digitais são elementos contribuintes no processo de recuperação, encontro e utilização dos conteúdos informacionais de produção acadêmico-científica pelos usuários. Conclui-se que a ASEO e aporte das técnicas e instrumentos de comunicação e disseminação da produção científica é parte no novo fazer e utilizar conteúdos voltados à produção científica que contribuem para a Experiência do Usuário. PALAVRAS-CHAVE: SEO Acadêmico. ASEO. Mecanismos de Busca Acadêmico. Comunicação Científica. Marketing Científico Digital 10 ABSTRACT Producing and communicating scientific production is part of the process of making science. It contemplates a paradigmatic model for the way of organizing and representing information and knowledge. In this context, understood as one of the main starting points for access to information, web search also covers the most diverse environments and contents, supported by search tools. There are techniques that infer the process of retrieving content by machines and finding it by users, such as Search Engine Optimization – SEO and Academic Search Engine Optimization – ASEO. Based on the tools provided by the quadripolar method, this Research investigates the construction and optimization of content aimed at scientific production for digital informational environments. It assumes that ASEO infers the functioning of Academic Search Engines and search results, making it possible to influence the behavior and decision of users in the process of choosing and using the contents brought in the search result. To this end, it presents the ASEO concept, the constructive process of the concept and strategies to promote the visibility of academic-scientific production in the web environment, the praxis of optimization for content aimed at academic-scientific production in the context of IC. As a result, it identifies the confluences between ASEO and Digital Scientific Marketing and presents the ASEO Heuristics as a guiding instrument for the making of scientific production. ASEO comprises a new approach, ranging from the embryonic stage of scientific production to the process of dissemination and monitoring of what is produced and made available in digital information environments, pushing the theoretical assumption that ASEO and the use of digital instruments are contributing elements in the process of retrieval, encounter and use of informational content of academic-scientific production by users. It is concluded that ASEO and the contribution of techniques and instruments of communication and dissemination of scientific production is part of the new creation and use of content aimed at scientific production that contribute to the User Experience. KEYWORDS: SEO. ASEO. academic search engines. Scientific Communication. Scientific Digital Marketing 11 RESUMEN Producir y comunicar la producción científica es parte del proceso de hacer ciencia. Contempla un modelo paradigmático de la forma de organizar y representar la información y el conocimiento. En este contexto, entendido como uno de los principales puntos de partida para el acceso a la información, la búsqueda web abarca también los más diversos entornos y contenidos, apoyada en herramientas de búsqueda. Existen técnicas que infieren el proceso de recuperación de contenido por máquinas y encontrarlo por parte de los usuarios, como la optimización de motores de búsqueda - SEO y la optimización de motores de búsqueda académica - ASEO. Basada en las herramientas que proporciona el método cuadripolar, esta Investigación indaga en la construcción y optimización de contenidos destinados a la producción científica para entornos informacionales digitales. Se supone que ASEO infiere el funcionamiento de los Buscadores Académicos y los resultados de búsqueda, lo que permite influir en el comportamiento y decisión de los usuarios en el proceso de elección y uso de los contenidos aportados en el resultado de búsqueda. Para ello, presenta el concepto ASEO, el proceso constructivo del concepto y las estrategias para promover la visibilidad de la producción académico-científica en el entorno web, la praxis de optimización para contenidos dirigidos a la producción académico-científica en el contexto de la CI. Como resultado, identifica las confluencias entre ASEO y Marketing Científico Digital y presenta las Heurísticas ASEO como un instrumento orientador para la elaboración de producción científica. ASEO comprende un nuevo enfoque, que va desde la etapa embrionaria de la producción científica hasta el proceso de difusión y seguimiento de lo que se produce y pone a disposición en los entornos de información digital, impulsando el supuesto teórico de que ASEO y el uso de instrumentos digitales son elementos coadyuvantes en la proceso de recuperación, encuentro y uso de contenidos informativos de la producción académico-científica por parte de los usuarios. Se concluye que ASEO y el aporte de técnicas e instrumentos de comunicación y difusión de la producción científica es parte de la nueva creación y uso de contenidos destinados a la producción científica que contribuyen a la Experiencia de Usuario. PALABRAS CLAVE: SEO Académico. ASEO. buscadores académicos. Comunicación científica. Marketing Cientifico Digital 12 LISTA DE FIGURAS Figura 1 Delineamento da Tese 30 Figura 2 Representação Esquemática – Tese 36 Figura 3 Comunicação Científica no mundo digital 44 Figura 4 Representação conceitual do Contexto de Pesquisa 48 Figura 5 Arquitetura de alto nível do Google. 72 Figura 6 Processo de funcionamento de um Mecanismo de Busca – perspectiva generalista. 74 Figura 7 Processo de busca comum por meio do Mecanismo de Busca - perspectiva do usuário 90 Figura 8 Página principal do Google Scholar 114 Figura 9 Google Scholar – Barra de Busca Simples 115 Figura 10 Google Scholar – Busca Avançada. 115 Figura 11 Elemento da Tabela Periódica SEO 125 Figura 12 Tabela Periódica SEO - Grupos 126 Figura 13 Fatores On page/Off page e elementos SEO 129 Figura 14 ASEO – Atores Componentes 138 Figura 15 ASEO – Níveis e Fases 139 Figura 16 Otimização da produção acadêmico-científica para MBA 141 Figura 17 Identidade e Presença Digital no contexto ASEO 154 Figura 18 ASEO Mapa Conceitual – 2020 156 Figura 19 Cronologia ASEO a e suas relações conceituais a outras temáticas. 179 Figura 20 Cronologia ASEO e principais temáticas 180 Figura 21 Grupo PPGCI Unesp - Facebook 199 Figura 22 LinkedIn UFSC 200 Figura 23 Página do PPGCI Unesp – YouTube 201 Figura 24 Página PPGCI Unesp – Instagram 201 Figura 25 Confluências entre marketing digital e marketing científico no contexto ASEO 214 Figura 26 Heurísticas ASEO (baixa resolução) 223 13 LISTA DE QUADROS Quadro 1 Estrutura da tese 33 Quadro 2 Aspectos inerentes a Divulgação e Comunicação Científica 41 Quadro 3 Categorização dos Mecanismos de Busca 80 Quadro 4 Taxonomia dos Mecanismos de Busca. 85 Quadro 5 Base de dados – tipologia 97 Quadro 6 Tipos de presença digital. 150 Quadro 7 Perfis para construção de identidade digital do Pesquisador 152 Quadro 8 ASEO – Componentes e Finalidades 157 Quadro 9 Número de documentos em cada base de dados para cada termo 159 Quadro 10 ASEO e suas relações temáticas 173 Quadro 11 Tipologias Conceituais - Marketing 183 Quadro 12 Resultados de Busca – Google Scholar 186 Quadro 13 Marketing Digital – Definições para o Termo 187 Quadro 14 Marketing de Conteúdo 191 Quadro 15 Metodologia do Inbound Marketing - Descritivo 193 Quadro 16 Comparativo - mídia social, estratégia de marketing e estratégia de marketing de mídia social. 197 Quadro 17 Estratégias de marketing de mídias sociais SMM - ASEO 198 Quadro 18 Presença Digital em mídias sociais – PPGCI nacionais cadastrados e números de seguidores no ano 2021 202 Quadro 19 Marketing Científico Digital – Aplicação no contexto ASEO. 208 14 LISTA DE TABELAS Tabela 1 Aspectos da Informação – Busca – SEO – SERP 134 15 LISTA DE DIAGRAMAS Diagrama 1 Métrica PageRank para os nós de uma rede simples 64 Diagrama 2 ASEO - processo 222 16 LISTA DE ABREVIATURAS E SIGLAS AI Arquitetura da Informação ASEO Academic Search Engine Optimization CI Ciência da Informação HTML HyperText Markup Language (Linguagem de Marcação de Hipertexto) KG Knowledge Graph MB Mecanismo de Busca MBA Mecanismo de Busca Acadêmico MKT Marketing PPGCI Programa de Pós-Graduação em Ciência da Informação QFID Qualidade das Fontes de Informação digital SEO Search Engine Optimization TIC Tecnologias de Informação e Comunicação Unesp Universidade Estadual Paulista “Júlio de Mesquita Filho” URL Uniform Resource Locator UX User eXperience (Experiência do Usuário) 17 SUMÁRIO 1 INTRODUÇÃO 20 1.1 Pressupostos 24 1.2 Questões de Pesquisa 25 1.3 Objetivo Geral 25 1.3.1Objetivos Específicos 26 1.4 Justificativa 26 1.5 Delineamento Metodológico 27 1.6 O Método Quadripolar 29 1.6.1 Polo Epistemológico 30 1.6.2 Polo Teórico 31 1.6.3 Polo Técnico 32 1.6.4 Polo Morfológico 33 1.7 Estrutura da Pesquisa 34 2 CONTEXTO - COMUNICAÇÃO CIENTÍFICA 37 2.1 Comunicação Científica a perspectiva da CI e ASEO 37 3 MECANISMOS DE BUSCA 49 3.1 Mecanismos de Busca 49 3.1.1 Evolução Conceitual Cronológica 50 3.1.2 Percurso Cronológico e Aspectos Tecnológicos 64 3.1.3 Funcionamento dos Mecanismos De Busca 72 3.1.4 Mecanismos de Busca – Tipologias e Categorias 75 3.1.5 Relações entre Busca e SERP 81 3.2 Navegação dos Mecanismos de Busca 87 4 MECANISMOS DE BUSCA ACADÊMICO 93 4.1 A evolução dos MBA 94 4.2 Desafios para um Mecanismo de Busca Acadêmico à Experiência do Usuário. 102 4.3 Mecanismo de Busca Acadêmico e Perfil do Usuário 106 4.4 Google Scholar 109 18 4.4.1 Google Scholar e Metadados 111 4.4.2 Funcionamento do Google Scholar 113 5 OTIMIZAÇÃO PARA MECANISMOS DE BUSCAS 122 5.1 O SEO 122 5.2 O ASEO 136 5.3 Ciclo ASEO 138 5.4 Identidade Digital no contexto ASEO 148 5.4.1 Plataformas Digitais destinadas a Identidade Digital no contexto ASEO 151 5.5 Mapa Conceitual ASEO 155 5.6 Estado Da Arte - ASEO 158 5.7 ASEO - Definições e Relacionamentos 161 5.8 ASEO: Aplicações e Áreas Temáticas 167 5.8.1 Ambientes Informacionais Digitais – Bibliotecas 167 5.8.2 Sistemas de gestão do Conhecimento 168 5.8.3 Marketing Aplicado À Visibilidade da Produção Científica 168 5.8.4 Cibermetria 170 5.8.5 Dados Estruturados – Metadados 173 5.8.6 Comunicação e Disseminação da Produção Científica 174 5.8.7 Novos Olhares 175 6 MARKETING CIENTÍFICO DIGITAL E ASEO 182 6.1 Marketing Digital 6.2 Search Engine Marketing 6.3 Content Marketing 6.4 Inbound Marketing 6.5 Social Media Marketing e ASEO 6.6 Marketing Científico Digital 6.7 Marketing Científico Digital e suas confluências a ASEO 187 189 190 192 195 206 211 7. HEURÍSTICAS ASEO 217 19 7.1 Heurísticas 219 8 CONCLUSÕES E CONSIDERAÇÕES FINAIS 226 REFERÊNCIAS 234 APÊNDICES APÊNDICE A – Check List ASEO 253 APÊNDICE B - Recursos Visuais utilizados 291 20 CAPÍTULO 1 1 INTRODUÇÃO A Comunicação Científica é resultado de um processo em que seus atores atuam, produzindo, publicando e disseminando a ciência. A ciência compõe um modelo paradigmático no que concerne à forma de organizar e representar a informação e o conhecimento, onde conceitos e instrumentos destinados à sua aplicação são partes de um todo. Meadows (1999) já indagava as questões que abarcam o uso das tecnologias e seus impactos no processo da comunicação científica. Sob a luz da ciência, Dosse (2018, p.13) também suscita um panorama da renovação do cenário intelectual, abrangendo questões relativas às formas de trazer a visibilidade da produção científica, numa tríade entre os campos das ciências (exatas, humanas e filosofia), no sentido do agir humano em todas suas dimensões, que norteiam a feitura da produção científica (p.19). A emergência de um paradigma convergindo os campos da ciência, como a Ciência da Informação, a Comunicação científica, a Tecnologia da Informação e Comunicação e o Marketing partem de um amoldamento, onde as relações entre as partes estão em constante ressignificação e que possibilitam novas proposições e outros modos de pensar a ciência, dentre outros, abrangendo aspectos informacionais, tecnológicos, sociais, éticos e políticos. Facilitar o acesso ao conhecimento entre campos da ciência é uma questão que vem sendo tratada desde o século XVII1. Institutos, como o de 1 A fundação da Royal Society of London for the Improvement of Natural Knowledge (ou simplesmente Royal Society), em 1660 na Inglaterra, bem como a criação em 1665 dos primeiros periódicos científicos Le Journal des Sçavans na França e Philosophical Transactions of the Royal Society na Inglaterra já anteviam o processo de compartilhamento do Conhecimento Científico entre campos da ciência. Nota do Autor. 21 Viena, fundado em 1963, trazem o entendimento que vivemos em uma era de coexistência entre disciplinas e interdisciplinaridade, onde a interação entre campos da ciência são partes de um universo não apenas físico, mas virtualmente interligados no que diz respeito à produção e disseminação da produção científica (BURKE, 2020). Pierre Levy (1993) já antevia em sua obra – “As tecnologias da Inteligência” - que as técnicas, em suas diferentes formas, como o uso de redes de comunicação, possibilitaram o ganho em escala de interdisciplinaridade entre os campos da ciência, a medida em que as tecnologias atuam como agentes de transformação das sociedades atuais. De um cenário analógico, onde a produção científica, disponibilizada apenas em suportes físicos, hoje, consolida sua presença nos ambientes virtuais, no qual as possibilidades de acesso à miríade de informações ganham escala, em um percurso evolutivo às formas de produzir, armazenar e disseminar o que se produz na ciência, bem como a forma de mensurar e monitorar o impacto acadêmico2 e seus autores. No processo evolutivo que envolve as redes computacionais, culminada nos anos 1990, com o advento da internet para a sociedade como um todo, surge a possibilidade de novas feituras do compartilhamento e disseminação da informação científica, bem como ao aumento à visibilidade da produção científica, antes dispostas exclusivamente nos ambientes analógicos e atualmente consolidada nos ambientes digitais. Ainda, no que tange à gênese do paradigma informacional, as linhas de código de uma linguagem computacional de marcação de textos, denominada HTML 3 , tornariam possível o desejo de pensadores que já 2 Entende-se no contexto da pesquisa como as citações, estatísticas de uso e altimetria, indicadores importantes e imperfeitos dos valores refletidos pelo termo impacto acadêmico. Nota do Autor. 3 Criada por Tim Bernes Lee, o HTML é o acrônimo de HyperText Markup Language, (Linguagem de Marcação de Hipertexto). É uma linguagem de marcação utilizada na construção de páginas na Web. 22 anteviam o conceito, para o compartilhamento e disseminação de quaisquer tipos de informação. Castells (2001) registra que a Internet é originada da interseção entre a big Science, a pesquisa militar e a cultura libertária. O autor também realça os centros de pesquisa universitários e centros de estudos ligados à defesa, como pontos de interseção essenciais entre essas três fontes determinantes ao surgimento da Internet. Em que pese, a internet é palco à concepção de novos instrumentos destinados a todo processo de Comunicação Científica no mundo, como formas alternativas para mensurar, avaliar e atribuir significados e valores. Meadows (1999) destaca que o surgimento dos computadores possibilitou novas formas de se encontrar a informação, como o uso das palavras-chave. Nesse cenário despido de átomos e repleto de bytes, há também uma mudança no que se refere descobrir a informação. Encadeadas com a crescente explosão de web sites, blogs, vídeos e ambientes como repositórios digitais, repositórios de dados, além de conteúdos disponibilizados nos mais variados ambientes digitais, existe a eclosão da produção científica, disposta em suas mais variadas formas e suportes, como a denominada “literatura cinza”, relatórios técnicos e pré- prints, que se pluralizam nas diversas Ecologias Informacionais Complexas (OLIVEIRA, VIDOTTI, 2016), abordadas no decorrer da Pesquisa por meio dos ambientes informacionais digitais4. Tais componentes são coadunados aos mecanismos de busca, como fio condutor do objeto de Pesquisa e parte indissociável à descoberta da informação das sociedades contemporâneas. Em parte, a esses ambientes informacionais, a web, idealizada por Robert Cailliau e Tim Berners-Lee, em meados dos anos 1990, é compreendida por diversas Ecologias Informacionais, descritas por Oliveira e 4 Os ambientes informacionais digitais são uma macro categoria com ampla tipologia, que engloba web sites, bibliotecas digitais, repositórios institucionais, periódicos eletrônicos, museus digitais, sistemas de gestão eletrônica de documentos, entre outros. No entanto, nem sempre é possível encontrar a informação que se deseja ou realizar a atividade que se objetiva em função de uma inadequada organização e representação da informação, o que compromete a experiência de interação nesses produtos do engenho tecnológico (OLIVEIRA, 2014). 23 Vidotti (2016, p.91) como “[...]conjunto de espaços, ambientes, canais, mídias, tecnologias e sujeitos com seus comportamentos.”, todos interligados e conectados de maneira holística pela informação. Tais espaços possibilitam que conteúdos indexados sejam recuperados por meio da utilização dos mecanismos de busca (MB), atuando como ponto de partida para o acesso à informação. Vale ponderar que é praxe no meio científico a busca de informações na web, seja em websites, artigos, livros e/ou demais documentos científicos que estejam disponibilizados e referenciados. Desse modo, é possível o entendimento que os mecanismos de busca são instrumentos que contribuem para a descoberta de conteúdos gerados e disponibilizados para público, tanto na forma comercial, quanto na forma da produção científica, sendo assim, um meio condutor às possiblidades de descoberta da informação. Os estudos de Kramer e Bosman (2016) descrevem acerca das possibilidades dos instrumentos destinados à Comunicação Científica para os ambientes informacionais digitais web, perfazendo em uma série de atividades relacionadas e que trazem mudanças no que se refere à feitura da produção científica. Contudo, em contraponto ao uso de tais instrumentos e de como se constituem em seu suporte, sejam por meio de web sites, bibliotecas digitais e em todos os ambientes informacionais digitais já citados, ainda ocorrem problemas decorrentes da desorientação e transbordamento cognitivo a seus utilizadores, questões essas relacionadas diretamente à Arquitetura da Informação e Experiência do Usuário (UX) (OLIVEIRA; VIDOTTI, 2013). Pondera-se também que tais conteúdos estão insertos às etapas que vão desde sua idealização até a disseminação para os usuários, recebendo inferências em seu processo construtivo elementos de campos do conhecimento como o Marketing Digital e suas tipificações, sob a ótica do paradigma pós-custodial, o que suscita novos olhares à organização e compartilhamento da informação nos ambientes informacionais virtuais. 24 Quando no contexto comercial da web, as Organizações buscam melhorias no posicionamento de ranking por meio de técnicas como o Search Engine Optimization (SEO). Já no âmbito da produção científica, os autores, instituições e editoras têm como possibilidade de estratégia ao processo construtivo, o uso do Academic Search Engine Optimization (ASEO), pensadas e aplicadas em conjunto aos Mecanismos de Busca Acadêmicos. Nesse sentido, onde os campos do conhecimento confluem para objetivos em comum, a presente Pesquisa investigou a construção e otimização de conteúdos voltados à produção científica para conteúdos disponibilizados nos ambientes informacionais digitais web. 1.1 Pressuposto Teórico – Justificativa Consideramos o pressuposto teórico de que a otimização de conteúdos informacionais para Mecanismos de Busca Acadêmico, bem como a utilização de instrumentos no processo da disseminação da produção científica são elementos contribuintes no processo de recuperação, que inferem no encontro e utilização dos conteúdos informacionais de produção acadêmico-científica pelos usuários e que por conseguinte, influenciam a Experiência do Usuário. Para responder tal reflexão, o estudo investigativo traz o conceito e práxis SEO/ASEO destinados à produção científica, sob perspectiva dos geradores e utilizadores dos conteúdos, disponibilizados nos ambientes informacionais digitais, sobretudo nos ambientes web. Ao desenvolver quaisquer conteúdos utilizando a otimização de conteúdos para Mecanismos de Busca Acadêmico é prudente a compreensão de como estas inferem na composição de ranking na SERP (Search Engine Results Page). Nesse sentido, a pesquisa evidenciou os embasamentos teóricos e epistemológicos da Ciência da Informação, Computação, Comunicação e 25 do Marketing Digital para responder as indagações propostas, expondo como premissa que as técnicas de otimização para conteúdos de produção científica inferem nos resultados na SERP, e por sua vez, no processo de escolha dos usuários. 1.2 Definição de Questão de Pesquisa Partindo dos estudos de Beel; Gipp, (2009b, 2010) e Codina, (2016- 2020), observou-se a necessidade de aprofundar novos estudos que envolvem a otimização de conteúdos para Mecanismos de Busca e suas influências para usuários e campos da ciência. A pesquisa tem como recorte de objeto do estudo, as tecnologias abordadas e estratégias voltadas à construção de conteúdos por meio do conceito de otimização para Mecanismos de Busca Acadêmico (ASEO), em destaque ao Mecanismo de Busca Google Scholar, por tratar de questões que englobam a Comunicação científica, desde suas etapas preliminares e que produzem efeitos para fins de recuperação às máquinas 5 e da encontrabilidade e descoberta da informação para os usuários nos ambientes informacionais digitais web. Partiu-se do pressuposto que a otimização de conteúdos para os Mecanismos de Busca Acadêmico atuam em seu funcionamento e, portanto, poderiam influenciar o comportamento e a decisão dos usuários no processo de escolha do resultado de busca. Como questão central da pesquisa indagou-se: De que forma as técnicas de ASEO contribuem para a visibilidade de conteúdos acadêmicos na web? 5 Referimos máquinas no sentido de computadores que se utilizam dos Mecanismos de Busca, recuperam os conteúdos indexados dispostos no ciberespaço. (Nota do autor) 26 1.3 Objetivos A presente pesquisa teve por objetivo geral investigar de que forma as técnicas ASEO contribuem para a visibilidade de conteúdos acadêmicos na web e propor Heurísticas que contribuam ao processo. 1.3.1 Objetivos Específicos: Para tanto, como objetivos específicos: a. apresentar o conceito ASEO e revisão de literatura ASEO à perspectiva da Ciência da Informação; b. demonstrar as possíveis formas de aplicação das técnicas ASEO nos conteúdos informacionais voltados à visibilidade da produção acadêmico-científica (revisão literatura e processos); c. Propor Heurísticas ASEO como boas práticas que contribuam à visibilidade dos conteúdos voltados à produção acadêmica, à perspectiva da CI. Em uma perspectiva voltada à Ciência da Informação, a Pesquisa visou responder a questão proposta no intuito de elucidar que o uso da ASEO é parte do novo fazer, organizar e representar conteúdos de produção acadêmico-científica dispostos em ambientes informacionais digitais e de trazer à luz do entendimento científico as Heurísticas ASEO que contribuam à visibilidade dos conteúdos de produção científica dispostos nos ambientes informacionais web para a melhoria dos processos de recuperação da informação (máquinas) e a descoberta6 da informação científica por seus usuários. 6 O termo descoberta é empregado no sentido de seu verdadeiro objetivo - o que você está procurando e em que contexto. E, embora as ferramentas de busca estejam ficando cada vez melhores nesta tarefa, ainda estão longe de resolver o problema (Battelle, p.18, 2006). 27 1.4 Justificativa O presente estudo decorreu do desdobramento da pesquisa de Dissertação de Mestrado em Ciência da Informação, onde os estudos do SEO e sua correlação à Qualidade das Fontes de Informação digital (QFID)7 fomentaram novos questionamentos acerca das formas da organização e representação da informação por meio do uso e otimização do conteúdo informacional para os mecanismos de busca. A forma de otimizar os conteúdos de produção científica, por possuir especificidades distintas e contraposta a conteúdos não científicos, perfez no interesse em compreender o aprofundamento do estudo da ASEO e suas implicações à forma daqueles que a utilizam. O estudo teve o propósito de contribuir para a Ciência da Informação e demais campos da Ciência, à organização e representação da informação no ciberespaço, em específico aqueles relacionados à produção acadêmico-científica nos ambientes informacionais digitais web, bem como fomentar novas discussões onde a produção acadêmico- científica está inserida e incitar novas reflexões onde a tecnologia pode contribuir ao diálogo às questões relacionadas a forma como a produção científica é produzida, disseminada e utilizada. A produção científica nos ambientes informacionais digitais contém cada vez mais em seu processo o uso de artefatos tecnológicos e paratextos8 que se incute além da criação cognitiva, e que se percebe a importância de trazer este assunto à luz da Ciência da Informação e demais campos da ciência. Assim, propõe-se a aplicação de boas práticas ASEO pensadas em uma estrutura compostas por Heurísticas ASEO, como parte dos resultados da 7 Disponível em: http://www.bibliotecadigital.uel.br/document/?code=vtls000216836 Acesso em: 30 jul. 2020. 8 Gérard Genette (1997) refere o termo como “[...] elementos relacionados a um documento não sendo o núcleo do texto em si, mas ainda sendo uma parte essencial tanto do documento em si quanto de nossa percepção e uso dele”. Disponível em: https://doi.org/10.4018/978-1-4666-6002-1.ch001. Acesso em: 19 jan. 2022. http://www.bibliotecadigital.uel.br/document/?code=vtls000216836 https://doi.org/10.4018/978-1-4666-6002-1.ch001 28 pesquisa apresentados no decorrer do estudo. 1.5 Delineamento Metodológico A pesquisa está caracterizada em sua metodologia como pesquisa básica, de delineamento documental, observada por (WITTER, 1990, p.19) como “[...] a que é feita tendo por base qualquer um dos suportes de informação decorrentes de momentos anteriores à pesquisa, quer em andamento, quer relatadas, ou então de informações resultantes do Fazer Humano ligado a outras áreas, que não à ciência [...]”. Ainda a autora observa que a pesquisa documental é aquela cujos objetivos ou hipóteses podem ser constatados por meio de análise de documentos bibliográficos e não-bibliográficos, não se confundindo com levantamento bibliográfico ou revisão de literatura (WITTER, 1990, p.22). A investigação também está classificada como uma pesquisa teórico- informal, com o intuito de produzir novo conhecimento a partir de um problema de pesquisa, desdobrando-se em objetivos específicos, onde se analisa os objetos, como os elementos alusivos da otimização de conteúdos para mecanismos de busca acadêmico, que se perfazem em resultados que poderão aproximar campos distintos da ciência, como a Ciência da Informação, a Comunicação Científica e o Marketing Científico Digital. No que refere às abordagens de investigação, a pesquisa é categorizada por ser uma pesquisa qualitativa, utilizando de pressupostos, análise dos documental, utilizando dados de texto e/ou imagens e documentos (CRESWELL, 2010). Ainda, quanto à abordagem do tipo de pesquisa, Gil (2002, p. 134) observa que: Nas pesquisas quantitativas, as categorias são freqüentemente estabelecidas a priori, o que simplifica sobremaneira o trabalho analítico. Já nas pesquisas qualitativas, o conjunto inicial de categorias em geral é reexaminado e modificado sucessivamente, com vista em obter ideais mais abrangentes e significativos. Por outro lado, nessas pesquisas os dados costumam ser organizados em tabelas, enquanto, nas pesquisas qualitativas, necessita-se valer de textos narrativos, 29 matrizes, esquemas etc. Como desdobramentos e contribuições à Ciência, fornece subsídios para tornar factível a aplicação de boas práticas à otimização de conteúdos científicos para Mecanismos de Busca Acadêmico por meio das Heurísticas ASEO. Dentre os procedimentos e meios de investigação utilizados nesta pesquisa, fez-se o levantamento bibliográfico9 em bases de dados como Scopus, Web of Science, LISA, apresentadas no Capítulo 3, bem como as análises de documentos em outras fontes públicas de documentos para os demais capítulos utilizando o Mecanismo de Busca Acadêmico Google Scholar. A delimitação dos períodos e termos de busca utilizados na pesquisa também estão descritos e detalhados nos capítulos que sucedem. 1.6 O Método Quadripolar A tese teve como fulcro de seu construto, o delineamento por meio do uso do método quadripolar, proposto por Bruyne, Herman e Schoutheete (1991), e por Malheiro (2004; 2014), utilizado como instrumento de investigação de um novo paradigma para as Ciências Humanas e Sociais (VECHIATO, 2013; OLIVEIRA, 2014). Para Vechiato (2013, p. 26), trata-se de um “[...] dispositivo metodológico global para a Ciência da Informação [...]”, corroborado por Silva (2014), como um método aplicável à Ciência da Informação o qual possibilitará novos desdobramentos ao estudo. Dessa forma, o processo de investigação desenvolveu-se de maneira plástica, no avanço e retorno entre os quatro polos distintos, contudo inter- relacionados e complementares (DE BRUYNE; HERMAN; DE SCHOUTHEETE, 1991). 9 Entendido como parte da pesquisa bibliográfica, a qual […] é desenvolvida com base em material já elaborado, constituído principalmente de livros e artigos científicos (GIL, 2002, p. 44). 30 A Figura 1 faz a representação do método quadripolar em seus quatro polos metodológicos no campo da prática científica. São eles: Figura 1 – Delineamento da Tese Fonte: Elaborado pelo autor A figura representa o método quadripolar utilizado na pesquisa, sendo: 1.6.1 Polo Epistemológico O polo epistemológico, no cenário paradigmático pós-custodial, entende o objeto científico não apenas o documento, mas a informação (SOARES, et. al. 2015), e que deriva um objeto de investigação da Ciência da Informação próprio para o delineamento teórico, a informação (acadêmico científica). O polo epistemológico alicerça o objeto científico definido dentro de uma problemática de pesquisa. Reflete-se também sobre os paradigmas nos quais a pesquisa será baseada. De acordo com De Bruyne, Herman, De Schoutheete (1982): O polo epistemológico exerce uma função de vigilância crítica. Ao longo de toda a pesquisa ele é a garantia da 31 objetivação – isto é, da produção – do objeto científico, da explicitação das problemáticas da pesquisa. Encarrega-se de renovar continuamente a ruptura dos objetos científicos com os do senso comum. Decide, em última instância, das regras de produção e de explicitação dos fatos, da compreensão e da validade das teorias. Explicita as regras de transformação do objeto científico, critica seus fundamentos. (DE BRYNE; HERMAN; DE SCHOUTHEETE, 1982, p. 35). Com os avanços tecnológicos na sociedade, faz-se necessária e urgente a discussão e análise dessas tecnologias dentro do amplo conjunto de estudos da Ciência da Informação, bem como a reflexão interdisciplinar sobre a Recuperação da Informação e Findability (ROA-MARTINEZ, 2019), viabilizadas pelas Tecnologias de Informação e Comunicação (TIC), sem desvencilhar-se de aspectos relacionados aos geradores e usuários de conteúdos, como o uso da otimização de conteúdos para mecanismos de busca e pela concepção da informação como fenômeno social e humano. Embora não sendo epstemologia explícita, mas a base para o pragmatismo das ciências contemporâneas (DOSSE, 2018) o uso das TIC é área de investigação teórica e prática da Ciência da Informação ao lado da Produção da Informação acadêmico científica, e da Organização da Informação e Comportamento Informacional, portanto, parte indissociável no que se refere aos conceitos teóricos e práxis, como operantes à transversalidade dos processos informacionais. Ainda, Santos e Vidotti (2009) observam que as Tecnologias de Informação e Comunicação traduzem em tendência no estudo da natureza do tratamento e da gestão da informação e do conhecimento, e destacam “[...] as estruturas e modelos de sistemas computacionais atuantes nos processos de produção, de armazenamento, de preservação, de representação, de recuperação, de acesso, de (re)uso e de disseminação de conteúdos informacionais.” (SANTOS; VIDOTTI, 2009, p.1). 1.6.2 Polo Teórico O polo teórico refere às abordagens teóricas que sustentam o objeto 32 de investigação a partir do diálogo interdisciplinar especialmente das áreas de Ciência da Informação e Comunicação, bem como a Computação e do marketing científico digital. No contexto da pesquisa, o polo teórico pode ser entendido como a base que subsidia os elementos para formular a hipótese da investigação referentes às questões de pesquisa. Ainda, o polo teórico amparou ao componente técnico e subsidia a explicação dos resultados obtidos que serão apresentados no polo morfológico (ROA-MARTINEZ, 2019). A abordagem teórica não só contribuiu a investigação do objeto científico, como também à produção de novos conhecimentos para a Área de Ciência da Informação. Quanto as Categorias Teóricas, elenca-se os seguintes campos da ciência: ▪ Ciência da Informação ▪ MBA conceito (teórico) ▪ Comunicação ▪ TIC ▪ Marketing Científico Digital No que se refere às categorias da Ciência da Informação, fez-se a revisão de aspectos conceituais por meio de revisão de literatura, ambientes informacionais digitais e desenho do cenário onde se situa a análise do objeto de pesquisa. Quanto ao campo da Comunicação, fez-se a revisão dos conceitos da produção científica sob a luz da Ciência da Informação, além do conceito de Identidade Digital. No campo das TIC, faz-se a revisão dos aspectos conceituais da web, mecanismos de busca acadêmico, SEO e ASEO. No campo do Marketing Científico Digital, faz-se a revisão de literatura, suas tessituras e contribuições ao objeto de estudo. 33 1.6.3 Polo Técnico O polo técnico contempla os procedimentos relativos à investigação em si. Posto que se trata de um estudo teórico documental, foi realizado levantamento bibliográfico em bases de dados nacionais e internacionais com vistas à construção da revisão de literatura dos principais temas que delineiam o objeto de pesquisa que propiciaram a elaboração das inferências no decorrer da redação (VECHIATO, 2013), além de análise de imagens e recursos áudio visuais disponíveis no ambiente web. No contexto desta pesquisa, o polo técnico foi construído por uma Pesquisa básica, documental, teórico-informal, qualitativa, por meio de levantamento bibliográfico e documenta por revisão da literatura. Ainda, fez-se o mapeamento de elementos para construção de propostas que utilizaremos para a apresentação e práxis do ASEO. Fez-se a descrição dos dados para a elaboração de Heurísticas ASEO, por intermédio de revisão bibliográfica e documental. O polo técnico desta pesquisa em consonância com o polo teórico teve o objetivo de identificar os elementos que foram mapeados para a construção de conceitos, das propostas de otimização de conteúdos para mecanismos de busca acadêmico, bem como do modelo conceitual de boas práticas para a ASEO. 1.6.4 Polo Morfológico O polo morfológico trouxe a construção do relatório científico à luz da Ciência da Informação, com apresentação da revisão de literatura propriamente dita e todas as inferências que sustentam os resultados da pesquisa. Dessarte, visou contemplar a proposta de ASEO, a relação entre a otimização, recuperação/encontro e uso da informação e os seus conceitos operatórios, bem como a proposta de Heurísticas ASEO à perspectiva da Ciência da Informação. 34 Por fim o polo morfológico trouxe a representação da tese: ▪ ASEO conceito (morfológico) ▪ A TESE ▪ Heurísticas ASEO Nesta pesquisa, os polos enfocaram: a Ciência da Informação e a Ciência da Computação, a Comunicação e Marketing digital, o polo teórico aborda as seguintes temáticas: otimização para mecanismos de busca, os mecanismos de busca acadêmicos, a recuperação e encontrabilidade da informação. O Quadro 1 apresenta de forma sintética as seções que dão forma a esta tese e os polos correspondentes. Quadro 1 – Estrutura da tese Seção Resumo Polo 1 – Introdução Problematização e delineamento do tema e do objeto de investigação, bem como das premissas, da hipótese e dos objetivos. Epistemológico - Relação do enquadramento metodológico da tese com os polos do método quadripolar 2 – Comunicação Científica a perspectiva da CI e ASEO Apresenta a Comunicação científica no contexto da Pesquisa à perspectiva da Ciência da Informação e ASEO. Teórico 3 - Mecanismos de Busca Apresenta o conceito MBA, por meio de revisão de literatura à perspectiva da Ciência da Informação. Teórico 4 - Mecanismos de Busca Acadêmicos Apresenta o conceito MBA, por meio de revisão de literatura à perspectiva da Ciência da Informação. Teórico 5 – ASEO Apresenta o conceito Academic Search Engine Optimization ASEO à perspectiva da Ciência da Informação. Teórico / Morfológico 6 – Marketing Científico Digital e ASEO Apresenta Marketing Científico Digital no contexto ASEO. Teórico 7 – Heurísticas ASEO Apresenta Heurísticas ASEO Morfológico/Técnico 8 – Considerações Finais Traz as conclusões da pesquisa de acordo com os resultados obtidos. Resgata as opções epistemológicas, teóricas e metodológicas Fonte: Elaborado pelo autor 35 1.7 Estrutura da Pesquisa A estruturação desta Pesquisa está disposta em 8 (oito) Capítulos, conforme disposto em Quadro 1. O Capítulo 1 faz a introdução e contextualização do que se pretende estudar, questões problemas e delineamento do tema a ser tratado. A observação das técnicas e inter-relação entre os conceitos propostos e experiência do usuário objetos de análise para o desenvolvimento da pesquisa. O Capítulo 2 traz a Comunicação científica e divulgação científica no contexto da pesquisa e da Ciência da Informação e ASEO, sucedido pelo Capítulo 3 que aborda, por meio da revisão de literatura, os Mecanismo de Busca, seguido do Capítulo 4, onde faz-se as discussões do Mecanismo de Busca Acadêmico, correlacionando com a evolução das técnicas de melhoria do conteúdo informacional sob a perspectiva da CI, Comunicação e outros campos do polo teórico. No Capítulo 5 foram abordados aspectos relacionados com as questões de otimização de conteúdo informacional para Mecanismo de Busca Acadêmico e suas influências no processo da busca. O Capítulo também trouxe o mapeamento por meio de levantamento bibliográfico, da evolução do conceito e análise de produção científica contendo a temática ASEO. A ASEO foi observada partindo das teorias e conceitos descritos no polo teórico, trazendo o polo epistemológico como alicerce e suas relações aos objetivos específicos da tese; No Capítulo 6 foram explanados e representados como parte dos resultados de Pesquisa, a utilização do Marketing Científico Digital, suas aplicações no contexto ASEO, à perspectiva da Ciência da Informação e suas contribuições, seguido do Capítulo 7, onde traz a propositura das Heurísticas ASEO, como principal resultado da Pesquisa. 36 Finalizando, o Capítulo 8 exprime as considerações finais relacionadas aos resultados obtidos e implicações Éticas e sociais do conceito ASEO para a disseminação da ciência e democratização da visibilidade da produção científica e pesquisadores e, por fim, sugestões de contribuições futuras no contexto da pesquisa. Figura 2 - Representação Esquemática - Tese Fonte: Elaborado pelo autor A imagem (Figura 2) sintetiza a representação esquemática dos Capítulos abordados na pesquisa a seguir. 37 CAPÍTULO 2 2 COMUNICAÇÃO CIENTÍFICA À PERSPECTIVA DA CI E ASEO Este Capítulo faz a contextualização e fundamentação teórica da pesquisa. Inicialmente apresenta da representação esquemática da tese, onde abordaremos os conceitos descritos no decorrer da Pesquisa. 2.1 Comunicação Científica O processo da Comunicação Científica é possível em sua observação por meio de diversos modelos paradigmáticos da CI e suas implicações à Area. Freitas e Malheiro (2009) trazem a propositura dos quatro paradigmas ou apenas dois grandes paradigmas, e as concepções epistemológicas de CI distintas, sobretudo, porque a proposta de dois paradigmas, um custodial e outro, pós-custodial, emergem desde finais do séc. XX. Conforme Freitas e Malheiro (2009), o modelo pós-custodial: [...]assenta na concepção de CI transdisciplinar, ou seja, agregadora das disciplinas precedentes e práticas ou tecnológicas como a Arquivologia, a Biblioteconomia, a Documentação e, naturalmente, a CI norte-americana[.] No entendimento que a Ciência contribui à consolidação desse modelo, surge uma nova dinâmica ao ecossistema da Comunicação Científica1, por meio da reconfiguração e da sofisticação dos métodos contemporâneos, como a otimização de conteúdos para Mecanismos de Busca. 1 O termo designa a organização do ambiente, a disponibilização dos recursos, o modus fasciendi dos sujeitos envolvidos e o conjunto das ações que caracterizam determinado tipo de ação comunicacional (SOARES, 2000). Disponível em:: https://www.revistas.usp.br/comueduc/article/view/36934 . Acesso em: 21 fev. 2022. https://www.revistas.usp.br/comueduc/article/view/36934 38 Para Curty e Aventurier (2017) os formatos de publicação tradicionalmente aceitos pela comunidade científica para a disseminação de avanços em pesquisa têm se mostrado inadequados para as novas formas de se comunicar a Ciência. Pondera-se que novos entendimentos são necessários tendo em vista que o paradigma pós-custodial, bem como as formas de comunicar seus métodos devem ser reconfigurados como parte de um processo de refinamento dos conceitos de como comunicar e divulgar a Ciência. A produção científica é parte de um processo em que a informação e Comunicação Científica estão presentes. Este processo tem em seu cerne a pesquisa científica, que para ser absorvida como insumo à construção do conhecimento, deve contextualizar a busca e leitura de informação científica e, uma vez concluída a pesquisa, a informação deve ser relatada. Targino (2000) aponta os relatos, como os artigos científicos, livros, relatórios e outros documentos denominados publicações científicas, podendo ser fruto de pesquisas originais (literatura primária) ou revisões (literatura secundária). A autora também alega que a informação científica pode ser comunicada por meio dos canais informais e formais. O primeiro, sendo aquele onde a informação é disponibilizada por meio de reuniões, conferências, congressos, correspondência e mídias sociais. Já nos canais formais, a comunicação é publicada e registrada, tendo como característica a capacidade de ser recuperada, por estar indexada e concomitante possível de ser recuperada por meio de instrumentos como as bases de dados, os catálogos das bibliotecas, as bibliografias temáticas, os repositórios e os mecanismos de busca. (TARGINO, 2000) Acerca dos canais de comunicação, os processos de Comunicação Científica envolvem os pesquisadores e público geral, sendo distintos e complementares (MEADOWS, 1999; LE COADIAC, 1999). 39 Em que pese a divisão tradicional: comunicação formal ou estruturada ou planejada e comunicação informal ou não estruturada ou não planejada, ambas são essenciais à evolução do conhecimento e tal categorização não constitui unanimidade entre os teóricos. No entanto, Targino (1994) observa que tal categorização infere no processo de difusão do conhecimento, e, portanto, a forma de atuação e concepção dos canais de comunicação. A autora ainda argumenta que o formal e informal privilegiam mais a produção do artefato (documento) do que os aspectos comportamentais presentes no processo de comunicação, assegurando que a divisão dos canais de comunicação em formais e informais continua sendo a mais adotada na atualidade. Nesse entendimento, a informação científica está envolta em um fluxo continuum2, que começa na produção da informação, a partir de uma pesquisa, segue-se a publicação e /ou compartilhamento, pela busca e recuperação da informação e se fecha com a utilização da informação por um interessado que pode vir a ser o produtor de uma nova ideia, um novo conhecimento, e assim o ciclo se repete indefinidamente. (MULLER, 2007) No contexto da produção científica, a priori, os conceitos de divulgação e Comunicação Científica se confundem como expressões ou conceitos que designam o mesmo objeto, embora não se sobrepõem, visto que possuem características distintas. Para Bueno (2009, p.162), a divulgação científica compreende a “[…] utilização de recursos, técnicas, processos e produtos (veículos ou canais) para a veiculação de informações científicas, tecnológicas ou associadas a inovações ao público leigo.” Corroborando com o autor, Porto (2009, p.102.), observa que a divulgação científica é importante por oportunizar a apropriação do conhecimento científico para públicos distintos. A autora ainda destaca que 2 Na Etimologia, o termo é originado do latim “continuus,a,um”, que significa sem intervalos nem interrupções. (N.A.) 40 “[...]educar para ciência é uma forma de promover a cultura científica[...]”, em uma alusão da ciência à promoção do conhecimento e inovação. Ainda, na perspectiva voltada ao fomento da ciência à atividade privada, Nitschke (2015) argumenta que a divulgação científica é vital para que a sociedade perceba a importância da pesquisa científica, o que se traduz em investimentos à capacitação da força de trabalho e aumento da competitividade nos setores da indústria e tecnologia. Já a Comunicação Científica, por sua vez, está relacionada à transferência de informações científicas, tecnológicas ou associadas a inovações e que se destinam aos especialistas em determinadas áreas do conhecimento. Para Curty e Bocatto (2005, p.95): A comunicação científica consiste na divulgação dos resultados das pesquisas à comunidade científica e a outros especialistas interessados, de forma a favorecer a geração e a disseminação de conhecimentos e de atividades de pesquisas. A Comunicação Científica participa na evolução das sociedades conforme as utilidades de cada época, envolvendo as atividades relacionadas à produção, disseminação e utilização da informação desde o momento de concepção da ideia que irá gerar a pesquisa até o instante em que os resultados dessa pesquisa sejam aceitos como parte do conhecimento científico (GARVEY, 1979), enquanto a divulgação esteja focada no processo de trazer a visibilidade daquilo já produzido. Embora os conceitos exibam características comuns, visto que ambos se reportam à difusão de informações em ciência, tecnologia e inovação (CT&I), eles pressupõem que em sua práxis, trazem alguns aspectos que o diferem e que necessitam ser enunciados, dentre os quais incluem: o perfil e a percepção de público, o nível de discurso, a intencionalidade e natureza dos canais ou ambientes informacionais utilizados no processo, descritas no Quadro 2. 41 Quadro 2 – Aspectos inerentes à Divulgação e Comunicação Científica Divulgação Científica Comunicação Científica Público Não tem obrigatoriamente formação técnico-científica que lhe permita, sem maior esforço, decodificar um jargão técnico ou compreender conceitos que respaldam o processo singular de circulação de informações especializadas. Composto por especialistas, ou seja, pessoas que, por sua formação específica, estão familiarizadas com os temas, os conceitos e o próprio processo de produção em ciência e tecnologia (C&T). Percepção A percepção do público leigo é difusa e encerra uma série de equívocos, como o de imaginar que C&T não se viabilizam num continuum, mas que progridem aos saltos a partir de insights de mentes privilegiadas. O público de interesse da divulgação científica não reconhece, de imediato, o caráter coletivo ou burocrático da produção da ciência e a individualiza. A percepção é nítida às especificidades do método científico e não ignora o fato de que a produção da ciência está respaldada num processo cumulativo, que se refina ao longo do tempo, pela ação daqueles que a protagonizam (pesquisadores / cientistas). Ao mesmo tempo, reconhecem que ela precisa ser validada pela demonstração rigorosa e / ou pela comprovação empírica. Nível do Discurso O público leigo, em geral, não é alfabetizado cientificamente e, portanto, vê como ruído – o que compromete drasticamente o processo de compreensão da C&T – qualquer termo técnico ou mesmo se enreda em conceitos que implicam alguma complexidade. Da mesma forma, sente dificuldade para acompanhar determinados temas ou assuntos, simplesmente porque eles não se situam em seu mundo particular e, por isto, não consegue estabelecer sua relação com a realidade específica em que se insere. Domina os termos de decodificação do discurso especializado porque, implicitamente, acredita que seu público compartilha os mesmos conceitos e que o jargão técnico constitui patrimônio comum. O público frequenta espaços, ambientes ou acessa veículos especializados (congressos ou periódicos / revistas científicas, por exemplo) com desenvoltura e está continuamente empenhado em assimilar termos, processos e conceitos novos. Tem, disposição ou capacitação para esse aprendizado permanente e recorre a cursos e materiais variados, como livros, periódicos científicos e glossários de termos técnicos, com o intuito de permanecer sintonizado com as novidades e com o refinamento do discurso especializado Intencionalidade Cumpre função primordial: democratizar o acesso ao conhecimento científico e estabelecer condições para a Visa à disseminação de informações especializadas entre os pares, com o intuito de tornar conhecidos, na 42 chamada alfabetização científica. Contribui, portanto, para incluir os cidadãos no debate sobre temas especializados e que podem impactar sua vida e seu trabalho, a exemplo de transgênicos, células tronco, mudanças climáticas, energias renováveis e outros itens. comunidade científica, os avanços obtidos (resultados de pesquisas, relatos de experiências etc.) em áreas específicas ou à elaboração de novas teorias ou refinamento das existentes. Natureza dos Canais Está associada à difusão de informações pela imprensa, confundindo-se com a prática do jornalismo científico, mas esta perspectiva não é correta. Ela extrapola o território da mídia e se espalha por outros campos ou atividades, cumprindo papel importante no processo de alfabetização científica. Está presente em círculos mais restritos, como eventos técnico- científicos e periódicos científicos. Embora existam congressos ou publicações especializadas com número significativo de interessados (respectivamente, participantes ou leitores), ela não consegue reunir, pela própria limitação de acesso dos canais ou veículos, a mesma audiência Fonte: Autor – Adaptado de Bueno (2010). Estas características distintivas entre Comunicação Científica e divulgação científica não impedem, no entanto, que apresentem vários pontos de convergência, onde tem sido cada vez mais comum a parceria entre jornalistas/divulgadores e pesquisadores/cientistas na produção de textos ou reportagens para determinadas publicações, particularmente, sob a responsabilidade de entidades científicas, universidades e institutos de pesquisa que têm, prioritariamente, como objetivo central divulgar a ciência (BUENO, 2010). Assim, a Comunicação Científica é referência àqueles (autores, instituições, editoras e demais públicos não acadêmicos) que recorrem às revistas especializadas ou frequentam eventos científicos para definição ou elaboração de pautas (no caso do jornalismo científico) ou relatos que subsidiem seu trabalho, contribuindo no processo de divulgação científica, por meio de tecnologias, que estimulam e potencializam o encontro de conteúdos em ambientes informacionais. Com a consolidação das TIC nas práticas das atividades dos pesquisadores, os modelos tradicionais de Comunicação Científica 43 demandaram novas formas ao seu construto, portanto modificados aos tempos atuais. Hurd (1996) já tecia em suas reflexões a substituição do formato impresso pelo formato digital, como forma de acelerar o processo de comunicação e disseminação das descobertas científicas em todo o fluxo da comunicação. No ano 2000 a autora publica o artigo intitulado “the Transformation of Scientific Communication: A Model for 2020”. Baseado nos estudos de Bush (1945) e Garvey e Griffith (1979), o estudo traz a propositura de um novo modelo para a Comunicação Científica, ao qual as mídias digitais assumem novos papéis e funcionalidades para aqueles atuantes no processo de produção, comunicação e disseminação da produção científica, em que pesquisadores, editores, universidades, bibliotecas e todos aqueles envolvidos não possuem mais espaço fixo ou demarcado, tampouco uma função exclusiva ou etapas rígidas, pontos que serão abordados no decorrer desta Pesquisa. Assim, etapas que antes eram delineadas inicialmente nos canais informais e depois transferidas para canais formais, não ocorrem mais necessariamente nessa ordem. A Figura 3 representa o modelo proposto de Comunicação Científica no mundo digital, em sua terceira revisão estrutural, onde a autora incorpora desenvolvimentos que mudaram a própria natureza da pesquisa e da publicação, alterando também as formas pelas quais bibliotecas e bibliotecários interagem com cientistas e editores (HURD, 2004). 44 Figura 3 – Comunicação Científica no mundo digital Fonte: Córdula (2021). Adaptada de Hurd (2004) A autora pondera que tanto a revisão por pares quanto os colégios invisíveis, continuam fazendo parte desse contexto, no entanto, devendo adaptar-se à utilização das TIC. Vale destacar nesse modelo, a incorporação do uso de ferramentas/plataformas de acesso aberto, como os repositórios institucionais, open archives, os web sites, além das atividades de colaboração entre as organizações como a Scholarly Publishing and Academic Resources Coalition (SPARC). Em contribuição ao exposto, Córdula (2021) observa que os suportes destinados à produção científica (periódicos) coadunam junto a outros ambientes informacionais digitais, como as mídias sociais acadêmicas. 45 Percebe-se que a complexidade digital impacta o fazer científico em sua plenitude, não havendo consenso terminológico ou mesmo uma delimitação de Comunicação Científica. Além disso, é possível afirmar é que a incorporação das TICs no contexto científico provoca constante necessidade de reinvestigação e atualização da temática, uma vez que a evolução e novas possiblidades de uso é uma constante. Antevendo tal fenômeno, acadêmicos, bibliotecários, arquivistas, editores e financiadores de pesquisas criaram uma comunidade denominada Future of Research Communication and e-Scholarship ou Force11. Essa comunidade publicou o Manifesto Force11, que concebe a Comunicação Científica a partir de uma visão abrangente no qual. [...] a informação científica e a comunicação científica se tornam parte de uma rede global, universal e explícita de conhecimento; em que todas as alegações, hipóteses, argumentos – todos os elementos significativos do discurso – podem ser explicitamente representados, juntamente com dados, software, fluxos de trabalho, multimídia, comentários externos e informações sobre proveniência. Nesse mundo de objetos de conhecimento em rede, seria claro como as entidades e os componentes do discurso estariam relacionados entre si, incluindo relacionamentos com estudos anteriores; aprender sobre um novo tópico significa absorver redes de informações, não ler individualmente milhares de documentos. A adição de novos elementos do conhecimento acadêmico é obtida com a adição de nós e relacionamentos a esta rede. As pessoas poderiam contribuir para a rede de várias perspectivas; cada contribuição seria imediatamente acessível globalmente por outras pessoas. Os procedimentos de revisão, bem como os mecanismos de gerenciamento de reputação, forneceriam maneiras de avaliar e filtrar informações (BOURNE et al., 2012, tradução nossa). O manifesto antevia a necessidade do repensar a práxis da produção e disseminação da ciência, e que também exporia algumas questões que impactariam no processo como aqueles referentes aos Formatos e Tecnologias utilizadas e dos modelos de negócios relacionados à produção científica. 46 No contexto desta pesquisa algumas reflexões se fazem necessárias para a compreensão da comunicação e disseminação da produção científica, em destaque ao conceito de Otimização de Conteúdos para Mecanismos de Busca Acadêmicos (ASEO) e existência de níveis de segmentação na Comunicação Científica. A proposição de que a divulgação científica tenha como um de seus objetivos a visibilidade da produção científica remete a indagar a forma como ocorre o processo de tornar o conteúdo de produção científica visível. Isto porque os conteúdos ora produzidos pelo autor, ora disseminados pelas instituições e editoras, quase sempre são desprovidos de estratégias de otimização para os Mecanismos de Busca e que poderiam trazer, quando utilizadas, resultados que comtemplam as expectativas dos usuários, além de ofertar a visibilidade de autores não consagrados, ampliando as possibilidades dos resultados de busca. Ainda, tais indagações devem ser levadas ao âmago da questão: divulgar ciência não se resume em um esforço que incumbe em uma ação essencialmente pedagógica, no sentido de permitir que o usuário ou sujeito informacional3 saiba como as coisas acontecem ou como a ciência funciona. 3 A definição conceitual e emprego do termo é trazida por VECHIATO; VIDOTTI (2017) como “[...]sujeito social que manifesta a sua subjetividade através do estabelecimento de identidades e percursos informacionais na web. Ele é visto como um sujeito social pragmático, uma vez que constrói suas relações pela via da linguagem e do compartilhamento de significados”. Tal fenômeno marca a passagem de um usuário passivo em busca de recursos que atendam às suas necessidades de informação para um sujeito ativo e dinamizador dos fluxos informacionais.” (ASSIS; MOURA, 2013, p. 86). Disponível em: DOI: https://doi.org/10.22478/ufpb.1809-4783.2020v30n1.43934. Acesso em: 19 jan. 2022. No entanto, o emprego crítico do termo sujeito como forma de ampliar a consideração de quem lida com a informação para além da mera satisfação de uma necessidade de informação (no que se adequaria mais o termo usuário) para análise de um indivíduo e das “práticas de informação dos sujeitos em sociedade, cuja atuação pode ocorrer interativamente em distintos contextos comunicativos e em rede” (RABELLO, 2013, p. 69). RABELLO, Rodrigo. Noções de sujeito em modelos teóricos na ciência da informação: do enfoque no sistema à consideração da agência em contexto. Informação & Sociedade, João Pessoa, v. 23, n. 3, p. 57-71, set./dez. 2013. Disponível em: http://eprints.rclis.org/23028/1/Rabello_2013_No%C3%A7%C3%B5es%20de%20sujeito.pdf. Acesso em: 21 fev. 2022. https://doi.org/10.22478/ufpb.1809-4783.2020v30n1.43934 http://eprints.rclis.org/23028/1/Rabello_2013_No%C3%A7%C3%B5es%20de%20sujeito.pdf 47 Portanto, comunicar e divulgar a ciência se estende às formas de como inferir elementos que contribuam aos instrumentos de busca encontrarem conteúdos e ambientes informacionais com maior assertividade. Também é plausível a segmentação à divulgação científica, uma vez que há níveis distintos de público, percepção de conteúdo, de intencionalidade e natureza dos canais ou ambientes informacionais utilizados no processo de difusão, por conta dos perfis da população e dos veículos que a promovem, discutidos no decorrer dessa pesquisa. Bueno (2010) observa as diferenças sensíveis entre divulgação científica mediada pela imprensa, onde revistas consideradas como de divulgação científica, trazem distinções importantes em termos de audiência, temáticas e nível de discurso. Por fim, reconhecer as questões de convergência e disparidades conceituais, com suas respectivas implicações práticas, entre os conceitos de Comunicação Científica e divulgação científica contribui para a exata definição de veículos e ambientes a sua aplicação. Ao ignorar tais diferenças o processo torna-se falho em seu propósito, no processo de comunicar e disseminar e para trazer a visibilidade da produção científica e democratização do conhecimento científico, o que insere a ASEO como novo componente que vem contribuir, conforme apresentados no decorrer da pesquisa. No contexto da pesquisa, ao abordar as questões relacionadas a Comunicação Científica, busca-se trazer as inferências do conceito ASEO suas contribuições ao Campo do conhecimento. Assim, por questões restritivas ao escopo da pesquisa, não adentraremos as discussões relacionadas a seara da Comunicação Científica em seus aspectos epistemológicos, mas aos conceitos e técnicas oriundos de outros campos do conhecimento, como a Ciência da Informação, Marketing Digital e TIC, que visam contribuir a construção de seu arcabouço teórico. 48 Para uma melhor compreensão dos objetos abordados em seus aspectos teóricos, a Figura 4 ilustra a Representação conceitual do contexto de pesquisa4, elencando os elementos a seguir e que serão discutidos em cada capítulo no decorrer da pesquisa. Figura 4 - Representação conceitual do contexto de Pesquisa Fonte: Elaborado pelo autor. A Figura 4 representa a conceituação da Pesquisa, apontando os atores e suas dimensões, sendo o Usuário, por meio das interfaces de busca (Mecanismos de Busca) encontram a informação e de outro, pelos agentes em suas dimensões, Autor, Instituição e Editoras, sendo parte do objeto de análise, sendo os Mecanismos de Busca, em destaque aos Mecanismos de Busca Acadêmico (Google Scholar), a Otimização para Mecanismos de Busca, o Marketing Digital, as Heurísticas ASEO os elementos que corroboram ao construto dos conteúdos disponibilizados nos ambientes informacionais digitais web. 4 Disponível alta resolução em: https://doi.org/10.6084/m9.figshare.20247258 https://doi.org/10.6084/m9.figshare.20247258 49 CAPÍTULO 3 3.1 Mecanismos de Busca No contexto desta pesquisa os Mecanismos de Busca serão abordados em seu conceito e práxis, em especial, os Mecanismos de Busca Acadêmica e suas relações ao objeto de pesquisa, a ASEO. Os Mecanismos de Busca são instrumentos importantes no processo de comunicação e disseminação da produção científica. Suas definições têm em seu arcabouço teórico uma evolução conceitual, onde os desafios atribuídos à ferramenta para os tempos atuais e perspectivas futuras são construídos à medida em que novas tecnologias surgem e norteiam os aportes necessários à sua concepção. Segundo Monteiro (2011), a busca tem se tornado uma prática cada vez mais incorporada na sociedade contemporânea, não importando se ela implica na recuperação da informação e do conhecimento ou apenas em uma descoberta, sendo operada por instrumentos que recebem várias nomenclaturas na literatura científica, como, buscadores, ferramentas de busca, serviços de busca, motores de busca, entre outros denominados motores de busca ou Mecanismos de Busca (MB), como descritos neste estudo. Os Mecanismos de Busca são instrumentos que trouxeram um novo olhar quanto à forma de organizar e representar a informação existente produzida no mundo, no aspecto de diferença de grau, isto é, sua escalabilidade. Por meio de robôs, também denominados crawlers, os MB vasculham a web e seus links para guardar as páginas web em sua base de dados e, a partir de um conjunto de regras, apresentar na Search Engine Results Page 50 (SERP) aquelas consideradas pelos algoritmos do MB as mais adequadas à expressão de busca do sujeito informacional, (denominada no contexto da pesquisa como usuário), de acordo com a expressão de busca1 (query) utilizado no processo de busca. Ao encontrar uma página na web, esses robôs decifram seu código e armazenam partes dele na base de dados do Mecanismo de Busca para serem utilizadas em um momento oportuno, quando uma consulta é feita pelo usuário. Em contribuição ao conceito, Enge, Spencer e Stricchiola (2022, p.6) observam que o ônus é do Google (e de outros Mecanismos de Busca) está em fornecer informações relevantes, rápidas e uma nova experiência de pesquisa. Os autores ainda destacam que a missão do Mecanismo de Busca é trazer receita por meio de publicidade paga, no entendimento que a oferta de soluções, como o Google, Yahoo! e Microsoft trazem em seu modelo de negócio o foco em fornecimento de informação, por meio de propaganda nos resultados de busca2. Os MB fazem parte de modelo de negócio, no qual quanto mais se utiliza o instrumento, mais informação é gerada para o instrumento, pois utiliza- se o aporte de diversos insumos informacionais, como os perfis de conta e rastros digitais de seus usuários. A seguir, apresenta-se a evolução dos Mecanismos de Busca, sob a perspectiva cronológica dos fatos que originam e desdobram-se na ferramenta de busca. 3.1.1 Evolução Conceitual Cronológica Quanto à origem conceitual dos Mecanismos de Busca, a questão da busca antecede a existência do cenário digital e da web. 1 Utilizamos Expressão de Busca em alusão ao fato dos Usuários utilizaram mais de um termo no processo de busca. 2 Observado que a propagada pode vir ora implícita, ora por meio de links patrocinados. 51 Segundo Levene (2010, p. 28, tradução nossa), as raízes da tecnologia de Mecanismo de Busca na web estão originadas nos Sistemas de Recuperação de Informação, Information Retrieval (IR), precedente aos estudos de Luhn, durante o final dos anos 1950. A Recuperação tem sido um campo ativo nos objetos de estudos da Ciência da Informação desde então, e recebendo um maior aporte de pesquisas nos anos de 1990, com os novos requisitos trazidos com advento da web. Um aspecto importante no que se refere às abordagens tradicionais da RI foi trazido por Keith van Rijsbergen, onde o autor faz conjecturas acerca do que seriam os Sistemas de RI, enquanto tratamentos mais modernos em referência à web podem ser atribuídos a Baeza-Yates (1999), Manning, Raghavan, Schutze (2008) e Belew (2000). Desenvolvimentos mais recentes, que se concentram nas tecnologias voltadas à web, são a perspectiva probabilística na modelagem da Web, como Baldi, Frasconi, Smyth (2003) e a perspectiva de mineração de dados sobre gerenciamento de informações da web, trazidas por Chakrabarti (2003) e Liu (2007). Em que pese ao contexto da presente pesquisa, a Recuperação da Informação (RI) é uma área originária da Ciência da Computação (CC), no qual Calvin Mooers, em 1951 (p. 51), define como um processo que “[...] engloba os aspectos intelectuais de descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.”(MONTEIRO et al., 2017). Embora a Ciência da Informação (CI) tenha a gênese na década de 1960, com a proposta de organizar Sistemas de Informação, mesmo que manuais, e permitir a recuperação da informação, as inquietações entre os pensadores e estudiosos da informação acerca da busca já ocorriam ante o advento dos recursos computacionais, como parte evolutivo do fazer a busca. Para tanto, Paul Otlet, precursor da Ciência da Informação, que no ano de 1895, junto a Henri La Fontaine, estabeleceram o Instituto Internacional de 52 Bibliografia, que desenvolveria e distribuiria um sistema universal de catálogo e classificação para todo tipo de informação. Otlet em sua obra, Traité de Documentation (1934), antevia o que viria a se concretizar naquilo concebido e denominado por Tim Bernes Lee como World Wide Web ou Web. Em que pese a época em que vivia, Otlet teoriza o conceito da World Wide Web muito à frente de seu tempo, sendo incontestável o entendimento de que o acesso para todos a todo conteúdo informacional existente e registrado no mundo era parte de seu propósito muito antes da existência da internet. Em 1934, Otlet já fazia planos para uma rede global de computadores (ou ‘telescópios elétricos’, como ele denominou), que permitiria aos seus usuários executarem buscas e navegar por milhões de documentos, imagens e arquivos de áudio e vídeo interligados. Otlet vislumbrava em seu projeto como as pessoas usariam os equipamentos no envio de mensagens, compartilhar arquivos e até se reunir em redes sociais. O projeto “réseau”, poderia ser interpretado nos dias de hoje como uma “rede” ou, “web”. Em parceria de Henri La Fontaine, Otlet criou em 1910, na cidade de Mons, Bélgica, o Mundaneum3, que tinha como objetivo acumular e classificar todo o conhecimento do mundo. Por meio dos catálogos de fichas de biblioteca, Otlet e La Fontaine construíram uma base de dados com mais de 12 milhões de registros. Os usuários do Mundaneum poderiam fazer buscas de informações por carta ou telégrafo, chegando a executar mais de 1,5 mil consultas por ano. O projeto Mundaneum, de Otlet, não se concretizou conforme o planejado, por conta das circunstâncias em que a geopolítica mundial se configurou, dentre as quais destacam-se a Primeira Guerra Mundial (1914- 1918) e posteriormente, a Segunda Guerra Mundial (1939-1945), tendo como desdobramento, a finalização de seus projetos. 3 Disponível em: http://www.mundaneum.org/ Acesso em: 21 abr. 2021. http://www.mundaneum.org/ 53 Duas grandes guerras separavam os ideais de Otlet de outros pesquisadores da informação. Contudo, nos anos de 1945, já no final da Segunda Guerra Mundial, o governo norte-americano trazia em seu âmago os investimentos em novas formas de organizar a informação e o desenvolvimento científico. Nesse sentido, houve muitos esforços em busca de soluções para as questões relacionadas à busca e recuperação da informação, decorrendo em desdobramentos transfigurados no que denominamos hoje por Mecanismos de Busca. Os Mecanismos de Busca, antes de seu conceito estar associado ao contexto computacional, traz em seu arcabouço teórico uma cronologia histórica intrínseca à Ciência da Informação, em especial à Biblioteconomia. Para uma melhor compreensão que envolve o processo teórico construtivo dos MB, registra-se no final do ano de 1945 a publicação do artigo As We May Think4 no The Atlantic Monthly, por Vannevar Bush. O autor traz em seu texto os primeiros esboços conceituais de um Mecanismo de Busca, no tempo em que a internet ainda não se fazia presente. Bush tecia provocações ao propor que cientistas trabalhassem juntos à construção de um corpo de conhecimento para toda a humanidade. Bush antevia a dificuldade de recuperação da informação produzida, além da capacidade de disseminação daquilo que se registrava e armazenava, e posteriormente a ser consultado. Logo, um registro, para ser útil à ciência, deveria ser continuamente ampliado, armazenado e, acima de tudo, ser consultado. Além disso, o autor acreditava que, se a fonte de dados fosse útil para a mente humana, deveria representá-la da melhor maneira possível. O texto ainda faz a menção de que a inaptidão em recuperar registros estava relacionada em parte pela artificialidade dos sistemas de indexação. Para tanto, com o propósito de solução à questão, o autor concebe um 4 Disponível em: https://www.theatlantic.com/magazine/archive/1945/07/as-we-may- think/303881/ https://www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881/ https://www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881/ 54 modelo de sistema associativo de armazenamento e recuperação de memória praticamente ilimitado, rápido, confiável e extensível, denominado MEMEX. O MEMEX consistia numa máquina com o propósito de reunir e indexar o conhecimento científico para uma recuperação mais veloz e flexível, numa antecipação ideológica dos Mecanismos de Buscas (TREVISAN, 2017). Nos seus escritos posteriores a respeito do MEMEX, Bush ampliou o conceito, ao imaginar que o instrumento poderia "aprender com sua própria experiência". Para tanto, seria necessário a coleta estatística sobre o caminho em que usuário percorre e para que o instrumento “percebesse” os que são mais frequentemente utilizados, no entendimento que tais caminhos poderiam ser construídos dinamicamente e dada justificativa semântica, conferindo a esses, novos caminhos significativos. Já nas décadas entre 1960 a 1990, enuncia o desenvolvimento de teorias e aplicações dos conceitos referentes a busca, onde Maron e Kuhns apresentam os princípios básicos do modelo para a recuperação da informação e posteriormente definido por Robertson e Jones nos anos 1976. Em meados de 1960 inicia-se uma série de experimentos dedicados as teorias de Sistemas de Recuperação da Informação (SRI), desenvolvidas entre as décadas de 1970 e 1980. É válido observar que para os usuários de Sistemas de Recuperação da Informação (SRI), um dos aspectos recorrentes ao tema incorre na dificuldade em definir quem é o usuário do SRI (SARACEVIC, 1992). Vale destacar que Araújo (1995, p. 15) observa os Sistemas de Informação como sistemas de comunicação podendo ser interpretados como [...]Sistemas humanos de processamento de informação, sistemas eletrônicos de processamento de dados ou sistemas de recuperação da informação [...] e têm como função dar acesso aos conteúdos, embora a literatura da Ciência da Computação descreva como Recuperação da Informação, abordando Sistemas e modelos (SRI), ao passo que a CI utiliza os dois termos, ou seja, RI e SRI (MONTEIRO et. al, 2017). 55 Como proposta à solução das questões relacionadas ao tema, Gerard Salton e suas equipes situadas nas Universidades de Harvard e Cornell desenvolveram o sistema de recuperação de informações - SMART. O Recuperador Automático de Texto de Salton incluía conceitos importantes como o modelo de espaço vetorial, a Frequência Inversa de Documentos (IDF), a Frequência de Termos (TF), os Valores de discriminação de termos e mecanismos de feedback de relevância. Posteriormente, em seu livro, - A Theory of Indexing (1975), traz em seu bojo, testes nos quais ainda se baseia o conceito da busca. No ano de 1960, Ted Nelson desenvolveu o Projeto Xanadu, e posteriormente, no ano de 1963, a propositura do termo hipertexto. O projeto teve por objetivo desenvolver uma rede de computadores com uma interface simples para o usuário. Os estudos de Nelson trouxeram grandes contribuições para o desenvolvimento da web. Castells, em sua obra – A galáxia da internet (2001) – descreve as origens da Internet na Arpanet, rede de computadores montada pela Advanced Research Projects Agency (ARPA) em setembro de 1969. Embora tenha em seus propósitos explorar novas tecnologias de computação para atender necessidades de origem militar, a ARPANet foi a rede que se desdobrou na Internet, locus de onde se encontram os conteúdos destinados aos MB. No ano de 1993 havia algumas centenas de sites, onde grande parte alocados em servidores de universidades. No ano de 1990, o Archie (da palavra em Inglês "archive" sem a letra "v") era trazido como o primeiro Mecanismo de Busca. Criado por Alan Emtage, da Universidade McGill, em Montreal, o Mecanismo de Busca ajudou a resolver a questão da dispersão de dados, combinando um coletor de dados baseado em um script, com um correspondente de expressão regular para recuperar nomes de arquivos correspondentes à expressão de busca do usuário. 56 O instrumento baixava as listas de diretório de todos os arquivos localizados em sites públicos de File Transfer Protocol (FTP), criando uma base de dados que possibilitava a busca por nome de arquivos. Em sua essência, o Archie se tornou uma base de dados de nomes de arquivos da web, que por sua vez, corresponderia às consultas dos usuários. No mesmo período, registra-se o surgimento do Veronica, desenvolvido pelo Grupo de Serviços de Computação em Sistemas da Universidade de Nevada, como Mecanismo de Busca que recuperava textos simples. No ano de 1991, Mark McCahill, da Universidade de Minnesota, desenvolve o Jughead, como alternativa aos MB Archie e Veronica. É válido observar que até então, não existia a www ou world wide web, e embora existissem iniciativas incipientes para os Mecanismos de Busca, ainda era utilizado o FTP como principal forma ao compartilhamento de dados via redes computacionais. Assim, se fosse preciso enviar um arquivo para outro usuário da rede, seria necessário configurar um servidor FTP. No mesmo entendimento, se alguém estivesse interessado em recuperar os dados, poderia usar um cliente FTP. Paralelamente aos projetos mencionados, outros pesquisadores também nutriam um interesse pela questão da busca e recuperação dos conteúdos em redes computacionais. Nesse contexto, nos anos 1980, Tim Berners-Lee propunha um projeto baseado no conceito de hipertexto, com intuito de facilitar o compartilhamento e a atualização de informações entre pesquisadores; juntamente com Robert Cailliau, desenvolveram o protótipo intitulado Enquire5. Depois de deixar o CERN, no ano de 1980 para trabalhar na Image Computer Systems Ltd. de John Poole, Berners-Lee retornou em 1984 como 5 Disponível em: https://www.w3.org/People/Berners-Lee/FAQ.html. Acesso em: 20 nov. 2021. https://www.w3.org/People/Berners-Lee/FAQ.html 57 sócio. No ano de 1989, o CERN era o maior nó da Internet6 na Europa e Berners-Lee percebe uma oportunidade de associar o hipertexto à Internet. Assim, Berners-Lee fez o uso dos conceitos subjacentes ao sistema Enquire na criação da World Wide Web, ao qual projetou e construiu o primeiro navegador e editor da Web, denominado WorldWideWeb, desenvolvido no NeXTSTEP e o primeiro servidor da Web chamado HTTPD (abreviação de HyperText Transfer Protocol Daemon). Em 6 de agosto de 1991, Berners-Lee apresenta o site http://info.cern.ch/, onde fez uma explicação no que era a World Wide Web, como se poderia obter um navegador e como configurar um servidor web. Foi apresentado também a Biblioteca Virtual7, (http://vlib.org), sendo esse o catálogo mais antigo da Web. Ao contrário dos catálogos comerciais, a BV é administrada por uma confederação de voluntários, que compilam8 páginas de links-chave para áreas específicas nas quais são especialistas. As páginas da BV são amplamente reconhecidas como sendo referência entre os guias de alta qualidade para seções específicas da web. Em junho de 1993, anterior à fundação do W3C, Matthew Gray trazia o World Wide Web Wanderer. A proposta era mensurar o crescimento da web, e para tanto, desenvolveu-se um instrumento software denominado bot, que fazia a varredura na rede em busca de servidores ativos da web. Gray posteriormente atualizou o bot para capturar URLs reais. Seu banco de dados ficou conhecido como Wandex. Em outubro do mesmo ano, Martijn Koster trazia o Archie-Like Indexing da Web, ou ALIWEB em resposta ao Wanderer. O ALIWEB utilizava os metadados contidos no código fonte das páginas, possibilitando aos autores das páginas fazerem inferências com descrições específicas. 6 Em redes de comunicação, um nodo ou nó é um ponto de conexão, seja um ponto de redistribuição ou um terminal de comunicação. A definição de um nó depende da rede e da camada de protocolo referida. N.A. 7 Disponível em: http://vlib.org/admin/AboutVL . Acesso em: 19 jan. 22. 8 Um script é uma linguagem de programação que automatiza a execução de tarefas. N.A. http://info.cern.ch/ http://vlib.org/admin/AboutVL 58 Contudo, a técnica utilizada não se tratava da otimização para os Mecanismos de Busca. A desvantagem do ALIWEB era que muitas pessoas não sabiam como fazer upload do site. Nesse período ainda não existia o Mecanismo de Busca Google e suas metodologias de funcionamento. Portanto, embora possíveis de serem apontadas em código fonte das páginas, ainda era incipiente a forma e potencialidades para o uso de inferências de instruções em código HTML. Em dezembro de 1993, eram três os Mecanismos de Busca: JumpStation, o World Wide Web Worm e o RBSE (Repository-Software Software Engineering). O JumpStation trazia informações sobre o título e o cabeçalho das páginas da Web e as recuperava usando uma busca linear simples. À medida que a web crescia, o JumpStation perdia a performance, visto sua estrutura e conceito. O World Wide Web Worm indexava títulos e URLs. Contudo, os Mecanismos de Busca listavam os resultados na ordem em que se recuperava, sem quaisquer critérios de classificação, com exceção ao RSBE, pois o mesmo implementava um sistema de classificação por relevância ao termo de busca. Como os algoritmos de busca não faziam uma análise de link adequada, tampouco armazenavam em cache o conteúdo da página inteira, se o usuário não soubesse o termo exato para busca, era extremamente difícil encontrá-lo. Nesse sentido, algumas iniciativas de MB para amenizar a questão foram trazidas, como o Excite, derivado do projeto Architext, em fevereiro de 1993, por pesquisadores da Universidade de Stanford. A ferramenta trazia em seu conceito a análise estatística dos relacionamentos das palavras utilizadas para busca com o intuito de torná-la mais eficiente. Ainda em 1993, a O'Reilly Media iniciou o projeto GNN, fornecendo um diretório on-line com base no Guia e Catálogo do Usuário da Internet, sendo também o primeiro site a conter anúncios ‘clicáveis’. 59 No ano de 1994, Berners-Lee fundou o World Wide Web Consortium9 (W3C) no Instituto de Tecnologia de Massachusetts (MIT). Foi também o surgimento do diretório web do EINet Galaxy, organizado de maneira semelhante à atualidade dos diretórios web. O maior motivo pelo qual se tornou um sucesso foi o fato de conter também os recursos de busca Gopher10 e Telnet11, além do recurso de busca na web, visto que o tamanho da web no início de 1994 não exigia realmente um diretório da web; no entanto, outros diretórios logo seguiram. Em abril de 1994, David Filo e Jerry Yang criaram o Yahoo!, sendo este um portal de acesso, com vasta relação de páginas na web. O modelo consistia em um grande catálogo virtual, com endereços categorizados pelos desenvolvedores do MB de forma manual. Em julho do mesmo ano registra-se também o surgimento do Infoseek, em que o autor (webmaster) poderia enviar uma página em tempo real. Com o crescimento do número de links, houve a demanda de repensar como o usuário encontraria os conteúdos disponíveis na web. Assim, criou-se um processo de reorganizar um diretório de páginas para tornar-se um diretório pesquisável, perfazendo o Yahoo! como um instrumento de busca em que os resultados eram o URL juntamente com uma descrição personalizada. No mesmo mês, Brian Pinkerton, da Universidade de Washington, lançou o WebCrawler, como primeiro Mecanismo de Busca que indexava todo o texto dos documentos da web. Ao contrário de seus predecessores, ele permitia aos usuários a busca por qualquer palavra em qualquer página, 9 Disponível em: https://www.w3.org/ 10 Gopher é um protocolo de redes de computadores que foi desenhado para distribuir, procurar e aceder a documentos na Internet, criado na Universidade de Minesota em 1991 e que contém também seus próprios Mecanismos de Busca, conhecidos como "Índices pesquisáveis" e que permitem a busca dentro do Gopherspace. O sistema de pesquisa para encontrar documentos no Gopher é o Veronica. 11 O protocolo Telnet é um protoco