A CONTRIBUIÇÃO DA RETRIEVAL-AUGMENTED GENERATION PARA A CIÊNCIA DA INFORMAÇÃ

INOVAÇÕES, APLICAÇÕES E IMPLICAÇÕES ÉTICAS

Autores

  • Fabio Cardoso
  • Edberto Ferneda

DOI:

https://doi.org/10.34630/xiedicic.vi.6699

Palavras-chave:

Ciência da Informação, Recuperação da Informação, Retrieval-Augmented Generation, Tecnologia, Large Language Models

Resumo

A Ciência da Informação (CI) configura-se como um campo dedicado ao estudo dos processos de produção, recuperação, organização, disseminação e uso da informação em diversos contextos sociais, institucionais e tecnológicos. Conforme Saracevic (1996, p. 47), trata-se de uma área voltada para a resolução dos problemas relacionados à efetiva comunicação do conhecimento e de seus registros entre os seres humanos, considerando as necessidades informacionais nos âmbitos social, institucional e individual.

O contínuo avanço tecnológico, especialmente no campo da Inteligência Artificial (IA), tem impulsionado o desenvolvimento de sistemas de informação cada vez mais sofisticados, voltados à análise, recuperação e geração de dados. Nesse cenário, destacam-se os modelos de linguagem natural baseados na arquitetura Transformer, introduzida por Vaswani et al. (2017), que revolucionou o processamento da linguagem ao propor o mecanismo de atenção como estrutura central. A eficácia desses modelos é potencializada pela integração com mecanismos de busca externa, capazes de consultar bases de dados atualizadas para complementar as respostas, como é o caso do modelo Retrieval-Augmented Generation (RAG).

A evolução dos sistemas de recuperação da informação evidencia a necessidade de novas abordagens para lidar com o volume crescente e a complexidade dos dados digitais. Estratégias tradicionais, baseadas em ranqueamentos sintáticos e consultas simples, tornam-se insuficientes diante da massificação da informação e da crescente exigência de contextualização nos processos informacionais. Nesse contexto, o modelo RAG surge como uma inovação promissora, ao combinar a recuperação de informações relevantes em bases externas com a geração textual adaptada às necessidades dos usuários, proporcionando respostas mais precisas, atualizadas e contextualizadas.

Apesar da relevância dessa abordagem, observa-se ainda uma lacuna na literatura da Ciência da Informação no que tange às análises sistemáticas sobre as aplicações, potencialidades e desafios éticos do RAG. A maior parte das investigações concentra-se nos aspectos técnicos da arquitetura, sem aprofundar os impactos sobre os processos de mediação e organização da informação. Dessa forma, há a necessidade de estudos que explorem a integração entre tecnologias de geração aumentada por recuperação e as práticas da Ciência da Informação, considerando suas dimensões sociais e éticas.

Diante desse cenário, o problema de investigação que orienta este estudo é: como os estudos acadêmicos têm abordado a aplicação do modelo RAG na recuperação da informação, e quais são as principais contribuições, áreas de aplicação e implicações éticas discutidas na literatura científica recente?

O objetivo geral deste artigo é analisar a aplicação do modelo Retrieval-Augmented Generation (RAG) no âmbito da Ciência da Informação, discutindo suas contribuições, áreas de aplicação e desafios éticos. Para atingir esse objetivo, busca-se, de forma específica, mapear os estudos acadêmicos publicados entre 2020 e 2025 que abordam a integração entre RAG e Ciência da Informação, identificar os principais contextos de uso, vantagens e limitações associados ao modelo e discutir criticamente os desafios éticos e profissionais decorrentes da mediação automatizada da informação com o uso dessa tecnologia.

Com base nesse panorama introdutório, a seção seguinte apresenta a fundamentação teórica que embasa este estudo, tratando dos conceitos essenciais de recuperação da informação, modelos de linguagem e a arquitetura do modelo RAG, além de exemplos práticos e suas aplicações em ambientes informacionais.

Publicado

2026-01-13

Edição

Secção

Artigos