La contribución de la generación aumentada por recuperación a la Ciencia de la Información

innovaciones, aplicaciones e implicaciones éticas

Autores/as

  • Fabio Cardoso
  • Edberto Ferneda

DOI:

https://doi.org/10.34630/xiedicic.vi.6699

Palabras clave:

Ciencia de la Información, Recuperación de la Información, Generación Aumentada por Recuperación, Tecnología, Modelos de Lenguaje de Gran Tamaño

Resumen

La Ciencia de la Información (CI) se configura como un campo dedicado al estudio de los procesos de producción, recuperación, organización, difusión y uso de la información en diversos contextos sociales, institucionales y tecnológicos. Según Saracevic (1996, p. 47), se trata de un área orientada a la resolución de los problemas relacionados con la comunicación efectiva del conocimiento y de sus registros entre los seres humanos, considerando las necesidades informacionales en los ámbitos social, institucional e individual.

El continuo avance tecnológico, especialmente en el campo de la Inteligencia Artificial (IA), ha impulsado el desarrollo de sistemas de información cada vez más sofisticados, orientados al análisis, recuperación y generación de datos. En este escenario, destacan los modelos de lenguaje natural basados en la arquitectura Transformer, introducida por Vaswani et al. (2017), que revolucionaron el procesamiento del lenguaje al proponer el mecanismo de atención como estructura central. La eficacia de estos modelos se ve potenciada por la integración con mecanismos de búsqueda externa, capaces de consultar bases de datos actualizadas para complementar las respuestas, como es el caso del modelo Retrieval-Augmented Generation (RAG).

La evolución de los sistemas de recuperación de información evidencia la necesidad de nuevas estrategias para enfrentar el creciente volumen y la complejidad de los datos digitales. Las estrategias tradicionales, basadas en el ranking sintáctico y en consultas simples, resultan insuficientes frente a la masificación de la información y a la creciente demanda de contextualización en los procesos informacionales. En este contexto, el modelo RAG surge como una innovación prometedora, al combinar la recuperación de información relevante en bases externas con la generación textual adaptada a las necesidades de los usuarios, proporcionando respuestas más precisas, actualizadas y contextualizadas.

A pesar de la relevancia de este enfoque, aún se observa una brecha en la literatura de la Ciencia de la Información en lo que respecta a análisis sistemáticos sobre las aplicaciones, potencialidades y desafíos éticos del RAG. La mayoría de las investigaciones se centran en los aspectos técnicos de la arquitectura, sin profundizar en los impactos sobre los procesos de mediación y organización de la información. De este modo, se hace necesaria la realización de estudios que exploren la integración entre las tecnologías de generación aumentada por recuperación y las prácticas de la Ciencia de la Información, considerando sus dimensiones sociales y éticas.

Ante este escenario, el problema de investigación que guía este estudio es: ¿cómo ha abordado la literatura académica la aplicación del modelo RAG en la recuperación de información y cuáles son las principales contribuciones, áreas de aplicación e implicaciones éticas discutidas en la literatura científica reciente?

El objetivo general de este artículo es analizar la aplicación del modelo Retrieval-Augmented Generation (RAG) en el ámbito de la Ciencia de la Información, discutiendo sus contribuciones, áreas de aplicación y desafíos éticos. Para alcanzar este objetivo, se pretende, de forma específica, mapear los estudios académicos publicados entre 2020 y 2025 que abordan la integración entre RAG y Ciencia de la Información, identificar los principales contextos de uso, ventajas y limitaciones asociadas al modelo y discutir críticamente los desafíos éticos y profesionales derivados de la mediación automatizada de la información mediante esta tecnología.

Con base en este panorama introductorio, la siguiente sección presenta el marco teórico que sustenta este estudio, abordando los conceptos esenciales sobre recuperación de información, modelos de lenguaje y la arquitectura del modelo RAG, además de ejemplos prácticos y sus aplicaciones en entornos informacionales.

Publicado

2026-01-13

Número

Sección

Artigos