Skip to content

Sistema de Agentes Inteligentes

En Queria cada respuesta es el resultado de la colaboracion de agentes IA especializados. Cada agente tiene un cometido preciso, se comunica con los demas mediante un protocolo estructurado y contribuye a un proceso de razonamiento que el usuario puede seguir paso a paso.

Que son los agentes

Un agente es un componente IA autonomo disenado para una tarea especifica. A diferencia de un unico modelo de lenguaje que intenta hacer todo, cada agente esta optimizado para su funcion. Este enfoque garantiza mayor precision, mejor trazabilidad y la posibilidad de mejorar cada componente de forma independiente.

Los agentes del sistema

Semantic Router

El primer agente que entra en accion. Recibe la pregunta del usuario y clasifica su intent, complejidad y dominio tematico. En base a este analisis, decide que pipeline activar:

  • Busqueda simple para preguntas directas
  • Descomposicion para consultas complejas
  • Comparacion estructurada para peticiones comparativas
  • Cog-RAG agentico para razonamientos multi-step autonomos

El Router opera en milisegundos y determina la eficiencia de todo el proceso posterior.

Query Decomposer

Cuando el Router identifica una pregunta compleja, el Decomposer la descompone en sub-preguntas mas simples y manejables. Elige la estrategia adecuada (secuencial, paralela, jerarquica o comparativa) y define las dependencias entre las sub-consultas.

Ejemplo practico: la pregunta "Compara los terminos de pago en los contratos con proveedores italianos y extranjeros de los ultimos dos anos" se descompone en:

  1. Buscar contratos con proveedores italianos (ultimos dos anos)
  2. Buscar contratos con proveedores extranjeros (ultimos dos anos)
  3. Extraer los terminos de pago de ambos grupos
  4. Producir una comparativa estructurada

Retrieval Agent

El agente de recuperacion ejecuta la busqueda real a traves de todas las fuentes disponibles. Para cada sub-consulta:

  • Genera el vector de embedding de la pregunta
  • Ejecuta busqueda hibrida (semantica + lexica) sobre los documentos empresariales
  • Consulta el Knowledge Base permanente
  • Consulta las fuentes externas certificadas si estan habilitadas y son pertinentes
  • Recoge y unifica los resultados de todas las fuentes

Los parametros de busqueda (numero de resultados, umbral de relevancia, factor de diversificacion) se calibran automaticamente segun la complejidad estimada por el Router.

Reranker

Los resultados crudos de la busqueda son reordenados por el Reranker, que usa un modelo cross-encoder para evaluar la pertinencia de cada resultado respecto a la pregunta original. A diferencia de la busqueda inicial basada en similaridad vectorial, el cross-encoder analiza pregunta y documento juntos, produciendo un juicio de relevancia mucho mas preciso.

El Reranker es fundamental para eliminar falsos positivos: documentos que contienen palabras similares pero no son realmente pertinentes a la pregunta.

Self-RAG Agent

Despues del re-ranking, el Self-RAG Agent evalua la calidad general de los resultados. Se hace tres preguntas:

  1. Los resultados son suficientes? Si el numero de documentos relevantes es demasiado bajo, activa una nueva busqueda con parametros ampliados.
  2. Los resultados cubren todos los aspectos de la pregunta? Si falta cobertura sobre una sub-pregunta, lanza busquedas suplementarias dirigidas.
  3. La calidad es adecuada? Si los puntajes de relevancia son demasiado bajos, el sistema puede reformular la consulta y reintentar.

Este mecanismo de auto-verificacion distingue Cog-RAG de los sistemas que presentan cualquier resultado encuentren, independientemente de la calidad.

Grounding Checker

El agente anti-alucinacion por excelencia. Antes de que la respuesta se presente al usuario, el Grounding Checker verifica que cada afirmacion este efectivamente respaldada por documentos fuente. Su cometido:

  • Compara cada claim de la respuesta con los documentos citados
  • Verifica que las citas sean exactas y no fuera de contexto
  • Asigna un puntaje de confianza a la respuesta global
  • Si el grounding es insuficiente, senala las partes no respaldadas

Si el sistema no encuentra evidencias suficientes para responder, activa la modalidad de abstencion: comunica explicitamente al usuario que no dispone de informacion adecuada para proporcionar una respuesta fiable, en lugar de inventar contenidos.

Synthesis Agent

El agente de sintesis recibe los documentos verificados y produce la respuesta final. Opera con el modelo Writer en modalidad de razonamiento profundo:

  • Analiza todas las fuentes recogidas y su contexto
  • Identifica informacion complementaria, redundante o en contraste
  • Estructura la respuesta de forma logica y profesional
  • Inserta citas precisas con referencia a la fuente original [1][2][3]
  • Produce resumenes, comparaciones o analisis segun el tipo de pregunta

La sintesis no es una simple concatenacion de extractos. El Writer razona activamente sobre la informacion para producir una respuesta que anada valor respecto a la lectura de los documentos individuales.

Document Generator Agent

Un agente especializado en la creacion de documentos profesionales. Partiendo de templates predefinidos y datos extraidos:

  • Genera documentos DOCX formateados con estandares profesionales
  • Rellena automaticamente los campos a partir de los documentos fuente
  • Usa un enfoque hibrido: extraccion estructurada para datos tabulares, IA para datos no estructurados
  • Valida el schema de los datos extraidos para garantizar completitud
  • Gestiona el llenado interactivo para los campos faltantes

Data Extractor Agent

El agente de extraccion de datos transforma documentos no estructurados en informacion organizada:

  • Extrae datos de tablas, formularios y textos libres
  • Combina extraccion basada en reglas (para formatos conocidos) e IA (para formatos variables)
  • Soporta output estructurado en formato tabular
  • Gestiona la extraccion desde archivos XLSX con mapeo de columnas automatico

Como colaboran los agentes

La pipeline estandar sigue este flujo:

[Semantic Router]
       |
       v
[Query Decomposer] (si hace falta)
       |
       v
[Retrieval Agent] ---> busqueda en todas las fuentes
       |
       v
[Reranker] ---> reordenamiento semantico
       |
       v
[Self-RAG Agent] ---> verificacion calidad
       |         \
       |     (resultados insuficientes)
       |          \
       |           v
       |      [Retrieval Agent] ---> nueva busqueda ampliada
       |           |
       |           v
       |      [Reranker]
       |           |
       v           v
[Grounding Checker]
       |
       v
[Synthesis Agent] ---> respuesta final

En modalidad Cog-RAG Agentico, el sistema adopta el patron ReAct (Reasoning + Acting): cada agente puede decidir autonomamente el proximo paso, creando cadenas de razonamiento multi-step que se adaptan dinamicamente a la complejidad del problema.

Transparencia del razonamiento

Cada agente registra sus acciones como reasoning steps visibles en la interfaz de usuario. El usuario puede expandir el panel de razonamiento y ver:

  • Analisis de la consulta: como el sistema interpreto la pregunta
  • Estrategia de busqueda: que enfoque se eligio y por que
  • Resultados encontrados: cuantos documentos de que fuentes, con puntajes de relevancia
  • Evaluacion calidad: si el Self-RAG requirio busquedas adicionales
  • Sintesis: como la informacion se combino en la respuesta final

Esta transparencia no es solo una funcionalidad de debug. En contextos regulados (legal, farmaceutico, calidad), poder demostrar el camino logico que llevo a una respuesta es un requisito operativo.

Medidas anti-alucinacion

La alucinacion, es decir la generacion de informacion plausible pero falsa, es el riesgo principal de los sistemas basados en IA generativa. Queria implementa defensas en varios niveles:

  1. Prompting estructurado: los modelos reciben instrucciones explicitas para basarse exclusivamente en los documentos proporcionados
  2. Temperature controlada: parametros de generacion conservadores para respuestas factuales
  3. Grounding check: verificacion automatica que cada afirmacion este respaldada por una fuente
  4. Citas obligatorias: cada claim significativo debe estar vinculado a un documento fuente
  5. Modalidad de abstencion: el sistema rechaza responder en lugar de inventar
  6. Confidence scoring: cada respuesta incluye un indicador de fiabilidad basado en la calidad de las fuentes encontradas

El resultado es un sistema que privilegia el silencio sobre la especulacion. Un "no he encontrado informacion suficiente" es siempre preferible a una respuesta inventada.

Queria - Document Intelligence con Cog-RAG