Skip to content

Presets RAG (slim)

A partir de la v3.5.0 los presets RAG de Queria estan drasticamente simplificados: contienen solo la identidad del sector (tags, domain terms, chunking) y ya no configuracion de chat, retrieval, reranker o LLM. Toda la logica de pipeline se ha movido a los canvas DSL.

Migracion desde presets legacy

Si vienes de Queria 3.1.x, tus presets tenian 18+ secciones (retrieval, reranker, llm, features, mmr, recency, aggregation, federated, etc.). Estas secciones se han eliminado del modelo. Las configuraciones equivalentes estan ahora en los canvas Chat DSL.

Que contienen hoy los presets

typescript
interface SlimPresetConfig {
  chunking: {
    chunkSize: number         // 200-3000, default 2000
    overlapPercentage: number // 0-0.50, default 0.15
  }
}

Los campos top-level del preset se mantienen:

  • name, slug, description, icon, color
  • sector (codigo del sector de referencia)
  • tags[]
  • domainTerms[]
  • isDefault, active

Asi que el preset hoy sirve para dos cosas:

  1. Identidad de sector -- activar los terms/tags y la integracion con el sector en la fase de ingestion.
  2. Chunking -- como dividir los documentos en chunks (tamano y overlap).

Todo el resto esta en el canvas DSL de la pipeline (CHAT, INGESTION, SERVICE).

Cuando usar que herramienta

Necesito configurar...Donde
Cuantos documentos recuperar (topK)Nodo retrieval en Chat DSL
Que reranker usarNodo rerank en Chat DSL
Que LLM, temperature, max tokensNodo llm_writer en Chat DSL
Tamano/overlap chunkPreset RAG > Chunking (esta pagina)
Tags y domain terms del sectorPreset RAG o Sectors YAML
Domain terms especificos de la empresaFicha Empresa > Domain terms
Umbral score, MMR, diversidadNodo retrieval en Chat DSL
Citation policyNodo citation_pipeline en Chat DSL
Federated searchNodo external_tool en Chat DSL

Si no estas seguro de donde va una configuracion, busca en el panel: el sistema prefiere siempre los nodos del canvas a su version "global" en los presets.

Sub-sector tab

En la pagina Preset esta todavia el tab sub-sectores donde puedes:

  • Anadir additionalTags[] -- extensiones de los tags base del sector.
  • Anadir additionalDomainTerms[] -- vocabulario fino especifico del sub-sector.

Ejemplo: sector LEGAL, sub-sector tax-law:

  • additionalTags: ["IVA", "IRPEF", "IRES"]
  • additionalDomainTerms: ["agenzia entrate", "circolare", "interpello", "accertamento"]

Estos se fusionan con los del sector cuando una empresa con subSectorId = tax-law ingesta o busca documentos.

Crear/modificar un preset

Panel Sectores y Presets > Preset RAG > [nuevo o modificar]:

  1. Identidad: nombre, slug, descripcion, icono, color.
  2. Sector: elige el sector de referencia (LEGAL, FINANCE, ...).
  3. Tags: palabras clave del dominio (ej. para LEGAL: "contratos", "sentencias", "normativa").
  4. Domain terms: terminos tecnicos (ej. "clausula", "jurisdiccion", "actor").
  5. Chunking:
    • chunkSize (200-3000): tamano tipico de un chunk en caracteres. Default 2000.
    • overlapPercentage (0-0.50): superposicion entre chunks consecutivos. Default 0.15 (15%).

Que chunk size elegir

  • Texto discursivo (manuales, articulos): 2000-2500 char, overlap 15-20%.
  • Documentos estructurados (contratos, codigos): 1500-2000 char, overlap 10-15% -- los limites de articulo ayudan ya.
  • Datos operativos (listas, tablas): no relevante, el chunker operational opera por fila.
  • FAQ cortas: 800-1200 char, overlap 5-10%.

Default preset y isDefault

Cada sector tiene un preset marcado isDefault: true que se aplica automaticamente a las nuevas empresas del sector. Para cambiar el default:

  1. Abre el preset deseado.
  2. Activa isDefault.
  3. El sistema quita isDefault de los otros presets del mismo sector (constraint unique por sector).

Cuando re-vectorizar

Cambios en los presets que requieren reingest de los documentos existentes:

  • Modificar chunkSize o overlapPercentage -> hace falta reingest para aplicar la nueva segmentacion.
  • Modificar domainTerms -> es suficiente un backfill sector-fields (sin LLM, rapido) para estampar los nuevos terms en los chunks existentes.

Cambios que no requieren reingest:

  • Nombre, descripcion, icono, color.
  • Anadir/quitar tags.
  • Cambio de isDefault o active.

Ver Ingestion DSL > Reingest para procedimientos operativos.

Eliminacion preset

Un preset solo puede eliminarse si ninguna empresa ni topic lo referencian. Con referencias activas, el sistema muestra la lista y bloquea la eliminacion.

Como alternativa puedes:

  • Marcarlo active: false para ocultarlo de nuevas selecciones sin romper referencias existentes.

Limites

  • No puedes definir presets para varios sectores a la vez: un preset = un sector.
  • No puedes sobrescribir el chunking de preset para un solo documento (solo desde pipeline INGESTION custom).
  • No existe ya el concepto de CompanyPresetOverride: una empresa referencia el preset, no lo override. Si hace falta una variacion, crea un preset dedicado.

Queria v3.5.0 -- Slim presets (chunking + identidad de sector)

Queria - Document Intelligence con Cog-RAG