Skip to content

Preset RAG (slim)

A partire dalla v3.5.0 i preset RAG di Queria sono stati drasticamente semplificati: contengono solo l'identita del settore (tag, domain terms, chunking) e niente piu configurazione di chat, retrieval, reranker o LLM. Tutta la logica di pipeline e stata spostata nei canvas DSL.

Migrazione dai preset legacy

Se arrivi da Queria 3.1.x, i tuoi preset avevano 18+ sezioni (retrieval, reranker, llm, features, mmr, recency, aggregation, federated, etc.). Queste sezioni sono state rimosse dal modello. Le impostazioni equivalenti sono ora nei canvas Chat DSL.

Cosa contengono oggi i preset

typescript
interface SlimPresetConfig {
  chunking: {
    chunkSize: number         // 200-3000, default 2000
    overlapPercentage: number // 0-0.50, default 0.15
  }
}

I campi top-level del preset restano:

  • name, slug, description, icon, color
  • sector (codice del settore di riferimento)
  • tags[]
  • domainTerms[]
  • isDefault, active

Quindi il preset oggi serve a due cose:

  1. Identita di settore -- attivare i term/tag e l'integrazione con il settore in fase di ingestione.
  2. Chunking -- come spezzare i documenti in chunk (dimensione e overlap).

Tutto il resto e nel canvas DSL della pipeline (CHAT, INGESTION, SERVICE).

Quando usare quale strumento

Devo configurare...Dove
Quanti documenti recuperare (topK)Nodo retrieval nel Chat DSL
Quale reranker usareNodo rerank nel Chat DSL
Quale LLM, temperature, max tokensNodo llm_writer nel Chat DSL
Dimensione/overlap chunkPreset RAG > Chunking (questa pagina)
Tag e domain terms del settorePreset RAG o Sectors YAML
Domain terms specifici dell'aziendaScheda Azienda > Domain terms
Soglia score, MMR, diversitaNodo retrieval nel Chat DSL
Citation policyNodo citation_pipeline nel Chat DSL
Federated searchNodo external_tool nel Chat DSL

Se non sei sicuro di dove vada una configurazione, cerca nel pannello: il sistema preferisce sempre i nodi del canvas alla loro versione "globale" nei preset.

Sub-sector tab

Nella pagina Preset c'e ancora il tab sotto-settori dove puoi:

  • Aggiungere additionalTags[] -- estensioni dei tag base del settore.
  • Aggiungere additionalDomainTerms[] -- vocabolario fine specifico del sotto-settore.

Esempio: settore LEGAL, sotto-settore tax-law:

  • additionalTags: ["IVA", "IRPEF", "IRES"]
  • additionalDomainTerms: ["agenzia entrate", "circolare", "interpello", "accertamento"]

Questi vengono fusi con quelli del settore quando un'azienda con subSectorId = tax-law ingesta o cerca documenti.

Creare/modificare un preset

Pannello Settori e Preset > Preset RAG > [nuovo o modifica]:

  1. Identita: nome, slug, descrizione, icona, colore.
  2. Settore: scegli il settore di riferimento (LEGAL, FINANCE, ...).
  3. Tag: parole chiave del dominio (es. per LEGAL: "contratti", "sentenze", "normativa").
  4. Domain terms: termini tecnici (es. "clausola", "giurisdizione", "attore").
  5. Chunking:
    • chunkSize (200-3000): dimensione tipica di un chunk in caratteri. Default 2000.
    • overlapPercentage (0-0.50): sovrapposizione tra chunk consecutivi. Default 0.15 (15%).

Quale chunk size scegliere

  • Testo discorsivo (manuali, articoli): 2000-2500 char, overlap 15-20%.
  • Documenti strutturati (contratti, codici): 1500-2000 char, overlap 10-15% -- i confini di articolo aiutano gia.
  • Dati operativi (listini, tabelle): non rilevante, il chunker operational opera per riga.
  • FAQ corte: 800-1200 char, overlap 5-10%.

Default preset e isDefault

Ogni settore ha un preset marcato isDefault: true che viene applicato automaticamente alle nuove aziende del settore. Per cambiare il default:

  1. Apri il preset desiderato.
  2. Attiva isDefault.
  3. Il sistema rimuove isDefault dagli altri preset dello stesso settore (constraint unique per settore).

Quando rivettorizzare

Cambi nei preset che richiedono reingest dei documenti esistenti:

  • Modifica chunkSize o overlapPercentage -> serve reingest per applicare la nuova segmentazione.
  • Modifica domainTerms -> sufficiente un backfill sector-fields (no LLM, veloce) per stampigliare i nuovi termini sui chunk esistenti.

Cambi che non richiedono reingest:

  • Nome, descrizione, icona, colore.
  • Aggiunta/rimozione di tags.
  • Cambio di isDefault o active.

Vedi Ingestion DSL > Reingest per le procedure operative.

Eliminazione preset

Un preset puo essere eliminato solo se nessuna azienda e nessun topic lo referenziano. In caso di referenze attive, il sistema mostra l'elenco e blocca l'eliminazione.

In alternativa puoi:

  • Marcarlo active: false per nasconderlo dalle nuove selezioni senza rompere riferimenti esistenti.

Limiti

  • Non puoi definire preset per piu settori contemporaneamente: un preset = un settore.
  • Non puoi sovrascrivere il chunking da preset per singolo documento (solo da pipeline INGESTION custom).
  • Non esiste piu il concetto di CompanyPresetOverride: un'azienda referenzia il preset, non lo override. Se serve una variazione, crea un preset dedicato.

Queria v3.5.0 -- Slim presets (chunking + identita di settore)

Queria - Document Intelligence con Cog-RAG