Preset RAG (slim)
A partire dalla v3.5.0 i preset RAG di Queria sono stati drasticamente semplificati: contengono solo l'identita del settore (tag, domain terms, chunking) e niente piu configurazione di chat, retrieval, reranker o LLM. Tutta la logica di pipeline e stata spostata nei canvas DSL.
Migrazione dai preset legacy
Se arrivi da Queria 3.1.x, i tuoi preset avevano 18+ sezioni (retrieval, reranker, llm, features, mmr, recency, aggregation, federated, etc.). Queste sezioni sono state rimosse dal modello. Le impostazioni equivalenti sono ora nei canvas Chat DSL.
Cosa contengono oggi i preset
interface SlimPresetConfig {
chunking: {
chunkSize: number // 200-3000, default 2000
overlapPercentage: number // 0-0.50, default 0.15
}
}I campi top-level del preset restano:
name,slug,description,icon,colorsector(codice del settore di riferimento)tags[]domainTerms[]isDefault,active
Quindi il preset oggi serve a due cose:
- Identita di settore -- attivare i term/tag e l'integrazione con il settore in fase di ingestione.
- Chunking -- come spezzare i documenti in chunk (dimensione e overlap).
Tutto il resto e nel canvas DSL della pipeline (CHAT, INGESTION, SERVICE).
Quando usare quale strumento
| Devo configurare... | Dove |
|---|---|
| Quanti documenti recuperare (topK) | Nodo retrieval nel Chat DSL |
| Quale reranker usare | Nodo rerank nel Chat DSL |
| Quale LLM, temperature, max tokens | Nodo llm_writer nel Chat DSL |
| Dimensione/overlap chunk | Preset RAG > Chunking (questa pagina) |
| Tag e domain terms del settore | Preset RAG o Sectors YAML |
| Domain terms specifici dell'azienda | Scheda Azienda > Domain terms |
| Soglia score, MMR, diversita | Nodo retrieval nel Chat DSL |
| Citation policy | Nodo citation_pipeline nel Chat DSL |
| Federated search | Nodo external_tool nel Chat DSL |
Se non sei sicuro di dove vada una configurazione, cerca nel pannello: il sistema preferisce sempre i nodi del canvas alla loro versione "globale" nei preset.
Sub-sector tab
Nella pagina Preset c'e ancora il tab sotto-settori dove puoi:
- Aggiungere
additionalTags[]-- estensioni dei tag base del settore. - Aggiungere
additionalDomainTerms[]-- vocabolario fine specifico del sotto-settore.
Esempio: settore LEGAL, sotto-settore tax-law:
additionalTags:["IVA", "IRPEF", "IRES"]additionalDomainTerms:["agenzia entrate", "circolare", "interpello", "accertamento"]
Questi vengono fusi con quelli del settore quando un'azienda con subSectorId = tax-law ingesta o cerca documenti.
Creare/modificare un preset
Pannello Settori e Preset > Preset RAG > [nuovo o modifica]:
- Identita: nome, slug, descrizione, icona, colore.
- Settore: scegli il settore di riferimento (LEGAL, FINANCE, ...).
- Tag: parole chiave del dominio (es. per LEGAL: "contratti", "sentenze", "normativa").
- Domain terms: termini tecnici (es. "clausola", "giurisdizione", "attore").
- Chunking:
chunkSize(200-3000): dimensione tipica di un chunk in caratteri. Default 2000.overlapPercentage(0-0.50): sovrapposizione tra chunk consecutivi. Default 0.15 (15%).
Quale chunk size scegliere
- Testo discorsivo (manuali, articoli): 2000-2500 char, overlap 15-20%.
- Documenti strutturati (contratti, codici): 1500-2000 char, overlap 10-15% -- i confini di articolo aiutano gia.
- Dati operativi (listini, tabelle): non rilevante, il chunker
operationalopera per riga. - FAQ corte: 800-1200 char, overlap 5-10%.
Default preset e isDefault
Ogni settore ha un preset marcato isDefault: true che viene applicato automaticamente alle nuove aziende del settore. Per cambiare il default:
- Apri il preset desiderato.
- Attiva
isDefault. - Il sistema rimuove
isDefaultdagli altri preset dello stesso settore (constraint unique per settore).
Quando rivettorizzare
Cambi nei preset che richiedono reingest dei documenti esistenti:
- Modifica
chunkSizeooverlapPercentage-> serve reingest per applicare la nuova segmentazione. - Modifica
domainTerms-> sufficiente un backfillsector-fields(no LLM, veloce) per stampigliare i nuovi termini sui chunk esistenti.
Cambi che non richiedono reingest:
- Nome, descrizione, icona, colore.
- Aggiunta/rimozione di
tags. - Cambio di
isDefaultoactive.
Vedi Ingestion DSL > Reingest per le procedure operative.
Eliminazione preset
Un preset puo essere eliminato solo se nessuna azienda e nessun topic lo referenziano. In caso di referenze attive, il sistema mostra l'elenco e blocca l'eliminazione.
In alternativa puoi:
- Marcarlo
active: falseper nasconderlo dalle nuove selezioni senza rompere riferimenti esistenti.
Limiti
- Non puoi definire preset per piu settori contemporaneamente: un preset = un settore.
- Non puoi sovrascrivere il chunking da preset per singolo documento (solo da pipeline INGESTION custom).
- Non esiste piu il concetto di
CompanyPresetOverride: un'azienda referenzia il preset, non lo override. Se serve una variazione, crea un preset dedicato.
Queria v3.5.0 -- Slim presets (chunking + identita di settore)