Skip to content

Gestione Documenti

Queria offre molteplici modalita per importare documenti nella piattaforma. Una volta caricati, i documenti vengono elaborati automaticamente e resi disponibili per la ricerca AI. Questa guida copre tutte le opzioni di caricamento, i formati supportati e gli strumenti di gestione.

Pipeline di ingestione canvas-native (v3.5.0+)

A partire dalla v3.5.0 la pipeline che processa i documenti (parsing, classificazione del ruolo, chunking, vettorizzazione) e un canvas DSL che l'amministratore puo personalizzare per la propria azienda. Vedi Ingestion DSL per i dettagli tecnici. Lato utente l'esperienza di caricamento resta invariata: trascini il file, l'AI fa il resto.

Modalita di Caricamento

La pagina Documenti presenta diverse schede (tab) per le varie modalita di importazione.

Tab Upload File

Il metodo piu diretto per caricare documenti dal tuo computer.

  • Drag & drop: trascina uno o piu file direttamente nell'area di caricamento.
  • Click per selezionare: clicca sull'area di caricamento per aprire il selettore file del sistema operativo.
  • Caricamento multiplo: puoi selezionare e caricare piu file contemporaneamente.

Ogni file viene caricato con una barra di progresso individuale. Al termine del caricamento, il sistema avvia automaticamente l'elaborazione.

Tab Cloud Storage

Importa documenti dai tuoi servizi cloud aziendali:

  • Google Drive: connetti il tuo account Google e naviga tra cartelle e file. Puoi selezionare singoli file o intere cartelle.
  • OneDrive: accedi ai file del tuo account Microsoft OneDrive personale o aziendale.
  • SharePoint: naviga tra i siti SharePoint della tua organizzazione e importa documenti dalle librerie condivise.

Una volta collegato un account cloud, puoi abilitare la sincronizzazione automatica: Queria controllera periodicamente le cartelle selezionate e importera automaticamente i nuovi file o le versioni aggiornate.

Tab Rete Aziendale

Importa documenti direttamente dalle cartelle di rete della tua organizzazione:

  • Cartelle SMB/CIFS: specifica il percorso di rete (ad esempio \\server\condivisione\cartella) e le credenziali di accesso.
  • Accesso VPN: se la tua rete richiede una connessione VPN, Queria supporta la configurazione di tunnel per raggiungere le risorse interne.
  • Sincronizzazione programmata: configura una pianificazione per la sincronizzazione automatica delle cartelle di rete. Il sistema rileva nuovi file e modifiche in modo trasparente.

Tab URL

Importa il contenuto di una pagina web fornendo il suo indirizzo:

  • Inserisci l'URL completo della pagina.
  • Queria scarica il contenuto, lo analizza e lo rende disponibile per la ricerca.
  • Utile per importare articoli, documentazione online o pagine informative.

Tab JSONL

Per importazioni massive di dati pre-strutturati:

  • Carica un file in formato JSONL (JSON Lines) dove ogni riga rappresenta un documento con i suoi metadati.
  • Ideale per migrazioni da altri sistemi o per importazioni programmatiche.
  • Ogni record puo includere titolo, contenuto, metadati personalizzati e assegnazione a topic.

Formati Supportati

FormatoEstensioneNote
PDF.pdfSupporto completo, inclusi PDF scansionati (via OCR)
Word.docxTesto, tabelle, immagini incorporate
Excel.xlsxFogli multipli, tabelle strutturate
PowerPoint.pptxTesto dalle slide
Testo.txtTesto semplice
Markdown.mdFormattazione preservata
CSV.csvDati tabulari
JSON.jsonDati strutturati
OpenDocument.odtFormato aperto
Immagini.jpg, .png, .tiffElaborazione automatica con OCR

Stati di Elaborazione

Ogni documento attraversa una serie di stati durante l'elaborazione:

StatoIconaDescrizione
CaricatoCerchio vuotoIl file e stato ricevuto dal sistema, in attesa di elaborazione.
In elaborazioneSpinner animatoIl sistema sta analizzando il documento: estrazione testo, OCR (se necessario), suddivisione in segmenti, generazione degli embedding vettoriali.
ProntoSpunta verdeIl documento e stato elaborato con successo ed e disponibile per la ricerca AI.
ErroreTriangolo rossoSi e verificato un problema durante l'elaborazione. Puoi visualizzare i dettagli dell'errore e tentare una rielaborazione.

Tempi di elaborazione

Un documento di 10-20 pagine viene elaborato in circa 30 secondi. Documenti piu lunghi o contenenti molte immagini possono richiedere qualche minuto.

Monitor di Elaborazione

La sezione Monitor ti permette di seguire in tempo reale il progresso di elaborazione di tutti i documenti:

  • Visualizza quanti documenti sono in coda, in elaborazione e completati.
  • Controlla la percentuale di avanzamento per ogni documento.
  • Identifica rapidamente eventuali errori e accedi ai dettagli per la risoluzione.

Azioni sui Documenti

Per ogni documento nella lista puoi eseguire diverse operazioni:

  • Visualizza: apri un'anteprima del documento originale o scaricalo.
  • Vedi segmenti: consulta come il sistema ha suddiviso il documento in segmenti (chunk) per la ricerca. Utile per verificare che l'elaborazione sia avvenuta correttamente.
  • Rielabora: riavvia l'elaborazione del documento. Utile se il documento era in errore o se desideri aggiornare i segmenti.
  • Archivia: sposta il documento nell'archivio. Non sara piu incluso nelle ricerche ma restera disponibile per la consultazione. Puoi ripristinarlo in qualsiasi momento.
  • Elimina: rimuove il documento (soft delete). Puo essere recuperato dal cestino.
  • Elimina definitivamente: rimuove il documento e tutti i suoi segmenti in modo irreversibile (solo per amministratori).

Attenzione

L'eliminazione definitiva e irreversibile. Il documento verra rimosso completamente dal sistema e dalle ricerche.

Ruolo del documento

Non tutti i documenti vanno trattati allo stesso modo. Una policy aziendale e un listino prezzi parlano lingue diverse: la policy va letta per concetti e paragrafi, il listino va consultato per righe e valori. Una sentenza va citata in modo puntuale (articolo, comma, dispositivo), una FAQ va recuperata come esempio concreto.

Per questo Queria, mentre processa un documento, lo classifica in uno o piu ruoli. Il ruolo determina come il documento viene segmentato, indicizzato e poi richiamato in risposta a una domanda. La classificazione e completamente automatica; tu carichi il file e basta. Il ruolo assegnato e visibile nella scheda del documento e puoi vederlo nelle citazioni in chat.

I cinque ruoli sono:

TRUTH — Conoscenza autorevole

Documenti che raccontano "come stanno le cose": manuali operativi, documentazione di prodotto, normative interpretate, policy aziendali, white paper, libri tecnici.

  • Come viene letto: segmentato per paragrafi e sezioni, mantenendo il contesto narrativo.
  • Cosa ottieni in chat: risposte discorsive che intrecciano informazioni da piu paragrafi, con citazioni [N] al passaggio originale.
  • Quando si usa: la maggior parte dei tuoi documenti aziendali finisce qui. E' il ruolo "default" in assenza di indizi specifici.

FORMAT — Modelli e modulistica

Documenti che mostrano una struttura da riprodurre piu che informazione da consultare: template di contratti, moduli vuoti, formulari, schemi.

  • Come viene letto: il sistema estrae la struttura (campi, sezioni, placeholder) separandola dal testo generico di contorno.
  • Cosa ottieni in chat: non vengono di norma citati nelle risposte conversazionali. Sono invece il "carburante" della Generazione Documenti: quando chiedi "genera un contratto di noleggio", il sistema parte dal FORMAT giusto e lo riempie con i dati estratti dagli altri documenti.
  • Quando si usa: ovunque ci sia un modello standard da compilare ripetutamente.

RULES — Regole vincolanti

Il ruolo piu delicato. Sono documenti prescrittivi che stabiliscono obblighi, sanzioni, scadenze, regolamenti applicabili: sentenze, decreti, regolamenti UE, articoli di legge, ordinanze, decisioni amministrative, circolari dell'Agenzia delle Entrate, regolamenti interni con effetto vincolante.

  • Come viene letto: il sistema riconosce la struttura articolo - comma - lettera tipica del linguaggio giuridico italiano e UE. Ogni articolo viene mantenuto come unita indivisibile. Per le sentenze, vengono indicizzati separatamente la massima (la regola stabilita) e il dispositivo (cosa il giudice ha deciso).
  • Cosa ottieni in chat:
    • Citazioni puntuali: non un generico "il contratto", ma art. 5 comma 2 del DLgs 231/2001 o Cass. Sez. Lav. n. 12345/2023.
    • Priorita sulle RULES quando la domanda riguarda obblighi o conformita: se chiedi "posso licenziare un dipendente in malattia?", il sistema preferisce articoli di legge e sentenze rispetto a una circolare HR interna.
    • Filtro automatico di vigenza: norme abrogate vengono escluse di default (puoi richiederle esplicitamente per ricerche storiche).
  • Quando si usa: in studi legali, fiscalisti, compliance, HR -- qualunque contesto in cui "cita la fonte" non e un dettaglio, ma un requisito.

Doppio ruolo TRUTH + RULES

Una sentenza ha due anime: la motivazione (perche il giudice ha deciso cosi -- TRUTH) e la massima/dispositivo (la regola che ne consegue -- RULES). Il sistema assegna entrambi i ruoli e indicizza i due aspetti separatamente. Cosi quando chiedi "perche la Cassazione ha deciso cosi?" ricevi la motivazione; quando chiedi "cosa stabilisce sul punto X?" ricevi la massima precisa.

OPERATIONAL — Dati strutturati

Documenti che hanno senso "per riga" piu che per testo libero: listini prezzi, anagrafiche fornitori e clienti, schede prodotto, bilanci in formato tabellare, KPI, time sheet, riconciliazioni.

  • Come viene letto: una riga = un'unita autonoma. Vengono preservati i valori (es. prodotto = Alpha, prezzo = 120 euro, disponibilita = in stock).
  • Cosa ottieni in chat: il sistema riconosce domande aggregative ("qual e il fatturato totale del 2025?", "quanti prodotti sotto 100 euro abbiamo?") e risponde con calcoli su dati strutturati, non con un riassunto narrativo. Per analisi puntuali ("qual e il prezzo del prodotto Alpha?") la risposta cita la riga esatta.
  • Quando si usa: ovunque il valore di un dato dipenda dalla sua posizione nella tabella e non solo dal testo.

EXAMPLES — Casi e scenari

Documenti dimostrativi che mostrano come applicare un concetto, una procedura o una regola: casi studio, scenari di applicazione, FAQ aziendali, esercizi risolti, knowledge base di supporto.

  • Come viene letto: una coppia Q&A o uno scenario completo viene mantenuto come unita. L'integrita del singolo caso e preservata.
  • Cosa ottieni in chat: l'assistente arricchisce la risposta con un esempio concreto quando la domanda lo permette ("ho una situazione simile a..."). Le citazioni del tipo EXAMPLES sono marcate visivamente in modo distintivo, cosi sai che stai leggendo un caso esempio e non una regola assoluta.
  • Quando si usa: supporto clienti, onboarding, materiali formativi, knowledge base interna di assistenza.

Documenti multi-ruolo

Molti documenti reali sono misti. Esempi:

DocumentoRuoli applicatiPerche
Sentenza con tabella di calcolo dannoRULES + OPERATIONALLa massima e RULES, la tabella dei valori e OPERATIONAL
Manuale operativo con FAQ in appendiceTRUTH + EXAMPLESIl corpo e TRUTH, le FAQ sono EXAMPLES
Policy aziendale con modello allegatoTRUTH + FORMATIl testo descrive la regola (TRUTH), il modulo allegato e FORMAT
Listino con condizioni generali in testaOPERATIONAL + TRUTHI prezzi sono OPERATIONAL, le condizioni narrative sono TRUTH

Il sistema individua automaticamente i ruoli compresenti e crea segmenti dedicati a ciascuno, cosi la stessa fonte puo essere citata in modo diverso a seconda della domanda.

Come verificare il ruolo assegnato

  1. Apri la scheda del documento dalla pagina Documenti.
  2. Nel pannello dettagli vedrai un campo Ruolo con uno o piu badge colorati.
  3. Cliccando sul badge ottieni la spiegazione del ruolo e dei chunk che il sistema ha generato per quel ruolo.

Quando ricevi una risposta in chat, anche le citazioni mostrano un'icona corrispondente al ruolo della fonte (es. una bilancia per RULES, una tabella per OPERATIONAL). E' un modo rapido per capire da dove arriva ogni informazione.

Cosa fare se la classificazione e sbagliata

La classificazione automatica funziona bene nella stragrande maggioranza dei casi, ma puo capitare di no -- specialmente per documenti molto specifici di settore. Hai due strade:

  • Segnala all'amministratore: puo forzare il ruolo manualmente su quel documento o definire una regola per cui tutti i documenti di un certo topic (o con un certo pattern di nome / path) vengano sempre classificati in un ruolo specifico. Vedi Wizard, Bulk e Path-rules per i dettagli operativi.
  • Sovrascrivi al volo in fase di caricamento: usando il Wizard di caricamento puoi confermare o cambiare il ruolo suggerito prima di lanciare l'elaborazione. Il sistema mostra anche un punteggio di confidenza (es. "RULES -- 87%") cosi capisci quanto e sicuro della propria scelta.

Perche ci interessa

Il ruolo non e una mera etichetta. Determina come l'AI usera quel documento per rispondere alle tue domande. Un listino classificato per errore come TRUTH produrra riassunti narrativi quando vorresti calcoli; una sentenza classificata come TRUTH non avra citazioni puntuali a articolo e comma. Quando i risultati ti sembrano "vicini ma non centrati", spesso il problema e li.

Documenti Standard vs Knowledge Base

Queria distingue tra due tipologie di documenti:

Documenti Standard

Sono i documenti caricati normalmente. Fanno parte dell'archivio aziendale e sono disponibili per le ricerche in base ai permessi e ai topic assegnati.

Documenti Knowledge Base

Sono documenti marcati come parte della Knowledge Base aziendale. Hanno caratteristiche speciali:

  • Sono permanenti e sempre prioritari nelle ricerche.
  • Rappresentano la conoscenza curata e autorevole dell'organizzazione.
  • Sono accessibili a tutti gli utenti con i permessi appropriati.

Per approfondire la differenza e capire quando usare l'una o l'altra tipologia, consulta la guida dedicata alla Knowledge Base.

OCR Automatico

Quando carichi un documento scansionato (PDF immagine) o un file immagine (JPG, PNG, TIFF), Queria attiva automaticamente il riconoscimento ottico dei caratteri (OCR):

  • Il sistema rileva automaticamente se il documento contiene testo reale o se e un'immagine.
  • Il motore OCR estrae il testo dalle immagini, incluse tabelle che vengono formattate in Markdown per preservarne la struttura.
  • Il testo estratto viene poi elaborato normalmente per la ricerca.
  • Una correzione AI post-OCR migliora la qualita del testo riconosciuto, sistemando parole spezzate, spazi mancanti ed errori comuni.
  • Non e necessaria alcuna azione manuale: il processo e completamente trasparente.

Sincronizzazione Cloud e Rete

Sincronizzazione Cloud

Dopo aver collegato un servizio cloud (Google Drive, OneDrive, SharePoint):

  1. Seleziona le cartelle da monitorare.
  2. Configura la frequenza di sincronizzazione.
  3. Il sistema verifica periodicamente la presenza di nuovi file o versioni aggiornate.
  4. I nuovi documenti vengono importati e elaborati automaticamente.

Sincronizzazione Rete Aziendale

Per le cartelle di rete:

  1. Configura il percorso e le credenziali di accesso.
  2. Imposta la pianificazione (oraria, giornaliera, settimanale).
  3. Queria accede alla cartella agli orari stabiliti e importa le novita.
  4. I documenti modificati vengono rielaborati automaticamente.

Deduplicazione

Queria previene i duplicati automaticamente: ogni file viene identificato tramite un hash univoco. Se carichi un file gia presente nella stessa organizzazione, il sistema restituisce il documento esistente senza creare un duplicato.

Best Practice per l'Organizzazione

  1. Assegna i topic in fase di caricamento: categorizzare subito i documenti migliora la qualita delle ricerche successive. Per gli Editor, l'assegnazione di almeno un topic e obbligatoria. Se hai un solo topic assegnato, viene selezionato automaticamente.
  2. Usa nomi file descrittivi: Queria utilizza anche il nome del file come metadato di ricerca. "Contratto_Rossi_2025.pdf" e piu utile di "doc1.pdf".
  3. Preferisci formati testo: quando possibile, carica documenti con testo reale (DOCX, PDF testo) invece di scansioni. La qualita della ricerca sara superiore.
  4. Verifica i documenti in errore: controlla il Monitor per identificare e risolvere tempestivamente i problemi di elaborazione.
  5. Usa la Knowledge Base per i documenti chiave: manuali, procedure, policy e altri documenti di riferimento dovrebbero essere nella KB.
  6. Sfrutta la sincronizzazione automatica: per cartelle che si aggiornano frequentemente, la sincronizzazione automatica evita il caricamento manuale ripetitivo.
  7. Archivia invece di eliminare: i documenti archiviati possono essere ripristinati. L'eliminazione definitiva e irreversibile.
  8. Cestino: gli Editor possono visualizzare e ripristinare documenti eliminati nei propri topic. La cancellazione permanente e lo svuotamento del cestino sono riservati agli Admin.

Queria v3.5.0 -- Ingestione documenti role-aware (canvas DSL)

Queria - Document Intelligence con Cog-RAG