Gestione Documenti
Queria offre molteplici modalita per importare documenti nella piattaforma. Una volta caricati, i documenti vengono elaborati automaticamente e resi disponibili per la ricerca AI. Questa guida copre tutte le opzioni di caricamento, i formati supportati e gli strumenti di gestione.
Modalita di Caricamento
La pagina Documenti presenta diverse schede (tab) per le varie modalita di importazione.
Tab Upload File
Il metodo piu diretto per caricare documenti dal tuo computer.
- Drag & drop: trascina uno o piu file direttamente nell'area di caricamento.
- Click per selezionare: clicca sull'area di caricamento per aprire il selettore file del sistema operativo.
- Caricamento multiplo: puoi selezionare e caricare piu file contemporaneamente.
Ogni file viene caricato con una barra di progresso individuale. Al termine del caricamento, il sistema avvia automaticamente l'elaborazione.
Tab Cloud Storage
Importa documenti dai tuoi servizi cloud aziendali:
- Google Drive: connetti il tuo account Google e naviga tra cartelle e file. Puoi selezionare singoli file o intere cartelle.
- OneDrive: accedi ai file del tuo account Microsoft OneDrive personale o aziendale.
- SharePoint: naviga tra i siti SharePoint della tua organizzazione e importa documenti dalle librerie condivise.
Una volta collegato un account cloud, puoi abilitare la sincronizzazione automatica: Queria controllera periodicamente le cartelle selezionate e importera automaticamente i nuovi file o le versioni aggiornate.
Tab Rete Aziendale
Importa documenti direttamente dalle cartelle di rete della tua organizzazione:
- Cartelle SMB/CIFS: specifica il percorso di rete (ad esempio
\\server\condivisione\cartella) e le credenziali di accesso. - Accesso VPN: se la tua rete richiede una connessione VPN, Queria supporta la configurazione di tunnel per raggiungere le risorse interne.
- Sincronizzazione programmata: configura una pianificazione per la sincronizzazione automatica delle cartelle di rete. Il sistema rileva nuovi file e modifiche in modo trasparente.
Tab URL
Importa il contenuto di una pagina web fornendo il suo indirizzo:
- Inserisci l'URL completo della pagina.
- Queria scarica il contenuto, lo analizza e lo rende disponibile per la ricerca.
- Utile per importare articoli, documentazione online o pagine informative.
Tab JSONL
Per importazioni massive di dati pre-strutturati:
- Carica un file in formato JSONL (JSON Lines) dove ogni riga rappresenta un documento con i suoi metadati.
- Ideale per migrazioni da altri sistemi o per importazioni programmatiche.
- Ogni record puo includere titolo, contenuto, metadati personalizzati e assegnazione a topic.
Formati Supportati
| Formato | Estensione | Note |
|---|---|---|
.pdf | Supporto completo, inclusi PDF scansionati (via OCR) | |
| Word | .docx | Testo, tabelle, immagini incorporate |
| Excel | .xlsx | Fogli multipli, tabelle strutturate |
| PowerPoint | .pptx | Testo dalle slide |
| Testo | .txt | Testo semplice |
| Markdown | .md | Formattazione preservata |
| CSV | .csv | Dati tabulari |
| JSON | .json | Dati strutturati |
| OpenDocument | .odt | Formato aperto |
| Immagini | .jpg, .png, .tiff | Elaborazione automatica con OCR |
Stati di Elaborazione
Ogni documento attraversa una serie di stati durante l'elaborazione:
| Stato | Icona | Descrizione |
|---|---|---|
| Caricato | Cerchio vuoto | Il file e stato ricevuto dal sistema, in attesa di elaborazione. |
| In elaborazione | Spinner animato | Il sistema sta analizzando il documento: estrazione testo, OCR (se necessario), suddivisione in segmenti, generazione degli embedding vettoriali. |
| Pronto | Spunta verde | Il documento e stato elaborato con successo ed e disponibile per la ricerca AI. |
| Errore | Triangolo rosso | Si e verificato un problema durante l'elaborazione. Puoi visualizzare i dettagli dell'errore e tentare una rielaborazione. |
Tempi di elaborazione
Un documento di 10-20 pagine viene elaborato in circa 30 secondi. Documenti piu lunghi o contenenti molte immagini possono richiedere qualche minuto.
Monitor di Elaborazione
La sezione Monitor ti permette di seguire in tempo reale il progresso di elaborazione di tutti i documenti:
- Visualizza quanti documenti sono in coda, in elaborazione e completati.
- Controlla la percentuale di avanzamento per ogni documento.
- Identifica rapidamente eventuali errori e accedi ai dettagli per la risoluzione.
Azioni sui Documenti
Per ogni documento nella lista puoi eseguire diverse operazioni:
- Visualizza: apri un'anteprima del documento originale o scaricalo.
- Vedi segmenti: consulta come il sistema ha suddiviso il documento in segmenti (chunk) per la ricerca. Utile per verificare che l'elaborazione sia avvenuta correttamente.
- Rielabora: riavvia l'elaborazione del documento. Utile se il documento era in errore o se desideri aggiornare i segmenti.
- Archivia: sposta il documento nell'archivio. Non sara piu incluso nelle ricerche ma restera disponibile per la consultazione. Puoi ripristinarlo in qualsiasi momento.
- Elimina: rimuove il documento (soft delete). Puo essere recuperato dal cestino.
- Elimina definitivamente: rimuove il documento e tutti i suoi segmenti in modo irreversibile (solo per amministratori).
Attenzione
L'eliminazione definitiva e irreversibile. Il documento verra rimosso completamente dal sistema e dalle ricerche.
Documenti Standard vs Knowledge Base
Queria distingue tra due tipologie di documenti:
Documenti Standard
Sono i documenti caricati normalmente. Fanno parte dell'archivio aziendale e sono disponibili per le ricerche in base ai permessi e ai topic assegnati.
Documenti Knowledge Base
Sono documenti marcati come parte della Knowledge Base aziendale. Hanno caratteristiche speciali:
- Sono permanenti e sempre prioritari nelle ricerche.
- Rappresentano la conoscenza curata e autorevole dell'organizzazione.
- Sono accessibili a tutti gli utenti con i permessi appropriati.
Per approfondire la differenza e capire quando usare l'una o l'altra tipologia, consulta la guida dedicata alla Knowledge Base.
OCR Automatico
Quando carichi un documento scansionato (PDF immagine) o un file immagine (JPG, PNG, TIFF), Queria attiva automaticamente il riconoscimento ottico dei caratteri (OCR):
- Il sistema rileva automaticamente se il documento contiene testo reale o se e un'immagine.
- Il motore OCR estrae il testo dalle immagini, incluse tabelle che vengono formattate in Markdown per preservarne la struttura.
- Il testo estratto viene poi elaborato normalmente per la ricerca.
- Una correzione AI post-OCR migliora la qualita del testo riconosciuto, sistemando parole spezzate, spazi mancanti ed errori comuni.
- Non e necessaria alcuna azione manuale: il processo e completamente trasparente.
Sincronizzazione Cloud e Rete
Sincronizzazione Cloud
Dopo aver collegato un servizio cloud (Google Drive, OneDrive, SharePoint):
- Seleziona le cartelle da monitorare.
- Configura la frequenza di sincronizzazione.
- Il sistema verifica periodicamente la presenza di nuovi file o versioni aggiornate.
- I nuovi documenti vengono importati e elaborati automaticamente.
Sincronizzazione Rete Aziendale
Per le cartelle di rete:
- Configura il percorso e le credenziali di accesso.
- Imposta la pianificazione (oraria, giornaliera, settimanale).
- Queria accede alla cartella agli orari stabiliti e importa le novita.
- I documenti modificati vengono rielaborati automaticamente.
Deduplicazione
Queria previene i duplicati automaticamente: ogni file viene identificato tramite un hash univoco. Se carichi un file gia presente nella stessa organizzazione, il sistema restituisce il documento esistente senza creare un duplicato.
Best Practice per l'Organizzazione
- Assegna i topic in fase di caricamento: categorizzare subito i documenti migliora la qualita delle ricerche successive. Per gli Editor, l'assegnazione di almeno un topic e obbligatoria. Se hai un solo topic assegnato, viene selezionato automaticamente.
- Usa nomi file descrittivi: Queria utilizza anche il nome del file come metadato di ricerca. "Contratto_Rossi_2025.pdf" e piu utile di "doc1.pdf".
- Preferisci formati testo: quando possibile, carica documenti con testo reale (DOCX, PDF testo) invece di scansioni. La qualita della ricerca sara superiore.
- Verifica i documenti in errore: controlla il Monitor per identificare e risolvere tempestivamente i problemi di elaborazione.
- Usa la Knowledge Base per i documenti chiave: manuali, procedure, policy e altri documenti di riferimento dovrebbero essere nella KB.
- Sfrutta la sincronizzazione automatica: per cartelle che si aggiornano frequentemente, la sincronizzazione automatica evita il caricamento manuale ripetitivo.
- Archivia invece di eliminare: i documenti archiviati possono essere ripristinati. L'eliminazione definitiva e irreversibile.
- Cestino: gli Editor possono visualizzare e ripristinare documenti eliminati nei propri topic. La cancellazione permanente e lo svuotamento del cestino sono riservati agli Admin.
Queria v3.1.0 -- Piattaforma di Document Intelligence