Modelli generativi
I modelli generativi costituiscono l’evoluzione più avanzata nell’estrazione personalizzata dei dati dai documenti, grazie all’utilizzo dell’intelligenza artificiale generativa. Questi modelli consentono di formulare richieste in linguaggio naturale, permettendo all’utente di specificare con precisione quali dati estrarre e in quale formato desidera riceverli.
A differenza delle soluzioni tradizionali di Intelligent Document Processing (IDP), che si basano su regole predefinite o modelli addestrati su layout specifici, i modelli generativi offrono una maggiore flessibilità. Possono adattarsi a documenti con strutture molto diverse tra loro e rispondere a domande o richieste complesse senza la necessità di personalizzazioni tecniche o training aggiuntivi. In questo modo, l’estrazione dei dati diventa più intuitiva, dinamica e orientata alle reali esigenze dell’utente.
Quando devo usare i modelli generativi?
I modelli generativi sono la soluzione ideale quando si desidera estrarre dati personalizzati da documenti, senza dover definire regole fisse o adattare il sistema a ogni nuovo layout. Sono particolarmente utili in tutti quei casi in cui:
- È necessario estrarre informazioni da documenti con strutture diverse o non standardizzate.
- Si desidera ricevere i dati estratti in un formato personalizzato, scegliendo ad esempio quali campi restituire e in quale lingua.
- Si vuole velocizzare il processo di configurazione, sfruttando richieste in linguaggio naturale senza dover intervenire tecnicamente sul modello.
Limiti attuali
È importante considerare che, nelle funzionalità attualmente disponibili, il modello generativo opera come un sistema OCR avanzato: si occupa cioè di riconoscere ed estrarre testi e dati dai documenti in modo intelligente, ma non è in grado di svolgere elaborazioni complesse come generare formule, riassunti o sintesi dei contenuti.
Il modello permette comunque un’ampia personalizzazione nell’estrazione dei dati, offrendo la possibilità di definire sia il formato di output che la lingua desiderata.
Requisiti di input del modello personalizzato
Prima di tutto, verificate che il set di dati di training rispetti i requisiti di input:
- Per ottenere risultati ottimali, vi consigliamo di fornire immagini nitide o analisi di alta qualità per ciascun documento.
- È possibile elaborare i seguenti formati di file: PDF, JPEG/JPG, PNG, BMP, TIFF, HEIF.
- Per i file PDF e TIFF, la capacità di elaborazione massima è di 2000 pagine. Inoltre, assicuratevi che le dimensioni del file per l’analisi dei documenti non superino i 500 MB.
- Le dimensioni dell’immagine devono rientrare nell’intervallo tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
- Qualora i file PDF fossero protetti da password, è fondamentale rimuovere il blocco prima di inviarli.
- Per l’estrazione del testo, considerate che l’altezza minima deve essere di 12 pixel in un’immagine da 1024 x 768 pixel, equivalente a circa 8 punti a 150 punti per pollice (DPI).
Creazione di un modello generativo
Per creare un nuovo modello personalizzato è necessario selezionare dal menu di sinistra la sezione “Modelli generativi”, e all’apertura dell’interfaccia premere il pulsante “Crea modello”.
Una volta premuto il pulsante “Crea modello”, apparirà una finestra pop-up nel quale bisognerà inserire il nome del modello generativo. Questo sarà utilizzato come identificativo del modello.
Una volta creato il nuovo modello generativo, è necessario procedere al caricamento di almeno un documento al fine di avviare il processo di addestramento.
Addestramento di un modello generativo
Una volta caricato il documento, è necessario cliccare sulla freccia blu per accedere all’editor di configurazione della lettura. All’interno dell’editor, la schermata si suddivide come segue:
- Area centrale: visualizza il documento caricato.
- Pannello laterale destro: contiene i seguenti blocchi:
- Dettaglio file: mostra le informazioni relative al file caricato.
- Ricerche: consente di creare gli script per l’estrazione personalizzata delle informazioni dal documento.
- Risultati: visualizza i risultati prodotti dagli script creati nel blocco “Ricerche”, applicati al documento attualmente visualizzato.
Per creare uno script di lettura, è necessario cliccare sul pulsante “+” all’interno del blocco Ricerche. Verrà visualizzata una finestra in cui inserire le seguenti informazioni:
- Nome della ricerca: specifica il nome del dato che desideri estrarre (ad esempio: Nome, DataDiNascita, CodiceArticolo). Questo nome, oltre ad essere utilizzato come riferimento all’interno della ricerca, verrà utilizzato come chiave nel file di output associato al valore estratto.
- Regola: definisci la regola di estrazione, ovvero la richiesta specifica da effettuare al modello generativo (ad esempio: “Cerca la data di nascita del candidato e restituiscila in formato dd/mm/yyyy”).
Una volta inserite tutte le ricerche desiderate, ripetendo l’operazione descritta per ciascun dato da estrarre, è sufficiente cliccare sul pulsante Esegui in alto a destra per avviare il test delle ricerche configurate.
Dopo aver eseguito le ricerche, Retica restituisce le informazioni identificate nel documento all’interno del blocco Risultati.
Come illustrato nell’immagine soprastante, il sistema visualizza un blocco per ciascuna ricerca configurata. Ad esempio:
-
DataDiNascita: il blocco risulta vuoto, poiché il documento non contiene questa informazione.
-
Nome: il blocco mostra sia il nome che il cognome del candidato, in quanto la regola impostata richiedeva l’estrazione di entrambi i dati.
Una volta create tutte le regole, e averle testate, è necessario salvare la configurazione per utilizzarla con altri documenti.
Utilizzo dei modelli generativi creati
Per estrarre le informazioni da un documento sfruttando un modello generativo creato in precedenza, è necessario selezionare nel menu di sinistra la voce “Avvia scansione” e selezionare il modello creato tra quelli disponibili nella sezione “Modelli generativi”.
Dopo aver scelto il modello, è necessario importare i documenti desiderati. Per istruzioni dettagliate su come importare i documenti correttamente, visita la pagina: https://retica.ai/importazione-documenti/
Una volta completato l’importazione dei documenti e il loro processo di elaborazione, sarà possibile esportare le informazioni estratte nei formati disponibili.
Da tenere presente che solo le informazioni associate alle etichette create nei modelli generativi saranno estratte. Se l’estrazione dei testi non è precisa come desiderato, è consigliabile rivedere la configurazione del modello generativo.