Intelligent Document Processing (IDP)

Per Intelligent Document Processing si intende un insieme di strumenti e soluzioni basate su tecniche di deep learning in grado di automatizzare l'elaborazione di tutte le tipologie di documenti.

Francesco Cavina

CEO & Co-Founder

Per Intelligent Document Processing (IDP) si intende un insieme di strumenti e soluzioni basati su tecniche di deep learning per automatizzare l'elaborazione dei documenti. Sfruttando le più recenti tecniche di intelligenza artificiale e visione artificiale, l’IDP è capace di gestire documenti (ad es. testo e-mail, PDF e scansioni) di ogni natura e di convertirli in dati strutturati. L’IDP automatizza l’elaborazione delle informazioni contenute nei documenti, comprendendo di cosa tratta il documento, quali informazioni contiene, estraendole e rendendole automaticamente fruibili al processo o reparto d’interesse.

L’IDP differisce dal riconoscimento ottico dei caratteri (OCR). Infatti, le soluzioni tradizionali di OCR mirano a trasformare un documento scansionato in testo machine-readable. Le soluzioni di IDP non solo leggono i documenti, ma estraggono, classificano ed esportano i dati rilevanti (dati chiave valore, tabelle, immagini, etc.) per abilitare ulteriori elaborazione o azioni intraprese sulla base dei risultati. Tutto ciò è possibile grazie alla sinergia di diverse tecnologie come OCR, Computer Vision, NLP e RPA. Tali tecnologie, utilizzate insieme, consentono di ottenere il massimo tasso di automazione.

Spesso, all’interno di un’azienda mancano le competenze specifiche richieste per realizzare soluzioni di questo tipo a discapito delle performance finali del sistema. Per questo motivo, le soluzioni di Intelligent Document Processing sono la soluzione a tali mancanze: racchiudono competenze e tecnologie specifiche in un unico prodotto, semplice da usare a da integrare.

Infatti, le soluzioni IDP tendono ad essere "non invasive" e facilmente integrabili nei sistemi, nelle applicazioni aziendali e nelle piattaforme esistenti. Offrendo spesso anche una gamma pre-configurata di soluzioni pronte all'uso fino ad implementazioni più complesse e personalizzate. L’offerta di casi d’uso pre-built consente di automatizzare o migliorare la qualità di un processo in tempi ridotti rispetto alle soluzioni tradizionali: da diversi mesi a pochi giorni. Anche i costi di ownership della soluzione sono fortemente ridotti, richiedendo pochi o nessun dato per il setup e un effort minimo per l’integrazione.

Ecco alcuni esempi di casi d’uso che spesso vengono forniti pre-configurati: elaborazione delle fatture, onboarding del cliente, elaborazione delle pratiche di mutuo, elaborazione di contratti o di ricevute di acquisto.

Intelligent Document Processing: le fasi

Pre processing dell’immagine

In molte soluzioni di Intelligent Document Processing, il primo passo è pre-elaborare l'immagine del documento che è stato ricevuto (ad es. tramite scansione o e-mail). La pre-elaborazione consente di migliorare le performance degli algoritmi di OCR/ICR e di conservare una versione “normalizzata” dell’immagine. L’obiettivo finale della pre-elaborazione è di migliorare la qualità e la leggibilità dell’immagine. Le tipiche operazioni di pre-processing possono coinvolgere la binarizzazione dell immagine, la correzione del angolo di rotazione, la standardizzazione della risoluzione dell imagine e diverse altre operazioni. Alcune soluzioni non necessitano di questa fase per poter elaborare il documento ma lo step è comunque utile per conservare una versione più leggibile e chiara del documento.

Identificazione del testo dal documento e analisi del layout

Le soluzioni di IDP utilizzano tecniche di Computer Vision per comprendere la struttura del documento e identificare elementi come testo, tabelle e immagini. Tipicamente questa fase può essere suddivisa in:

Layout analysis: step necessario per l’identificazione della struttura del documento (es. paragrafi e intestazioni), delle tabelle ed immagini contenute;
OCR: necessaria per la lettura del documento. Tipicamente utile per ulteriori elaborazioni previste dal processo.

Durante questo processo, le soluzioni IDP creano essenzialmente una versione machine-readable del documento. Questa versione è così pronta per una successiva analisi automatica. Le soluzioni che non utilizzano il testo per i successivi step possono saltare o semplificare questa fase.

Classificazione del documento

Il processo di classificazione del documento prevede di assegnare ad ogni sua pagina, o al documento nella sua interezza, una categoria di appartenenza in modo automatico.

La classificazione di un documento può avvenire seguendo diverse metodologie:

attraverso la trascrizione e la successiva analisi del testo contenuto al suo interno;
attraverso l’analisi dell’immagine del documento;
con tecniche ibride che prevedono di analizzare sia il testo che la sua immagine.

Nel flusso di lavoro di elaborazione intelligente dei documenti possono essere utilizzate tecniche di machine learning sia supervisionate che non. L’approccio non supervisionato ha un costo inferiore in fase di setup (non è necessaria la fase di data labeling) ma tipicamente offre un’accuratezza inferiore. Sulla base dell’algoritmo utilizzato, il modello può anche fornire all’utente uno score di affidabilità (Confidence Score) per rappresentare la sicurezza del modello rispetto alle sue predizioni. In base alle tecnologie utilizzate, questa fase può essere abilitante per l’estrazione o uno step opzionale.

Estrazione delle informazioni

L’estrazione delle informazioni contenute nel documento è una fase fondamentale, necessaria per l’automazione dei processi legati all’elaborazione documentale. In questo step, possono essere utilizzate le stesse metodologie presentate per la classificazione del documento (analisi del testo, dell’immagine o entrambe) con i relativi vantaggi o svantaggi.

Nei processi documentali, tra le operazioni più dispendiose in termini di tempi e costi è presente proprio l’estrazione delle informazioni chiave e la successiva immissione manuale.

Questo step mira a trasformare automaticamente i dati non strutturati presenti nel documento in dati strutturati facilmente fruibili dalle successive fasi o dai processi sottostanti. In questa fase è possibile estrarre molte tipologie di informazioni come: tabelle, immagini, firme ecc.

Validazione dei risultati

Nella maggioranza dei casi, le soluzioni di Intelligent Document Processing prevedono un meccanismo di scoring o confidenza utile per revisionare i dati identificati come potenzialmente errati. Quindi, per garantire l'accuratezza e l'integrità dei dati, le piattaforme IDP sfruttano la revisione umana, database esterni e vocabolari pre-configurati utili per convalidare i dati estratti dai documenti. Questo processo non solo garantisce la qualità dei dati, ma i dati non processati correttamente possono essere collezionati abilitando un apprendimento continuo del sistema (Human in the loop & Continuous learning).

Arricchimento dei risultati

Altro step importante, prima di rendere i dati fruibili, è rappresentato dall’arricchimento dei dati estratti. Tipicamente vengono sfruttati database o servizi esterni che consentono di aggiungere informazioni a quelle estratte dal documento al fine di avere dati più dettagliati e di qualità maggiore. Un esempio potrebbe essere il look up su un sistema esterno, a partire dal nome di un’azienda, per controllare lo stato di salute di un azienda.

Integrazione

Un ultimo aspetto rilevante prevede l’integrazione con i sistemi da cui provengono i dati e con i sistemi che dovranno fruirli. Spesso i sitemi di IDP offrono modalità molto semplici di integrazioni no code, implementate direttamente tramite la piattaforma o attraverso l’ausilio di strumenti di RPA. Questa fase è fondamentale per rendere facile il processo di integrazione e per avere una soluzione end-to-end che si interfacci con gli strumenti aziendali adottati.

Benefici

Le soluzioni di Intelligent Document Processing consentono alle aziende di ottenere diversi vantaggi:

Risparmio diretto sui costi
Sfruttando architetture scalabili e performanti si riducono tempi e costi, abbattendo drasticamente l’effort per elaborare grandi volumi di dati;
Riduzione attività manuali ripetitive
Grazie all’Intelligenza Artificiale si riduce al minimo la necessità di un intervento manuale per elaborare i documenti;
Qualità dei dati superiore
Grazie all apprendimento continuo e alla validazione migliora la qualità dei dati, abbattendo drasticamente gli errori;
Inizia ad elaborare velocemente i dati
Le soluzioni IDP sono facilmente integrabili tramite meccanismi di RPA, spesso 5-10 volte più veloci e semplici da integrare rispetto ad altri approcci;
Elabora qualsiasi documento
Grazie all’ Intelligenza Artificiale è possibile gestire documenti di ogni tipo strutturati, semi-strutturati e non strutturati;
Automazione completa
Grazie alla semplicità con cui l’ IDP si integra con altre aree dell'azienda si realizza facilmente una soluzione RPA completamente integrata senza la necessità di costosi aggiornamenti;
Produttività migliorata
L’IDP aiuta le organizzazioni ad aumentare la produttività e ridurre il tempo dedicato alle attività ripetitive, migliorando la qualità dell’ambiente di lavoro;
Facile da usare per le aziende
Grazie ai casi d'uso preconfezionati tra cui scegliere, l’avvio e l’integrazione di casi d’uso più comuni è più semplice e veloce.

myBiros e benefici

myBiros è una soluzione di Intelligent Document Processing che consente l’elaborazione automatica di documenti. Funzionalità core sono l’estrazione di informazioni e la classificazione automatica di documenti.

Tutto ciò è offerto tramite un set prebuilt di API pronte all’uso per i casi d’uso più comuni e la possibilità di riaddestrare l’intera pipeline (sia il motore di OCR che il sistema di interpretazione del documento) per casi custom. È molto semplice integrare myBiros in qualunque applicativo attraverso l’utilizzo delle API e la facile interazione con sistemi di RPA.

Sfruttando tecniche avanzate di deep learning che analizzano features multimodali è possibile elaborare tutte le tipologie documentali con un’unica soluzione. Il sistema utilizza modelli pre-addestrati, tecniche di data-augmentation e per tal motivo può essere addestrato con un volume ridotto di dati consentendo di automatizzare anche processi che coinvolgono un volume ridotto di documenti.

Tale soluzione prevede un meccanismo di scoring: il sistema consente di ridurre i falsi positivi abilitando la possibilità di revisionare i dati a bassa confidenza minimizzando gli errori. L’interazione con un utente umano consente di correggere gli errori del sistema continuando ad addestrarlo così da non ripetere gli errori commessi in passato (Human in the loop e continuous learning). L’elevata scalabilità dell’architettura cloud-based consente infine di elaborare moli fortemente variabili di documenti senza dover preventivamente allocare costose risorse.

Le caratteristiche citate finora permettono a myBiros di performare in modo ottimale su qualunque documento consentendo di automatizzare i processi più disparati. Se sei curioso di sapere come funziona myBiros al fine di semplificare l’elaborazione documentale, contattaci. Siamo pronti ad aiutarti!

‍