Per Intelligent Document Processing (IDP) si intende un insieme di strumenti e soluzioni basati su tecniche di deep learning per automatizzare l'elaborazione dei documenti. Sfruttando le più recenti tecniche di intelligenza artificiale e visione artificiale, l’IDP è capace di gestire documenti (ad es. testo e-mail, PDF e scansioni) di ogni natura e di convertirli in dati strutturati. L’IDP automatizza l’elaborazione delle informazioni contenute nei documenti, comprendendo di cosa tratta il documento, quali informazioni contiene, estraendole e rendendole automaticamente fruibili al processo o reparto d’interesse.
L’IDP differisce dal riconoscimento ottico dei caratteri (OCR). Infatti, le soluzioni tradizionali di OCR mirano a trasformare un documento scansionato in testo machine-readable. Le soluzioni di IDP non solo leggono i documenti, ma estraggono, classificano ed esportano i dati rilevanti (dati chiave valore, tabelle, immagini, etc.) per abilitare ulteriori elaborazione o azioni intraprese sulla base dei risultati. Tutto ciò è possibile grazie alla sinergia di diverse tecnologie come OCR, Computer Vision, NLP e RPA. Tali tecnologie, utilizzate insieme, consentono di ottenere il massimo tasso di automazione.
Spesso, all’interno di un’azienda mancano le competenze specifiche richieste per realizzare soluzioni di questo tipo a discapito delle performance finali del sistema. Per questo motivo, le soluzioni di Intelligent Document Processing sono la soluzione a tali mancanze: racchiudono competenze e tecnologie specifiche in un unico prodotto, semplice da usare a da integrare.
Infatti, le soluzioni IDP tendono ad essere "non invasive" e facilmente integrabili nei sistemi, nelle applicazioni aziendali e nelle piattaforme esistenti. Offrendo spesso anche una gamma pre-configurata di soluzioni pronte all'uso fino ad implementazioni più complesse e personalizzate. L’offerta di casi d’uso pre-built consente di automatizzare o migliorare la qualità di un processo in tempi ridotti rispetto alle soluzioni tradizionali: da diversi mesi a pochi giorni. Anche i costi di ownership della soluzione sono fortemente ridotti, richiedendo pochi o nessun dato per il setup e un effort minimo per l’integrazione.
Ecco alcuni esempi di casi d’uso che spesso vengono forniti pre-configurati: elaborazione delle fatture, onboarding del cliente, elaborazione delle pratiche di mutuo, elaborazione di contratti o di ricevute di acquisto.
In molte soluzioni di Intelligent Document Processing, il primo passo è pre-elaborare l'immagine del documento che è stato ricevuto (ad es. tramite scansione o e-mail). La pre-elaborazione consente di migliorare le performance degli algoritmi di OCR/ICR e di conservare una versione “normalizzata” dell’immagine. L’obiettivo finale della pre-elaborazione è di migliorare la qualità e la leggibilità dell’immagine. Le tipiche operazioni di pre-processing possono coinvolgere la binarizzazione dell immagine, la correzione del angolo di rotazione, la standardizzazione della risoluzione dell imagine e diverse altre operazioni. Alcune soluzioni non necessitano di questa fase per poter elaborare il documento ma lo step è comunque utile per conservare una versione più leggibile e chiara del documento.
Le soluzioni di IDP utilizzano tecniche di Computer Vision per comprendere la struttura del documento e identificare elementi come testo, tabelle e immagini. Tipicamente questa fase può essere suddivisa in:
Durante questo processo, le soluzioni IDP creano essenzialmente una versione machine-readable del documento. Questa versione è così pronta per una successiva analisi automatica. Le soluzioni che non utilizzano il testo per i successivi step possono saltare o semplificare questa fase.
Il processo di classificazione del documento prevede di assegnare ad ogni sua pagina, o al documento nella sua interezza, una categoria di appartenenza in modo automatico.
La classificazione di un documento può avvenire seguendo diverse metodologie:
Nel flusso di lavoro di elaborazione intelligente dei documenti possono essere utilizzate tecniche di machine learning sia supervisionate che non. L’approccio non supervisionato ha un costo inferiore in fase di setup (non è necessaria la fase di data labeling) ma tipicamente offre un’accuratezza inferiore. Sulla base dell’algoritmo utilizzato, il modello può anche fornire all’utente uno score di affidabilità (Confidence Score) per rappresentare la sicurezza del modello rispetto alle sue predizioni. In base alle tecnologie utilizzate, questa fase può essere abilitante per l’estrazione o uno step opzionale.
L’estrazione delle informazioni contenute nel documento è una fase fondamentale, necessaria per l’automazione dei processi legati all’elaborazione documentale. In questo step, possono essere utilizzate le stesse metodologie presentate per la classificazione del documento (analisi del testo, dell’immagine o entrambe) con i relativi vantaggi o svantaggi.
Nei processi documentali, tra le operazioni più dispendiose in termini di tempi e costi è presente proprio l’estrazione delle informazioni chiave e la successiva immissione manuale.
Questo step mira a trasformare automaticamente i dati non strutturati presenti nel documento in dati strutturati facilmente fruibili dalle successive fasi o dai processi sottostanti. In questa fase è possibile estrarre molte tipologie di informazioni come: tabelle, immagini, firme ecc.
Nella maggioranza dei casi, le soluzioni di Intelligent Document Processing prevedono un meccanismo di scoring o confidenza utile per revisionare i dati identificati come potenzialmente errati. Quindi, per garantire l'accuratezza e l'integrità dei dati, le piattaforme IDP sfruttano la revisione umana, database esterni e vocabolari pre-configurati utili per convalidare i dati estratti dai documenti. Questo processo non solo garantisce la qualità dei dati, ma i dati non processati correttamente possono essere collezionati abilitando un apprendimento continuo del sistema (Human in the loop & Continuous learning).
Altro step importante, prima di rendere i dati fruibili, è rappresentato dall’arricchimento dei dati estratti. Tipicamente vengono sfruttati database o servizi esterni che consentono di aggiungere informazioni a quelle estratte dal documento al fine di avere dati più dettagliati e di qualità maggiore. Un esempio potrebbe essere il look up su un sistema esterno, a partire dal nome di un’azienda, per controllare lo stato di salute di un azienda.
Un ultimo aspetto rilevante prevede l’integrazione con i sistemi da cui provengono i dati e con i sistemi che dovranno fruirli. Spesso i sitemi di IDP offrono modalità molto semplici di integrazioni no code, implementate direttamente tramite la piattaforma o attraverso l’ausilio di strumenti di RPA. Questa fase è fondamentale per rendere facile il processo di integrazione e per avere una soluzione end-to-end che si interfacci con gli strumenti aziendali adottati.
Le soluzioni di Intelligent Document Processing consentono alle aziende di ottenere diversi vantaggi:
myBiros è una soluzione di Intelligent Document Processing che consente l’elaborazione automatica di documenti. Funzionalità core sono l’estrazione di informazioni e la classificazione automatica di documenti.
Tutto ciò è offerto tramite un set prebuilt di API pronte all’uso per i casi d’uso più comuni e la possibilità di riaddestrare l’intera pipeline (sia il motore di OCR che il sistema di interpretazione del documento) per casi custom. È molto semplice integrare myBiros in qualunque applicativo attraverso l’utilizzo delle API e la facile interazione con sistemi di RPA.
Sfruttando tecniche avanzate di deep learning che analizzano features multimodali è possibile elaborare tutte le tipologie documentali con un’unica soluzione. Il sistema utilizza modelli pre-addestrati, tecniche di data-augmentation e per tal motivo può essere addestrato con un volume ridotto di dati consentendo di automatizzare anche processi che coinvolgono un volume ridotto di documenti.
Tale soluzione prevede un meccanismo di scoring: il sistema consente di ridurre i falsi positivi abilitando la possibilità di revisionare i dati a bassa confidenza minimizzando gli errori. L’interazione con un utente umano consente di correggere gli errori del sistema continuando ad addestrarlo così da non ripetere gli errori commessi in passato (Human in the loop e continuous learning). L’elevata scalabilità dell’architettura cloud-based consente infine di elaborare moli fortemente variabili di documenti senza dover preventivamente allocare costose risorse.
Le caratteristiche citate finora permettono a myBiros di performare in modo ottimale su qualunque documento consentendo di automatizzare i processi più disparati. Se sei curioso di sapere come funziona myBiros al fine di semplificare l’elaborazione documentale, contattaci. Siamo pronti ad aiutarti!
Qui di seguito troverete un glossario che elenca e definisce i termini essenziali per comprendere e sfruttare al meglio l'automazione intelligente dei documenti.
Leggilo oraOgni reparto aziendale prevede la gestione di documenti, necessari per registrare informazioni, comunicare con clienti e fornitori e archiviare dati importanti. Se svolte manualmente, queste attività espongono l'azienda a numerosi rischi.
Leggilo oraGli errori dovuti al data entry manuale hanno un costo significativo per le aziende. È importante investire in processi di data entry affidabili e controlli di qualità adeguati, affinché si possa ovviare ad errori e conseguenti costi.
Leggilo oraL’onboarding del cliente è il processo attraverso cui un’azienda introduce un nuovo cliente al proprio prodotto o servizio. Il seguente articolo spiega cos’è l’onboarding digitale, la sua automazione e i vantaggi che ne conseguono.
Leggilo oraLa trasformazione digitale comprende l'implementazione di tecnologie innovative e la ridefinizione dei processi aziendali per automatizzare.
Leggilo oraMolte aziende gestiscono le spese ancora manualmente, provocando scarsa produttività da parte dei dipendenti. Oggi, la gestione delle spese può essere automatizzata, riducendo tempi, costi e attività ripetitive che causano frustrazione.
Leggilo ora