Nel processo di elaborazione documenti, il task di estrazione delle informazioni prevede l’individuazione e l’immissione in sistemi informatici delle informazioni chiave presenti nei documenti. Il task di estrazione delle informazioni può essere effettuato su qualsiasi tipologia di documento: strutturato, semi strutturato e non strutturato.
Se prendiamo in considerazione una fattura, le informazioni di interesse da estrarre sono ad esempio: l’azienda che ha emesso la fattura, la data di emissione, l’indirizzo. Da un documento di identità, invece, l’estrazione delle informazioni riguarda i principali dati anagrafici come nome, cognome, residenza.
Una generica pipeline per la risoluzione di questo task prevede 3 step:
L’estrazione delle informazioni presenti nei documenti rappresenta un’applicazione trasversale a tutti i settori. Il task prevede un intervento umano massivo, questo ha reso necessarie soluzioni in grado di automatizzare o semi-automatizzare il processo.
Le soluzioni tradizionali di estrazioni delle informazioni da documenti si basano su approcci di tipo rule-based e template-matching. Nel caso di approcci template-matching all’immagine è sovrapposta una maschera in modo tale da filtrare il template del documento ed evidenziare i valori da estrarre. Invece, nel caso di approccio rule-based, le informazioni d’interesse sono estratte mediante regole statiche costruite a posteriori sull’output di un sistema di Optical Character Recognition (OCR). Questi tipi di approcci sono in grado di performare da soli e in sinergia su documenti strutturati e semi strutturati previa configurazione dei sistemi di data extraction da parte di un team tecnico. La configurazione è statica e prevede l’intervento del team tecnico per gestire ogni variazione e ogni nuova tipologia di documento.
Queste soluzioni rappresentano numerose limitazioni ed elevati costi di sviluppo e mantenimento. Inoltre, questa tipologia di approccio non riesce in nessun modo a gestire documenti non strutturati in quanto non è possibile stabilire a priori template e regole su questa tipologia documentale.
L’utilizzo di metodologie di apprendimento automatico ha reso possibile il superamento di molte limitazioni delle soluzioni tradizionali. Il cambio di paradigma porta a soluzioni interamente data driven. Il flusso di sviluppo e mantenimento di questo tipo di soluzioni assume la forma descritta dal seguente schema:
Un generico approccio prevede l’addestramento di un sistema su un largo corpus di documenti in modo da acquisire una conoscenza generica del dominio di applicazione. L’obiettivo è avere un sistema che riesce a generalizzare su documenti non noti e che dunque non richieda costanti configurazioni al fine di reagire a variazioni dei formati o a nuovi documenti.
Le soluzioni di questo tipo spostano le voci di costo dalle continue configurazioni richieste per gestire i nuovi documenti alla raccolta e creazione di un dataset di valore in grado di poter descrivere le diverse casistiche del processo d’interesse.
Questo tipo di soluzioni può essere basato su diverse tecniche che fanno riferimento ai campi della Computer Vision, del Natural Language Processing. Le proposte più recenti prevedono l’utilizzo di reti neurali, le architetture che performano meglio in questi task sono di tipo transformers based e reti neurali a grafo.
myBiros è una soluzione di nuova generazione per l’automazione di processi che prevedono l’elaborazione di documenti. myBiros sfrutta le più moderne tecniche di deep learning per superare le limitazione delle soluzioni tradizionali. myBiros è una piattaforma no code di Document AI che offre casi d’uso pronti all’uso e la possibilità di effettuare il setup on the fly di nuovi casi d’uso con un ridotto numero di documenti di esempio.
Con myBiros è possibile ridurre i costi legati al processamento di documenti dovuti all’utilizzo di soluzioni tradizionali. myBiros offre un netto risparmio in termini di tempo, costi e risorse. Inoltre, le funzionalità offerte dalla piattaforma consentono l’abbattimento di costi relativi al reperimento di dati per il training dei modelli.
Tramite approcci di tipo Human in the Loop e Continuous Learning, myBiros offre la possibilità di migliorare costantemente le prestazioni dei modelli grazie al feedback umano, raggiungendo precisioni e qualità dei dati estratti senza precedenti.
L’approccio usato da myBiros è interamente basato sui dati. Questo rende l’intera pipeline completamente adattabile a domini verticali. Sfruttando approcci provenienti da Computer Vision e Natural Language Processing, myBiros è in grado di interpretare il documento utilizzandone le diverse caratteristiche: il testo contenuto, il layout e l’immagine stessa del documento.
Vuoi scoprire di più sulle nostre soluzioni? Contattaci, ti aspettiamo!
Qui di seguito troverete un glossario che elenca e definisce i termini essenziali per comprendere e sfruttare al meglio l'automazione intelligente dei documenti.
Leggilo oraOgni reparto aziendale prevede la gestione di documenti, necessari per registrare informazioni, comunicare con clienti e fornitori e archiviare dati importanti. Se svolte manualmente, queste attività espongono l'azienda a numerosi rischi.
Leggilo oraGli errori dovuti al data entry manuale hanno un costo significativo per le aziende. È importante investire in processi di data entry affidabili e controlli di qualità adeguati, affinché si possa ovviare ad errori e conseguenti costi.
Leggilo oraL’onboarding del cliente è il processo attraverso cui un’azienda introduce un nuovo cliente al proprio prodotto o servizio. Il seguente articolo spiega cos’è l’onboarding digitale, la sua automazione e i vantaggi che ne conseguono.
Leggilo oraLa trasformazione digitale comprende l'implementazione di tecnologie innovative e la ridefinizione dei processi aziendali per automatizzare.
Leggilo oraMolte aziende gestiscono le spese ancora manualmente, provocando scarsa produttività da parte dei dipendenti. Oggi, la gestione delle spese può essere automatizzata, riducendo tempi, costi e attività ripetitive che causano frustrazione.
Leggilo ora