Estrazione di informazioni: soluzioni tradizionali vs moderne

Nel processo di elaborazione documenti, il task di estrazione delle informazioni prevede l’individuazione e l’immissione in sistemi informatici delle informazioni chiave presenti nei documenti. Il task di estrazione delle informazioni può essere effettuato su qualsiasi tipologia di documento: strutturato, semi strutturato e non strutturato.

Se prendiamo in considerazione una fattura, le informazioni di interesse da estrarre sono ad esempio: l’azienda che ha emesso la fattura, la data di emissione, l’indirizzo. Da un documento di identità, invece, l’estrazione delle informazioni riguarda i principali dati anagrafici come nome, cognome, residenza.

Una generica pipeline per la risoluzione di questo task prevede 3 step:

  • un primo step di riconoscimento della posizione del testo e la relativa trascrizione,
  • un secondo step di analisi di individuazione delle informazioni d’interesse
  • un terzo step, opzionale, di post processing dei risultati.
Pipeline generica di Estrazione Informazioni

L’estrazione delle informazioni presenti nei documenti rappresenta un’applicazione trasversale a tutti i settori. Il task prevede un intervento umano massivo, questo ha reso necessarie soluzioni in grado di automatizzare o semi-automatizzare il processo.

Soluzioni Tradizionali

Le soluzioni tradizionali di estrazioni delle informazioni da documenti si basano su approcci di tipo rule-based e template-matching. Nel caso di approcci template-matching all’immagine è sovrapposta una maschera in modo tale da filtrare il template del documento ed evidenziare i valori da estrarre. Invece, nel caso di approccio rule-based, le informazioni d’interesse sono estratte mediante regole statiche costruite a posteriori sull’output di un sistema di Optical Character Recognition (OCR). Questi tipi di approcci sono in grado di performare da soli e in sinergia su documenti strutturati e semi strutturati previa configurazione dei sistemi di data extraction da parte di un team tecnico. La configurazione è statica e prevede l’intervento del team tecnico per gestire ogni variazione e ogni nuova tipologia di documento.

Workflow – Soluzioni Tradizionali

Queste soluzioni rappresentano numerose limitazioni ed elevati costi di sviluppo e mantenimento. Inoltre, questa tipologia di approccio non riesce in nessun modo a gestire documenti non strutturati in quanto non è possibile stabilire a priori template e regole su questa tipologia documentale.

Soluzioni moderne

L’utilizzo di metodologie di apprendimento automatico ha reso possibile il superamento di molte limitazioni delle soluzioni tradizionali. Il cambio di paradigma porta a soluzioni interamente data driven. Il flusso di sviluppo e mantenimento di questo tipo di soluzioni assume la forma descritta dal seguente schema:

Workflow – Soluzioni basate su AI

Un generico approccio prevede l’addestramento di un sistema su un largo corpus di documenti in modo da acquisire una conoscenza generica del dominio di applicazione. L’obiettivo è avere un sistema che riesce a generalizzare su documenti non noti e che dunque non richieda costanti configurazioni al fine di reagire a variazioni dei formati o a nuovi documenti.

Le soluzioni di questo tipo spostano le voci di costo dalle continue configurazioni richieste per gestire i nuovi documenti alla raccolta e creazione di un dataset di valore in grado di poter descrivere le diverse casistiche del processo d’interesse.

Questo tipo di soluzioni può essere basato su diverse tecniche che fanno riferimento ai campi della Computer Vision, del Natural Language Processing. Le proposte più recenti prevedono l’utilizzo di reti neurali, le architetture che performano meglio in questi task sono di tipo transformers based e reti neurali a grafo.

Tu hai i documenti, noi la soluzione

myBiros è una soluzione di nuova generazione per l’automazione di processi che prevedono l’elaborazione di documenti. myBiros sfrutta le più moderne tecniche di deep learning per superare le limitazione delle soluzioni tradizionali. myBiros è una piattaforma no code di Document AI che offre casi d’uso pronti all’uso e la possibilità di effettuare il setup on the fly di nuovi casi d’uso con un ridotto numero di documenti di esempio.

Con myBiros è possibile ridurre i costi legati al processamento di documenti dovuti all’utilizzo di soluzioni tradizionali. myBiros offre un netto risparmio in termini di tempo, costi e risorse. Inoltre, le funzionalità offerte dalla piattaforma consentono l’abbattimento di costi relativi al reperimento di dati per il training dei modelli.

Tramite approcci di tipo Human in the Loop e Continuous Learning, myBiros offre la possibilità di migliorare costantemente le prestazioni dei modelli grazie al feedback umano, raggiungendo precisioni e qualità dei dati estratti senza precedenti.

L’approccio usato da myBiros è interamente basato sui dati. Questo rende l’intera pipeline completamente adattabile a domini verticali. Sfruttando approcci provenienti da Computer Vision e Natural Language Processing, myBiros è in grado di interpretare il documento utilizzandone le diverse caratteristiche: il testo contenuto, il layout e l’immagine stessa del documento.

Vuoi scoprire di più sulle nostre soluzioni? Contattaci e prova la nostra demo, ti aspettiamo!