
Glossario Intelligent Document Processing
Qui di seguito troverete un glossario che elenca e definisce i termini essenziali per comprendere e sfruttare al meglio l'automazione intelligente dei documenti.
Classificazione dei documenti
La classificazione dei documenti consiste nell’assegnare una o più classi o categorie ad un documento.
Documento strutturato
Si tratta di un documento che segue uno schema. In questo caso, il layout e design (colori, font e immagini) sono simili tra le varie copie di documento. Un esempio di documento strutturato è il documento d’identità dove ogni singola copia ha lo stesso formato.
Documento semi-strutturato
Si tratta di un documento che ha la caratteristica di contenere un certo tipo di informazioni note a priori, le quali possono cambiare posizione e formato all’interno del documento stesso. L’esempio più classico è una fattura.
Documento non strutturato
Si tratta di un documento che non segue alcun vincolo in termini di formato o contenuto. Un esempio concreto di documento non strutturato è dato da un contratto.
Errore umano
Si tratta di errori non pianificati causati dall’uomo. Questi errori riducono la qualità, la sicurezza e la precisione di una determinata attività.
Estrazione di informazioni
L’estrazione di informazioni consiste nell’individuare e recuperare i dati da documenti e altre fonti di dati.
Human-in-the-loop (HITL)
Il processo mediante il quale gli esperti umani verificano i risultati ottenuti da modelli di machine learning. Combinando il Machine Learning con la revisione umana si ottiene il meglio di entrambi i mondi.
Intelligent document processing (IDP)
Un tipo di automazione documentale che prevede l’acquisizione, l’estrazione e l’elaborazione di dati da una varietà di formati di documenti. Con lo scopo di classificare, categorizzare ed estrarre informazioni rilevanti, utilizzando tecnologie di intelligenza artificiale e deep learning come l’elaborazione del linguaggio naturale (NLP) e tecniche di computer vision.
Optical character recognition (OCR)
Tecnologia in grado di rilevare i caratteri contenuti in un documento e trasferirli in testo digitale leggibile da una macchina.
Articoli correlati

OCR vs IDP: differenze e quale tecnologia scegliere
OCR e IDP sono due tecnologie chiave per l’automazione documentale: l’OCR permette di leggere il testo da immagini e PDF, mentre l’IDP comprende il contenuto dei documenti e lo trasforma in dati strutturati pronti per i processi aziendali.
Leggilo ora
Cos'è la Document AI? Evoluzione negli anni e task principali
La Document AI rappresenta l’evoluzione delle tecnologie per comprendere, classificare, estrarre e generare dati dai documenti. L’articolo analizza il passaggio dai sistemi rule-based ai modelli multimodali e il valore delle piattaforme IDP
Leggilo ora
Cos'è l'intelligenza artificiale e perché è importante per le aziende
L’intelligenza artificiale aiuta le imprese ad automatizzare attività, analizzare dati, gestire documenti e rendere più efficienti i processi. In questo articolo vediamo cos’è l’AI, come funziona e dove può generare valore reale in azienda.
Leggilo ora
Cos’è l’OCR e come si è evoluto: dalle tecniche tradizionali ai Vision Language Model
L’OCR converte testi da immagini e PDF in contenuti digitali, ma oggi è solo il primo passo. Con VLM e IDP, i sistemi evoluti non si limitano a leggere: comprendono i documenti, strutturano i dati e abilitano l’automazione.
Leggilo ora
Small Vision Language Models (SVLM): cosa sono e perché stanno trasformando il document processing
Gli Small Vision Language Models (SVLM) sono modelli di intelligenza artificiale in grado di elaborare simultaneamente contenuto visivo e testuale. Nati come evoluzione compatta dei VLM generalisti, trovano applicazione in numerosi domini.
Leggilo ora
Agenti AI: come progettare sistemi autonomi basati su LLM
Gli agenti AI sono sistemi autonomi basati su LLM che possono eseguire flussi di lavoro complessi al posto dell’utente. In questa guida scoprirai quando usarli, come progettarli e quali pattern architetturali e misure di sicurezza adottare
Leggilo ora