Giunto alla release 17, questo pacchetto di Nuance è uno dei più diffusi e maturi prodotti OCR per ufficio

Gli strumenti per convertire i documenti cartacei in documenti elettronici ed estrarre le informazioni testuali dai file di immagini (Image to Text converter) sono complessi programmi che trasformano documenti fisici e immagini in oggetti digitali grazie all’uso integrato di varie tecnologie informatiche: elaborazione delle immagini digitali (digital image processing), riconoscimento delle forme (pattern recognition), intelligenza artificiale e machine vision. Questi prodotti, detti comunemente OCR (Optical Character Reader), hanno una notevole importanza pratica poiché costituiscono il punto di partenza di tutti i sistemi di dematerializzazione e di gestione elettronica dei documenti, e producono notevoli incrementi di produttività poiché hanno raggiunto un notevole grado di maturità, che consente il riconoscimento dei testi stampati con caratteri dell’alfabeto latino con un‘accuratezza del 99%, mentre l’interpretazione della scrittura manuale, denominata ICR (Intelligent Character Recognition) è ancora in fase di evoluzione e normalmente non è supportata dai prodotti software utilizzati negli uffici per l’acquisizione di documenti cartacei.
Sono disponibili sul mercato diversi strumenti per convertire in testo file di immagini (jpg, tiff, gif) o documenti cartacei acquisiti con lo scanner, producendo documenti elettronici in vari formati come Word, HTML o PDF. Le principali caratteristiche che differenziano i programmi OCR, che possono presentare anche notevoli differenze di prestazioni e di prezzi, sono l’accuratezza nel riconoscimento dei caratteri, l’accuratezza nella ricostruzione del layout delle pagine, gli algoritmi utilizzati dal “motore di riconoscimento” che riconosce i simboli (multi-engine voting, reti neurali, k-NN), stabilità del motore nel trattamento di grandi documenti, supporto per varie lingue e per vari alfabeti (greco, cirillico, ebraico, arabo, cinese, giapponese, coreano , etc), velocità, interfaccia utente, formati di file e protocolli di comunicazione supportati in ingresso e in uscita, dispositivi di ingresso supportati e relativi accessori come alimentatori automatici di fogli, etc. Negli OCR per uso professionale, sono inoltre importanti i collegamenti ai sistemi aziendali documentali (EDMS) e per la gestione della dei contenuti (ECM), nonché la possibilità di organizzare sequenze predefinite di operazioni (workflow).

Il prodotto OCR OmniPage Professional di Nuance, giunto alla release 17, è il più diffuso e maturo prodotto OCR per ufficio a livello mondiale. Offre una notevole precisione nella conversione: dal 99% al 99,9% per testi in 120 lingue con diversi alfabeti come cinese, giapponese e coreano, con la possibilità di introdurre dizionari di termini tecnici specializzati per automatizzare al massimo il processo di riconoscimento. Il sistema “intelligente” IntelliTrain “apprende” i termini particolari più utilizzati memorizzando automaticamente le correzioni ai testi per generare migliori risultarti nell’interpretazione dei documenti successivi. Per la scansione dei giornali e dei documenti con un’impaginazione complessa, è utilissima la funzione che permette di ritagliare porzioni di testo di qualsiasi forma. Il motore di riconoscimento è in grado di analizzare più porzioni dell’immagine in parallelo (hyperthreading) e può quindi sfruttare il parallelismo dei microprocessori multi-core, con una contrazione dei tempi di elaborazione OCR di oltre il 40%.
La funzione di Despeckle rimuove gli artefatti (speckle) introdotti dal processo di scansione (imperfezioni dello scanner, polvere, graffi) e il “rumore di fondo” provocato da documenti colorati e macchiati, migliorando la qualità dei documenti difficili da leggere e la precisione del riconoscimento. La precisione aumenta ulteriormente grazie alla tecnologia di conversione iperbinaria Nuance, che separa il testo dallo sfondo sfruttando le informazioni supplementari contenute nelle immagini digitalizzate per rilevare le differenze tra il testo e lo sfondo della pagina. Anche le fotografie scattate con fotocamere digitali o smart phone dal personale sul campo possono essere convertite in documenti elettronici, con l’aiuto di opportune funzioni che eliminano le aberrazioni prospettiche della ripresa (3DC technology).  Le funzioni di formattazione permettono di ricostruire il layout di documenti impaginati con colonne, tabelle, grafici e immagini. OmniPage consente inoltre di convertire moduli cartacei in modelli di moduli elettronici PDF, HTML o XSN (Microsoft Office InfoPath format), che possono essere distribuiti, compilati ed elaborati più facilmente dei moduli cartacei. OmniPage consente poi di estrarre le informazioni dai moduli compilati e raccolti, elaborando in batch i moduli compilati e producendo file di dati che possono essere utilizzati con applicazioni, fogli di calcolo e database.
Le organizzazioni che non dispongono di un sistema per la gestione dei documenti, possono utilizzare il sistema PaperPort, fornito con la versione professionale di OmniPage 17, per gestire e indicizzare grandi quantità di documenti. OmniPage Professional 17 consente inoltre di convertire automaticamente i file in batch, utilizzare stampanti multifunzione per scansire e convertire automaticamente grandi volumi di documenti, riconoscere e convertire file allegati alle email in arrivo, accedere ai file digitalizzati da qualunque punto dell’organizzazione, archiviare i documenti secondo regole pre-impostate o lette da codici a barre. Queste ultime caratteristiche sono particolarmente utili per implementare sistemi di protocollo elettronico dei documenti, flussi di lavoro e processi documentali. OmniPage 17 è integrato con Microsoft Office 2007, dispone di collegamenti ai sistemi aziendale di gestione dei contenuti come Microsoft SharePoint e Open Text e supporta il protocollo di collegamento ODMA (Open Document Management API) Interoperability Exchange, che consente l’interoperabilità con i principali sistemi di gestione dei documenti.
È inoltre possibile creare innovative forme di output multimediale, che possono essere utili soprattutto per i professionisti in viaggio. Per esempio, i documenti elettronici possono anche essere convertiti in e-book formattati per essere letti negli e-reader Amazon Kindle; questo consente di portarsi appresso i propri documenti elettronici anche senza PC.  È inoltre possibile creare file audio e Audio Book da documenti su carta o digitali, che si possono salvare su CD o ascoltare su iPod o qualsiasi altro riproduttore musicale digitale, grazie al sistema text-to-speech RealSpeak, che deriva dall’esperienza di Nuance, leader nel campo delle tecnologie vocali. Per quanto riguarda la facilità d’uso, Omnipage è abbastanza semplice da installare e l’utilizzo è intuitivo, anche se comprende molti componenti che sono normalmente utilizzati da aziende medio-grandi e che richiedono quindi la conoscenza dei processi operativi e dei sistemi informativi esterni. Il Workflow Assistant aiuta a preparare i flussi di lavoro seguendo una procedura guidata. Omnipage Professional è quindi un solido prodotto per uso aziendale, che giustifica il prezzo abbastanza sostenuto con la molteplicità delle funzioni offerte e le notevoli prestazioni in termini di accuratezza e velocità. Infatti, grazie alla combinazione di grande precisione e di evolute funzionalità, OmniPage Professional 17 migliora decisamente il modo di gestire, archiviare e condividere i documenti digitali. Per gli utenti privati e le applicazioni Soho esiste la versione standard, più semplice ed economica, che non dispone delle funzioni più evolute, destinate alle aziende più strutturate.