Questa suite di prodotti per il riconoscimento vocale di Nuance rappresenta uno dei più validi software di riconoscimento vocale presenti sul mercato

Da tempo, Dragon NaturallySpeaking (DNS) è l’applicazione di riconoscimento vocale leader mondiale, utilizzata quotidianamente da milioni di persone: professionisti e aziende, avvocati, medici e periti, insegnanti e studenti, trascrittori e traduttori.
La principale motivazione per utilizzare questo software è l’incremento di produttività dovuto al fatto che la maggior parte delle persone parla ad una velocità superiore alle 120 parole al minuto, ma digita con una velocità inferiore alle 40 parole al minuto. Il programma permette anche di controllare il computer con comandi vocali ed è possibile navigare sullo schermo con la voce, sostituendo il mouse. Questa funzione può essere utile soprattutto per gli utenti con mobilità limitata, come i lavoratori appartenenti alle categorie protette, o per ridurre l’affaticamento e le possibili infiammazioni ai polsi e al tunnel metacarpale per chi utilizza il mouse per molte ore al giorno. DNS è tanto più utile quanto più gli utenti sono lenti nell’uso della tastiera e capaci di dettare in modo fluido e senza troppe correzioni. È quindi uno strumento particolarmente adatto a manager, professionisti, giornalisti, funzionari commerciali e tecnici (a cui consente di dettare con una velocità tre volte superiore a quella di battitura) mentre produce benefici di produttività meno evidenti per programmatori e dattilografe veloci.

La precisione della conversione può arrivare fino al 99%, se si dispone di un buon microfono, una buona scheda audio, un PC sufficientemente potente e si parla in modo chiaro e deciso tenendo il microfono molto vicino alla bocca. È inoltre importante che non siano presenti rumori di fondo (telefoni che squillano, gente che parla, ventole, stampanti e fotocopiatrici in azione, ecc.). È ovviamente problematico utilizzare questo strumento se si hanno problemi con la voce dovuti a disturbi vari come voce roca, raffreddore, tosse e starnuti. Anche la fase di addestramento è molto importante per ottenere buoni risultati. Il programma apprende abbastanza velocemente a riconoscere la voce dello speaker e migliora costantemente con l’uso. La fase di training iniziale è molto veloce poiché avviene durante la prova del microfono e della scheda audio e richiede la lettura di poche righe. Per ottenere buoni risultati in termini di aumento di produttività e di precisione, l’utente deve essere capace di dettare in modo chiaro e fluido, cosa che non è semplice e naturale per tutti. Per migliorare la comprensione, Dragon può accedere ai testi presenti sul computer e alla posta di Outlook per valutare lo stile di scrittura e archiviare le parole maggiormente utilizzate. È possibile accedere in ogni momento al centro di miglioramento delle prestazioni del programma, in grado di addestrare il prodotto e renderlo sempre più vicino alle esigenze di dettatura degli utenti.  Dragon Naturally Speaking funziona con le applicazioni informatiche più comunemente usate, come Microsoft Word e Internet Explorer. La maggior parte delle operazioni effettuate con la tastiera possono essere eseguite a voce, come la creazione e la modifica di documenti o e-mail, l’apertura e la chiusura di applicazioni, il controllo del mouse e dell’intero desktop. Il programma si interfaccia direttamente a registratori digitali e palmari e permette di acquisire direttamente file Wav, Mp3, Wma, collegando il dispositivo esterno a una porta del PC; inoltre supporta microfoni senza filo e Bluetooth, che consentono di liberare l’utente dal cordone ombelicale con il PC. C’è anche la possibilità di creare macro per la dettatura di testi. DNS mette a disposizione una notevole varietà di comandi vocali per le correzione, la formattazione e la redazione del testo, il cui uso è spiegato in un tutorial interattivo. Quando il riconoscimento vocale fallisce è necessario ricorrere agli strumenti di correzione, anch’essi vocali, che consentono di selezionare la parola errata e di apre una finestra di correzione nella quale si può selezionare a voce una parola sostitutiva o dettare la parola corretta.

Le macro vocali di Dragon consentono di eseguire con un comando vocale diretto operazioni che richiedono molti passaggi, come cercare su Internet prodotti, notizie e altre informazioni. È sufficiente pronunciare un comando contenente le parole cercate, come “Cerca mappe di ristoranti francesi a Milano”, perché Dragon utilizzi il browser e il motore di ricerca predefiniti per immettere i termini dettati nel campo di ricerca e restituire i risultati. È inoltre possibile cercare direttamente in siti specifici, video, immagini, notizie, articoli e prodotti, usando comandi come “Cerca in Wikipedia Bluetooth”. Le macro vocali di Dragon supportano tra gli altri i siti di Google, Yahoo, eBay, Wikipedia e YouTube. Dragon 10 include anche comandi per eseguire ricerche direttamente sul computer, dettando le parole da trovare in e-mail, documenti e cronologie delle visite sul web.Quando si creano comandi per il testo e la grafica, è possibile creare moduli che includono campi variabili e possono essere compilati a voce o a mano (DragonTemplates con campi vocali).

La famiglia di prodotti Dragon
Dragon può essere utile per un utilizzo amatoriale o Soho, per professionisti e per aziende, che hanno diverse necessità specifiche e diversi “price point”. Per indirizzare questi mercati così differenti, Dragon Naturally Speaking (DNS) è offerto in 3 versioni: Professional, Preferred e Standard. La tabella dettaglia le principali funzioni supportate dalle tre versioni.

 

Funzione Professional Preferred Standard
Appplicazioni Desktop      
Dettatura nelle e applicazioni per Microsoft Windows X X X
Menu di controllo e finestre di dialogo attivabili a voce nelle applicazioni per Microsoft Windows X X X
Supporto Internet Explorer, Mozialla Firefiax, Mozilla Thunderbird, InfoPath, AOL, MS Word, Wordperfect X X X
Supporto Outlook Express, Excel X X  
Supporto Outlook , Powerpoint, Lotus Notes X    
Supporto Multi_utenti      
Importazione ed esportazione dei file degli utenti X X  
Importazione ed esportazione macro e vocabolari, vocabolari specializzati aggiuntivi (medici e legali) X    
Gestione centralizzata dei vocabolari in rete X    
Supporto della dettatura nel thin client Citrix X    
Strumenti di modifica e di trascrizione di terzi      
Formattazione e modifica con la voce X X X
Salvataggio audio con testo X    
Annotazioni vocali per Microsoft Word X    
Lettura ad alta voce del testo e riproduzione della dettatura X X  
Dettatura su cellulari e dispositivi wireless      
Più fonti di dettatura X X  
Uso di registratori digitali palmari X X  
Dettatura in Pocket PC o Palm X X  
Supporto di microfoni Bluetooth X X  
Comandi vocali delle operazioni sul PC      
Macro per la dettatura di testi X X  
Registratore di macro e macro complesse X    
Linguaggio di script avanzato X    
Controllo vocale del mouse X X X
Macro vocali Dragon per la ricerca sul desktop X X  
Macro vocali Dragon per la posta elettronica e il calendario X    

 

Tutte le versioni del prodotto permettono di controllare a voce il sistema operativo e vari programmi, tra cui Internet Explorer, Firefox, Thunderbird, Word e Outlook Express. La versione Preferred supporta anche Outlook e Excel; inoltre può trascrivere file Wav e Mp3 e le registrazioni effettuate con una varietà di dispositive compresi i Pocket PC. La versione Professional supporta tutte le applicazioni di Microsoft Office, permette di usare vocabolari specializzati (medico e legale) e creare complesse macro vocali, e può essere usata in PC che funzionano in emulazione di terminale, con prodotti di virtualizzazione come i client Citrix.

Dragon NaturallySpeaking 10 Professional consente ai professionisti aziendali di creare e-mail e documenti, compilare moduli e ottimizzare le operazioni dei flussi di lavoro semplicemente parlando. Comprende il supporto completo delle reti aziendali, e le installazioni su emulatore di terminale Citrix. La versione intermedia, Dragon NaturallySpeaking 10 Preferred è quella più adatta alla maggior parte dell’utenza professionale di base. Consente alle piccole aziende e agli utenti avanzati di PC di creare e-mail, documenti, navigare in Internet con la voce oppure dettare / modificate testi in Microsoft Word ed Excel, Corel WordPerfect e nella maggior parte delle altre applicazioni per Windows. Permette di creare comandi vocali per inserire rapidamente blocchi di testo o immagini, come il nome, il titolo e la firma. Si può dettare in un dispositivo palmare o un registratore digitali, oppure usare un microfono Bluetooth senza rimanere legati ai fili. La versione Standard, pensata soprattutto per gli utenti privati, consente di creare documenti, e-mail ed e instant message parlando in linguaggio naturale e di navigare in Internet con la voce. Supporta alcune applicazione per Windows come Word, Internet Explorer, Mozilla Firefox e AOL.  Oltre all’ambiente Windows, Nuance offre anche versioni per il mondo Apple, smart phone e palmari.Per potenziare l’offerta nel mondo Apple, Nuance ha acquisito MacSpeech, produttore di soluzioni di riconoscimento vocale per piattaforma Apple Macintosh, e ha integrato il diffuso prodotto MacSpeechDictate con la tecnologia di riconoscimento vocale Dragon, ampliando la suite di prodotti Dragon NaturallySpeaking con un’applicazione creata appositamente per l’ambienti Macintosh (MacSpeech Scribe). I prodotti della famiglia Dragon supportano anche terminali mobili come iPad, iPhone, BlackBerry con i prodotti della suite Dragon Mobile: Dragon Dictation, Dragon Search e Dragon for e-mail. La suite Dragon si conferma quindi il prodotto leader a livello mondiale nel campo dei pacchetti di interpretazione vocale per le più diffuse piattaforme client, e ha un quasi-monopolio in questo campo poiché non esistono prodotti concorrenti di rilievo che vantino una simile diffusione e caratteristiche comparabili in termini di precisione, ricchezza di funzionalità e prestazioni.