Motori di ricerca semantici per la Pubblica Amministrazione del Piemonte

442

Le Pubbliche Amministrazioni dispongono di bacini informativi di grandissime dimensioni e di grande varietà e rivolgono i propri servizi a grandi quantità di utenti

L’evoluzione delle tecnologie web, d’altro canto, pone sempre più l’accento su strumenti di ricerca e navigazione caratterizzati da una forte attenzione verso la semplicità, la ricchezza e l’efficacia di utilizzo per l’utente.

In particolare l’ambito di evoluzione denominato web semantico ha l’obiettivo di rendere esplicite e disponibili le relazioni che congiungono semanticamente le risorse tra loro e che radicano i contenuti al background cui appartengono, portando alla luce le relazioni fondamentali per la comprensione dei contenuti informativi, che altrimenti rimangono “nascoste” nei documenti e nei loro metadati.

Il CSI Piemonte utilizza da tempo motori di ricerca all’interno dei siti web degli enti pubblici piemontesi. Le esigenze di ricerca sono però nel tempo cresciute e gli utenti sono divenuti più esigenti. E’ sorta quindi la necessità di disporre di un motore di ricerca più evoluto, in grado di “svelare” anche conoscenze nascoste e adatto per le tematiche trattate dalla Pubblica Amministrazione.

A partire dal 2009 si sono perciò avviate le prime sperimentazioni di utilizzo di strutture semantiche all’interno del motore di ricerca già utilizzato, denominato Sophia Semantic Engine, soluzione fornita da CELI. CELI e CSI hanno lavorato a stretto contatto per integrare le tecnologie semantiche nel motore di ricerca Sophia Semantic Engine e per costruire un substrato semantico specializzato nel contesto della Pubblica Amministrazione.

La nuova versione del motore di ricerca (versione 4) è in grado di analizzare il contenuto di portali e knowledge base mettendo a disposizione dell’utente finale nuove e più efficaci modalità di recupero dei documenti contenuti. Il principale punto di forza è dato dalla sua capacità di fornire risultati ottimali in domini specializzati di interesse per la Pubblica Amministrazione.

A differenza dei motori di ricerca generalisti, quali quelli presenti su internet, esso è in grado di comprendere in una certa misura i documenti, disambiguando i termini in funzione del dominio di ricerca. Ciò consente di effettuare una ricerca sulla base di concetti e non semplici parole chiave: diventa dunque possibile, ad esempio, fare la distinzione tra il significato botanico di vite, quello meccanico e quello biologico (plurale di vita).

In particolare, il motore semantico integra tecniche di analisi simbolica (che utilizzano dizionari, grammatiche, thesauri, ecc.) con algoritmi di analisi statistica volti a supportare processi quali la classificazione automatica dei documenti, la clusterizzazione ecc. Dal punto di vista dell’utente finale, tale integrazione si concretizza in una maggiore precisione nel recuperare i documenti rilevanti e in una riduzione dei tempi di ricerca.

Gli ambiti sui quali si sono già realizzate delle applicazioni per il contesto della Pubblica Amministrazione piemontese vanno dalla Cultura alla Promozione della Salute, dalla Protezione Civile alle Immagini sanitarie, dagli Open Data ai Sistemi di Performance. Per presentare queste esperienze è stato organizzato il 2 maggio 2012 presso il CSI Piemonte, un workshop durante il quale, dopo un inquadramento sul tema della semantica a cura dell’Università di Torino e del Centro Nexa del Politecnico di Torino, verranno presentate le caratteristiche del motore di ricerca Sophia Semantic Engine 4 di Celi e le applicazioni già messe in campo da parte del CSI Piemonte per la Pubblica Amministrazione piemontese.