La lunga roadmap verso il Semantic Web [Parte 1]
Tutto iniziò cosi:
Ho un sogno per il Web [nel quale i computer] diventeranno capaci di analizzare tutti i dati sul Web – i contenuti, i link e le transazioni tra persone e computer. Un ‘Web Semantico’, che dovrebbe rendere questo possibile, deve ancora emergere, ma quando lo farà, giorno per giorno i meccanismi del commercio, della burocrazia e la nostra vita quotidiana saranno trattati da macchine che parlano alle macchine. L ‘”agente intelligente” che la gente ha propagandato per anni finalmente si materializzerà”.
“Tim Berners-Lee” 1999
Con questa frase Tim Berners Lee nel lontano ’99, descriveva l’evoluzione del web, in Web Semantico, cioè un web basato e organizzato di dati che vengono strutturati in automatico, facilmente indicizzabili ma soprattutto dotati di un reale significato (appunto web semantico).
Eh si, perché proprio l’essenza di Web Semantico, il “web del significato”, si basa su questa concezione: dotare ogni dato, ogni informazione (prodotta o meno dagli utenti), ogni pdf, ogni commento, ogni link, di un senso/significato.
Per l’essere umano questo è già una realtà, data dalla nostra capacità comunicativa e il ragionamento, siamo già in grado di assegnare un valore conoscitivo alle informazioni che leggiamo, a classificarle e a creare delle riflessioni sulla base delle informazioni che acquisiamo, ma siamo anche capaci, mediante il ragionamento deduttivo, di generare nuove informazioni, a partire da quelle di cui già disponiamo.
Tuttavia, il nostro linguaggio, nel momento in cui vogliamo affiancarlo all’ambito della conoscenza Web, ha un problema sostanziale: è destrutturato.
Cosa succede se la conoscenza umana viene immessa in rete per essere elaborata per il Web?
Sappiamo tutti che il Web, è costituito da una rete di informazioni (di qualsiasi tipo), o meglio agglomerato di dati (strutturati), salvati in database (strutturati) e indicizzati su qualsivoglia rete di server, fruibili da qualsiasi parte del globo e da qualsiasi postazione e collegati tra loro (link).
Il problema fondamentale del salvare conoscenza fruibile per il Web, è che le informazioni che immettiamo nella rete, sono destrutturate, cioè non sono dotate di una struttura interna che permetta di salvarli e classificarli “dato per dato”. Questo vuol dire che esistono blocchi di dati che vengono salvati all’interno di database cosi come vengono “letti” dai sistemi di recupero di informazioni.
Se ci pensiamo un attimo, tutti i dati che immettiamo all’interno dei nostri siti, ad esempio, sono renderizzati per mezzo di HTML, che è un linguaggio che permette la modellazione dei contenuti per essere correttamente letti nel Web. Tali dati “trasformati” attraverso operazioni parsing, di stemming, rimozioni delle stopwords ecc.., poi sono facilmente indicizzabili, proprio perché strutturati, nonché recuperabili da algoritmi di Information Retrieval (IR) che consentono di rintracciare informazioni per mezzo di query su oggetti ( entità che contengono al loro interno delle informazioni in un database).
I motori di ricerca, a tal proposito, rappresentano le applicazioni che consentono di integrare il procedimento di recupero di informazioni da dati destrutturati, trasformarli mediante un procedimento di elaborazione delle informazioni in strutture, e permettere su di essi, il lancio di delle query.
Proviamo un attimo a pensare ad uno scenario in cui delle figure che chiamiamo agenti intelligenti, siano in grado di:
- leggere le informazioni;
- elaborare le informazioni cosi come immesse all’interno della rete;
- svolgere compiti sofisticati al posto nostro.
Pensiamo ad un’intelligenza artificiale che, automaticamente, sia in grado di comprendere il significato di una frase e dedurre in base ad essa delle nuove informazioni riutilizzabili. Una bella evoluzione rispetto al semplice recupero di dati! Non credete?
Si tratta di una visione molto più complessa del Web, in cui le informazioni, o metadati, vengono automaticamente estratte (Data Mining) classificate e correlate con l’aiuto di sistemi di ragionamento (come i sistemi esperti), basati su logiche descrittive come le Ontologie (rappresentazioni di concetti).
E’ questo lo scenario che si auspica per il Web Semantico, una visione del web, in cui ogni dato prodotto dagli utenti, possa essere recuperato, ma allo stesso tempo elaborato e riutilizzato, per usi futuri. Insomma è un Web basato sulla conoscenza e molto più dinamico!
In sostanza quindi, cos’è il Web Semantico?
- È una visione per il Web del futuro ( basato sul significato e sulla semantica), definito originariamente da Tim Berners-Lee (alias padre del Web).
- Non è una rete separata, ma un prolungamento di quella attuale.
- Dota le macchine di quella capacità che gli consente di lavorare molto meglio e di essere in grado di elaborare e comprendere i dati che vengono utilizzati al momento.
- È una rete basata sul ragionamento-macchina, e in cui le macchine diventeranno onnipresenti e potenti.
- Descrive un insieme di standard emergenti, linguaggi di markup (HTML5), e strumenti di elaborazione.
Per farci un’idea di come dovrebbe lavorare il web per trasformarsi in semantico, possiamo dare un’occhiata alla gerarchia a strati del Semantic Web.
Sostanzialmente gli elementi componenti sono:
- URI, per la definizione degli indirizzi internet;
- XML, per modellare i dati e dotarli di un significato embrionale;
- RDF e RDF Schema, i linguaggi che permettono di descrivere le risorse;
- OWL (Ontology Web Language) che permette di concettualizzare le informazioni, dotandole di relazioni;
- il livello di firma digitale potrebbe essere utilizzata per certificare la provenienza delle ontologie oltre che dei dati;
- il livello logico infine, è il livello dedicato alla derivazione della conoscenza elaborata e prodotta (dedotta) da affermazioni esistenti.
Non tutti questi strati sono implementati, la base de Semantic Web è già esistente, e gruppi di ricerca sono al lavoro per la creazione dei successivi strati. Tuttavia, siamo già in possesso delle tecnologie che ci consentono di scalare questa gerarchia, anche se a un livello di maturità diverso.
In questo percorso, appena iniziato, analizzeremo i diversi livelli che compongono il Web Semantico, gli strumenti utilizzati per implementarlo e gli sviluppi in corso. Stay tuned! 😉
Vuoi dire la tua?