Feeds:
Articoli
Commenti

Posts Tagged ‘Linked Open Vocabularies’

Ormai sono pochi coloro che non conoscono Europeana, un repository di più di quaranta milioni di oggetti digitali (immagini, audio, video, testi) afferenti a istituzioni culturali di diversa natura. Chiunque abbia navigato nel portale europeo, sa però come non sia sempre facile arrivare alle informazioni cercate. Ciò è dovuto alla complessità delle risorse in esso contenute (domini diversi con standard diversi, multilinguismo, formati diversi) e alla grande difformità nella descrizione delle risorse, più o meno approfondite.

Negli ultimi tempi, Europeana, su sollecitazione della stessa Commissione europea, sta dedicando molti sforzi al miglioramento qualitativo dei contenuti proprio per favorire una ricerca soddisfacente da parte degli utenti.

Il miglioramento della qualità può avvenire in più modi: da un lato le istituzioni possono fornire dati più consistenti, ad esempio descrizioni più approfondite oppure metadati aggiuntivi, ad esempio le coordinate geografiche del soggetto rappresentato nella risorsa. Dall’altro è possibile, attraverso procedimenti sia manuali che automatici, arricchire i metadati per mezzo dei Linked Open Vocabularies, ovvero i vocabolari semantici riutilizzabili.

Per saperne di più, puoi consultare anche LOV: Linked Open Vocabularies, un portale di accesso a questi vocabolari.

Linked Open Vocabularies

Fonte: LOV

Come possiamo leggere dalle informazioni presenti su questo portale collaborativo ospitato dalla Open Knowledge Foundation, LOV deriva da LOD, acronimo di Linked Open Data. I dati sul web utilizzano classi (aka types) e proprietà (aka predicates) per descrivere persone, luoghi, prodotti, eventi ecc. Perciò, prendendo come esempio il dato, “Maria Teresa Natale è una persona, vive a Roma”, “Persona” è la classe di Maria Teresa Natale, “Città” è la classe di Roma, “vive a” è una proprietà utilizzata per descrivere una persona, in questo caso per collegare la persona a un luogo. Un vocabolario presente in LOV contiene una serie di classi e di proprietà (i termini del vocabolario) che descrivono tipi specifici di cose o cose di un ambito specifico. I termini del vocabolario forniscono anche i link in linked data (ad esempio, nel caso citato, il link tra una persona e la città), utilizzando una semantica corretta in termini di linguaggio informatico. In breve, in tal modo dati semplici divengono dati significativi.

Tornando a Europeana e al miglioramento della qualità dei dati, è proprio quest’ultima la strada che si sta percorrendo: arricchire i metadati in modo automatico utilizzando vocabolari esterni, come GeoNames e DBpedia e sfruttando le relazioni e traduzioni semantiche messe a disposizione da questi vocabolari. Ma come decidere quali vocabolari utilizzare? Europeana applica alcuni criteri che le consentono di minimizzare l’“impegno semantico”, astraendolo dai bisogni dei singoli domini. Per tale motivo, privilegia fonti dati multilingue, generiche e già ben collegate che agiscono da “vocabolari pivot” dove gli elementi equivalenti in altri vocabolari sono già indicati.

Uno dei progetti che Europeana sta seguendo con grande interesse è Wikidata (https://www.wikidata.org), “un database libero, collaborativo, multilingue e secondario che raccoglie dati strutturati per fornire supporto a Wikipedia, a Wikimedia Commons, agli altri progetti del movimento Wikimedia e a chiunque nel mondo”. Wikidata raccoglie risorse create e verificate con il supporto degli utenti (crowdsourcing) e dataset autorevoli (come ad esempio VIAF, Virtual International Authority File). “I dati su Wikidata sono pubblicati sotto la licenza Creative Commons Public Domain Dedication 1.0, che ne permette il riutilizzo in numerosissimi ambiti. I dati possono essere copiati, modificati, distribuiti ed elaborati, anche per scopi commerciali, senza dover chiedere alcuna autorizzazione”.

Modello dati di Wikidata

Modello dati di Wikidata
Fonte: sito web Wikidata

Europeana ha già beneficiato di risorse semantiche “locali”, utilizzate dai fornitori di contenuti e che spesso sono il risultato di grande impegno editoriale. I risultati ottenuti però sono pochi, anche perché i vocabolari non sono allineati tra loro. Secondo Europeana, Wikidata potrebbe rappresentare una soluzione per sfruttare meglio le specificità dei vocabolari, dal momento che consente il caricamento manuale e l’allineamento delle entità semantiche. E tutti ne beneficerebbero: la comunità GLAM, che vedrebbe i propri sforzi premiati dall’autorevolezza di Wikidata nel Web; Wikidata che arricchirebbe la propria base dati; terze parti come Europeana o altri aggregatori che potrebbero accedere a una piattaforma di conoscenza specialistica.

C’è già chi ha sperimentato questa strada, come l’esperta Sandra Fauconnier  che ha allineato il vocabolario di MIMO a Wikidata. Il vocabolario multilingue di MIMO, elaborato nel corso di un concluso progetto europeo dell’ecosistema di Europeana, viene utilizzato per classificare e quindi descrivere meglio gli strumenti musicali.  È il risultato della fusione tra una classificazione vernacolare e la classificazione professionale “Hornbostel-Sachs”.

Per conoscere il procedimento di importazione del vocabolario MIMO su Wikidata, potete consultare questo link: http://pro.europeana.eu/page/get-your-vocabularies-in-wikidata

[MTN]

Annunci

Read Full Post »