Feeds:
Articoli
Commenti

Archive for the ‘Terminologie e multiliguismo’ Category

Ormai sono pochi coloro che non conoscono Europeana, un repository di più di quaranta milioni di oggetti digitali (immagini, audio, video, testi) afferenti a istituzioni culturali di diversa natura. Chiunque abbia navigato nel portale europeo, sa però come non sia sempre facile arrivare alle informazioni cercate. Ciò è dovuto alla complessità delle risorse in esso contenute (domini diversi con standard diversi, multilinguismo, formati diversi) e alla grande difformità nella descrizione delle risorse, più o meno approfondite.

Negli ultimi tempi, Europeana, su sollecitazione della stessa Commissione europea, sta dedicando molti sforzi al miglioramento qualitativo dei contenuti proprio per favorire una ricerca soddisfacente da parte degli utenti.

Il miglioramento della qualità può avvenire in più modi: da un lato le istituzioni possono fornire dati più consistenti, ad esempio descrizioni più approfondite oppure metadati aggiuntivi, ad esempio le coordinate geografiche del soggetto rappresentato nella risorsa. Dall’altro è possibile, attraverso procedimenti sia manuali che automatici, arricchire i metadati per mezzo dei Linked Open Vocabularies, ovvero i vocabolari semantici riutilizzabili.

Per saperne di più, puoi consultare anche LOV: Linked Open Vocabularies, un portale di accesso a questi vocabolari.

Linked Open Vocabularies

Fonte: LOV

Come possiamo leggere dalle informazioni presenti su questo portale collaborativo ospitato dalla Open Knowledge Foundation, LOV deriva da LOD, acronimo di Linked Open Data. I dati sul web utilizzano classi (aka types) e proprietà (aka predicates) per descrivere persone, luoghi, prodotti, eventi ecc. Perciò, prendendo come esempio il dato, “Maria Teresa Natale è una persona, vive a Roma”, “Persona” è la classe di Maria Teresa Natale, “Città” è la classe di Roma, “vive a” è una proprietà utilizzata per descrivere una persona, in questo caso per collegare la persona a un luogo. Un vocabolario presente in LOV contiene una serie di classi e di proprietà (i termini del vocabolario) che descrivono tipi specifici di cose o cose di un ambito specifico. I termini del vocabolario forniscono anche i link in linked data (ad esempio, nel caso citato, il link tra una persona e la città), utilizzando una semantica corretta in termini di linguaggio informatico. In breve, in tal modo dati semplici divengono dati significativi.

Tornando a Europeana e al miglioramento della qualità dei dati, è proprio quest’ultima la strada che si sta percorrendo: arricchire i metadati in modo automatico utilizzando vocabolari esterni, come GeoNames e DBpedia e sfruttando le relazioni e traduzioni semantiche messe a disposizione da questi vocabolari. Ma come decidere quali vocabolari utilizzare? Europeana applica alcuni criteri che le consentono di minimizzare l’“impegno semantico”, astraendolo dai bisogni dei singoli domini. Per tale motivo, privilegia fonti dati multilingue, generiche e già ben collegate che agiscono da “vocabolari pivot” dove gli elementi equivalenti in altri vocabolari sono già indicati.

Uno dei progetti che Europeana sta seguendo con grande interesse è Wikidata (https://www.wikidata.org), “un database libero, collaborativo, multilingue e secondario che raccoglie dati strutturati per fornire supporto a Wikipedia, a Wikimedia Commons, agli altri progetti del movimento Wikimedia e a chiunque nel mondo”. Wikidata raccoglie risorse create e verificate con il supporto degli utenti (crowdsourcing) e dataset autorevoli (come ad esempio VIAF, Virtual International Authority File). “I dati su Wikidata sono pubblicati sotto la licenza Creative Commons Public Domain Dedication 1.0, che ne permette il riutilizzo in numerosissimi ambiti. I dati possono essere copiati, modificati, distribuiti ed elaborati, anche per scopi commerciali, senza dover chiedere alcuna autorizzazione”.

Modello dati di Wikidata

Modello dati di Wikidata
Fonte: sito web Wikidata

Europeana ha già beneficiato di risorse semantiche “locali”, utilizzate dai fornitori di contenuti e che spesso sono il risultato di grande impegno editoriale. I risultati ottenuti però sono pochi, anche perché i vocabolari non sono allineati tra loro. Secondo Europeana, Wikidata potrebbe rappresentare una soluzione per sfruttare meglio le specificità dei vocabolari, dal momento che consente il caricamento manuale e l’allineamento delle entità semantiche. E tutti ne beneficerebbero: la comunità GLAM, che vedrebbe i propri sforzi premiati dall’autorevolezza di Wikidata nel Web; Wikidata che arricchirebbe la propria base dati; terze parti come Europeana o altri aggregatori che potrebbero accedere a una piattaforma di conoscenza specialistica.

C’è già chi ha sperimentato questa strada, come l’esperta Sandra Fauconnier  che ha allineato il vocabolario di MIMO a Wikidata. Il vocabolario multilingue di MIMO, elaborato nel corso di un concluso progetto europeo dell’ecosistema di Europeana, viene utilizzato per classificare e quindi descrivere meglio gli strumenti musicali.  È il risultato della fusione tra una classificazione vernacolare e la classificazione professionale “Hornbostel-Sachs”.

Per conoscere il procedimento di importazione del vocabolario MIMO su Wikidata, potete consultare questo link: http://pro.europeana.eu/page/get-your-vocabularies-in-wikidata

[MTN]

Annunci

Read Full Post »

La recente pubblicazione, Your terminology as a part of the semantic web: recommendations for design and management curata dai gruppi di lavoro “Terminology and multilingualism” nell’ambito dei progetti europei ATHENA e Linked Heritage, si rivolge agli operatori delle istituzioni culturali, agli esperti di architettura dell’informazione e ai linguisti con interessi nei settori delle terminologie e del multiliguismo. Il volume propone una serie di raccomandazioni per la gestione delle proprie terminologie, per il loro adattamento e ottimizzazione ai fini del miglioramento della ricerca multilingue in Europeana e per renderli parte del Web Semantico.

La traduzione in lingua italiana, curata dall’ICCU, sarà disponibile entro maggio 2012.

Read Full Post »

Un gruppo congiunto di esperti storici del costume, del tessuto e della moda nonché di funzionari dell’Istituto centrale per il catalogo e la documentazione del Ministero per i beni e le attrività culturali ha redatto un lemmario per la schedatura dell’abito e degli elementi vestimentari, prodotto su CD-ROM per una rapida consultazione, che costituisce la guida lessicale per la compilazione delle voci specifiche del tracciato della Scheda VeAC (Vestimenti antichi e moderni), in sperimentazione (per la visualizzazione del tracciato, registrarsi nel sito dell’ICCD).
Il lemmario è ricco di illustrazioni che potranno aiutare il catalogatore nella terminologia da usare.
“La scelta dei lemmi risponde a un criterio convenzionale, ma non arbitrario”, essendo stati privilegiati termini radicati nell’uso.
Si tratta senz’altro di uno strumento importantissimo per la catalogazione di un materiale così complesso e difforme come quello dell’abito e dei diversi capi d’abbigliamento.
Auspichiamo, che data l’importanza di questo risultato, il lemmario possa essere anche reso disponibile online dalle istituzioni responsabili.

La scheda VeAC e il lemmario sono stati presentati il 17 febbraio 2010 nel Salone dell’Ercole della Galleria nazionale d’arte moderna a Roma. [MTN]

Read Full Post »

Oggi, presso la sede dell’ICCD, nell’ambito dell’XI Settimana della cultura, si è tenuta la giornata dedicata alla presentazione dei thesauri realizzati o in corso di elaborazione, per far crescere la qualità della catalogazione del patrimonio culturale, agevolare la ricerca dei termini da parte degli utenti, ampliare l’accesso ai contenuti.

Un grande risultato, presentato dall’arch. Floriana Sattalini, è costituito dall’elaborazione del thesaurus architettonico dedicato all’edilizia residenziale, frutto di una ricerca congiunta di ICCD e Università Roma Tre, Dipartimento progettazione e studio dell’architettura (DiPSA).

Relativamente all’ambito archeologico, Letizia Mancinelli ha ricordato come, nel 2003, “a seguito di un intenso lavoro di riflessione metodologica, l’ICCD ha rilasciato una nuova generazione di ‘normative‘ (la versione denominata 3.0, attualmente in uso. Queste normative, rispetto agli standard pubblicati negli anni Novanta del secolo scorso, presentano aggiornamenti e integrazioni finalizzati a migliorare le procedure operative e soprattutto a porre in evidenza le relazioni tra i beni e tra i beni e il territorio, nell’ottica, ormai consolidata e condivisa, di una catalogazione ‘integrata’ che ha come obiettivo l’acquisizione e la diffusione delle conoscenze sul ‘sistema patrimonio culturale’ letto come insieme organico”.

Attualmente, nell’ambito dei beni archeologici, sono disponibili le seguenti schede:  SI (sito archeologico), SAS (Saggio stratigrafico), MA/CA (Monumento/Complesso archeologico), RA (Reperto archeologico), TMA (Tabella Materiali archeologici), NU (Beni numismatici), AT (Reperti antropologici), mentre tra gli standard in corso di definizione c’è il Modulo per i documenti epigrafici.

La relatrice ha poi dichiarato che sono state svolte diverse attività di sperimentazione, che hanno consentito di mettere a punto delle norme di compilazione personalizzate per le tipologie di schede citate, tutte disponibili sul sito web dell’ICCD (http://www.iccd.beniculturali.it/Catalogazione/standard-catalografici/normative/nomative).

Per i catalogatori meno esperti, è stato altresì pubblicato online l’estratto del solo livello inventariale per ciascuna normativa, consistente nell’insieme delle voci della scheda considerate obbligatorie per l’acquisizione nella banca dati.

Per quanto riguarda gli strumenti terminologici,  supporto fondamentale alle attività di catalogazione, è stata oggi presentata la base di lavoro per un Thesaurus per i reperti archeologici, che costituisce una prima proposta per reimpostare l’intero lavoro di sistematizzazione terminologica per la definizione e la classificazione dei reperti archeologici. Tale lavoro è stato impostato con riferimento alle indicazioni riconosciute a livello internazionale per la costruzione dei thesauri. A fronte di una bonifica attuata a partire da 17.000 termini, si è giunti a produrre un elenco base di 600 termini, organizzati in categorie. Per ciascun termine viene fornita una griglia che include i riferimenti all’organizzazione in categorie, le definizioni specifiche legate alle caratteristiche funzionali e tipologiche, gli eventuali termini che rimandano alle singole parti componenti gli oggetti, i sinonimi, una descrizione sintetica e quando possibile un apparato iconografico.

Tra gli altri strumenti presentati, Mancinelli ha anche citato il vocabolario per la compilazione dei campi OGT-OGTT della scheda di Sito archeologico.

Nel corso della giornata è stato inoltre presentato ICCD risponde, “il nuovo servizio di richiesta chiarimenti, di raccolta delle proposte e delle segnalazioni dei problemi relativi ai contenuti e alle modalità applicative degli strumenti per la catalogazione (schede di catalogo, schede per authority file, normative per la produzione e la descrizione della documentazione di corredo, strumenti terminologici)”. Il servizio è accessibile dalla pagine del sito relative agli standard catalografici. [MTN]

Read Full Post »