Feeds:
Articoli
Commenti

Archive for the ‘DIGITALIZZAZIONE’ Category

Sono ormai milioni le risorse digitali in rete disponibili attraverso biblioteche digitali, portali, aggregatori, applicazioni, rese disponibili agli utenti per scopi professionali, di ricerca, istruzione, turismo, creatività ecc. Oggi vi vogliamo raccontare di un interessante progetto di crowdsourcing sviluppato nell’ambito di Europeana 1914-1918, che ha raccolto migliaia di documenti di privati inerenti il periodo della Prima Guerra Mondiale: lettere, opuscoli, cartoline, manifesti, diari, ecc. Migliaia di documenti, migliaia di storie da scoprire… (chiunque può tuttora caricare risorse digitali sul portale).

Cos’è esattamente Europeana Transcribathon 1914-1918? Uno strumento per trascrivere, annotare e geolocalizzare materiale digitalizzato inedito con lo scopo di costituire un archivio di storie relativo al periodo della Prima Guerra Mondiale, consentirne il riutilizzo e conservarle anche per le generazioni future.

Come si può partecipare al Transcribathon?

Niente di più facile. Innanzitutto ci si registra e si attiva il proprio account. A quel punto è possibile partecipare a un evento, competizione o concorso organizzati dagli stessi gestori della piattaforma oppure si può selezionare un documento da trascrivere.

Nel primo caso, per esempio, in questo momento sono attive diverse iniziative: dalla trascrizione condivisa del manoscritto illustrato “La natura del Turkestan” di Ernst Kleiber, un prigioniero tedesco che durante la prigionia in Russia annotò con meticolosità scientifica le sue scoperte sulla flora e sulla fauna del Turkestan; oppure la trascrizione delle numerose poesie di guerra scritte da soldati e civili per esprimere meraviglia, pietà, gioia, disperazione, speranza (il partecipante può filtrare la scelta per lingua); oppure ancora la trascrizione delle lettere d’amore tra le coppie separate a causa degli eventi bellici, che testimoniano romanticherie, gelosie, tradimenti, drammi, fini e nuovi inizi. E così, periodicamente vengono avviate nuove iniziative alle quali gli utenti possono partecipare. Ti vuoi cimentare? Qui, nella pagina RUNS, puoi scorrere un elenco di progetti aperti: https://transcribathon.com/en/runs/

C’è una vera e propria gara tra i trascrittori, che possono contribuire autonomamente o in squadra, e in alcuni casi vincere dei punti o dei premi: https://transcribathon.com/en/progress/top-transcribers/

Dalla homepage della piattaforma puoi anche accedere a una mappa su cui è geolocalizzata un’ampia serie di documenti oppure accedere ad alcuni documenti disponibili per la trascrizione.

Mappa delle storie

Sulla mappa sono geolocalizzate tutte le storie disponibili

Elenco documenti

Oltre al titolo e all’immagine del documento, la linea colorata ci indica se la trascrizione non è ancora stata avviata, se è in corso oppure se essere completata.

Dei preziosi tutorial https://transcribathon.com/en/tutorial/ (purtroppo non disponibili in italiano) spiegano nel dettaglio come funziona la procedura di trascrizione.

Ma entriamo in maggior dettaglio. Selezioniamo un’immagine e iniziamo a trascrivere ex novo o proseguire il lavoro iniziato da altri. In caso di dubbi nella trascrizione, possiamo taggare la parola o la frase dubbia, sperando che altri possano risolvere il problema.

Descrizione di un documento

Un cerchio colorato indica lo stato e la percentuale di testo trascritto

Inoltre oltre alla trascrizione, possiamo geolocalizzare la storia e aggiungere una serie di informazioni (metadati) utili alla ricerca nel portale (come ad esempio, la lingua, delle tag, la data del documento. Si possono poi aggiungere delle note e porre dei quesiti e condividere la pagina con i principali social: Facebook. Twitter e GooglePlus.

Il documento con la sua trascrizione, i suoi metadati e la sua geolocalizzazione

Il documento con la sua trascrizione, i suoi metadati e la sua geolocalizzazione

Vedendo l’esempio che segue, possiamo vedere l’elenco delle diverse serie di documenti relativi al volume sul Turkestan sopra citato. Per ogni serie possiamo vedere lo stato dell’arte. Nel caso specifico, della serie centrale possiamo leggere che è costituita da 58 elementi, che 9 utenti stanno partecipando alla trascrizione, che il 60% (pari a 35 documenti) è stato completato, il 36% (pari a 21 documenti) è in revisione e il 3% (pari a 2 documenti) è stato avviato.

Informazioni sullo stato di trascrizione di una serie

Informazioni sullo stato di trascrizione di una serie

Il Transcribathon per l’education e la ricerca

Senz’altro si tratta di uno strumento interessantissimo, da sfruttare nella didattica, nell’ambito di progetti sulla storia, sulla memoria, sulla letteratura, sulla geopolitica, ecc. oppure in progetti di ricerca a livello universitario, coinvolgendo nelle attività anche istituzioni culturali locali (musei, archivi, biblioteche associazioni). Quali i benefici di partecipare a tale attività?

Gli studenti potranno interfacciarsi da vicino con coloro che parlavano la loro lingua in una guerra che ha ridisegnato l’Europa, apprenderanno le tecniche di trascrizione e metadatazione dei documenti del passato attraverso una tecnologia innovativa, potranno cimentarsi in un lavoro di gruppo (ad esempio con compagni della stessa classe o competendo con partecipanti di altre nazioni o regioni), sentirsi gratificati e orgogliosi dal terminare una trascrizione, uilizzare i risultati ottenuti in ulteriori ricerche e presentazioni.

Ovviamente, i progetti didattici possono prevedere attività di trascrizione oppure di semplice navigazione nel portale. Nella sezione DISCOVER https://transcribathon.com/documents/, infatti, si possono ricercare i documenti filtrandoli per tipo (Diari, lettere, immagini) , lingua, tag (per esempio, bambini, oppure Pasqua, oppure Berlino).

E se un’istituzione scolastica è interessata ad avviare un progetto, può contattare il team tecnico della piattaforma.

[MTN]

 

Annunci

Read Full Post »

Ormai sono pochi coloro che non conoscono Europeana, un repository di più di quaranta milioni di oggetti digitali (immagini, audio, video, testi) afferenti a istituzioni culturali di diversa natura. Chiunque abbia navigato nel portale europeo, sa però come non sia sempre facile arrivare alle informazioni cercate. Ciò è dovuto alla complessità delle risorse in esso contenute (domini diversi con standard diversi, multilinguismo, formati diversi) e alla grande difformità nella descrizione delle risorse, più o meno approfondite.

Negli ultimi tempi, Europeana, su sollecitazione della stessa Commissione europea, sta dedicando molti sforzi al miglioramento qualitativo dei contenuti proprio per favorire una ricerca soddisfacente da parte degli utenti.

Il miglioramento della qualità può avvenire in più modi: da un lato le istituzioni possono fornire dati più consistenti, ad esempio descrizioni più approfondite oppure metadati aggiuntivi, ad esempio le coordinate geografiche del soggetto rappresentato nella risorsa. Dall’altro è possibile, attraverso procedimenti sia manuali che automatici, arricchire i metadati per mezzo dei Linked Open Vocabularies, ovvero i vocabolari semantici riutilizzabili.

Per saperne di più, puoi consultare anche LOV: Linked Open Vocabularies, un portale di accesso a questi vocabolari.

Linked Open Vocabularies

Fonte: LOV

Come possiamo leggere dalle informazioni presenti su questo portale collaborativo ospitato dalla Open Knowledge Foundation, LOV deriva da LOD, acronimo di Linked Open Data. I dati sul web utilizzano classi (aka types) e proprietà (aka predicates) per descrivere persone, luoghi, prodotti, eventi ecc. Perciò, prendendo come esempio il dato, “Maria Teresa Natale è una persona, vive a Roma”, “Persona” è la classe di Maria Teresa Natale, “Città” è la classe di Roma, “vive a” è una proprietà utilizzata per descrivere una persona, in questo caso per collegare la persona a un luogo. Un vocabolario presente in LOV contiene una serie di classi e di proprietà (i termini del vocabolario) che descrivono tipi specifici di cose o cose di un ambito specifico. I termini del vocabolario forniscono anche i link in linked data (ad esempio, nel caso citato, il link tra una persona e la città), utilizzando una semantica corretta in termini di linguaggio informatico. In breve, in tal modo dati semplici divengono dati significativi.

Tornando a Europeana e al miglioramento della qualità dei dati, è proprio quest’ultima la strada che si sta percorrendo: arricchire i metadati in modo automatico utilizzando vocabolari esterni, come GeoNames e DBpedia e sfruttando le relazioni e traduzioni semantiche messe a disposizione da questi vocabolari. Ma come decidere quali vocabolari utilizzare? Europeana applica alcuni criteri che le consentono di minimizzare l’“impegno semantico”, astraendolo dai bisogni dei singoli domini. Per tale motivo, privilegia fonti dati multilingue, generiche e già ben collegate che agiscono da “vocabolari pivot” dove gli elementi equivalenti in altri vocabolari sono già indicati.

Uno dei progetti che Europeana sta seguendo con grande interesse è Wikidata (https://www.wikidata.org), “un database libero, collaborativo, multilingue e secondario che raccoglie dati strutturati per fornire supporto a Wikipedia, a Wikimedia Commons, agli altri progetti del movimento Wikimedia e a chiunque nel mondo”. Wikidata raccoglie risorse create e verificate con il supporto degli utenti (crowdsourcing) e dataset autorevoli (come ad esempio VIAF, Virtual International Authority File). “I dati su Wikidata sono pubblicati sotto la licenza Creative Commons Public Domain Dedication 1.0, che ne permette il riutilizzo in numerosissimi ambiti. I dati possono essere copiati, modificati, distribuiti ed elaborati, anche per scopi commerciali, senza dover chiedere alcuna autorizzazione”.

Modello dati di Wikidata

Modello dati di Wikidata
Fonte: sito web Wikidata

Europeana ha già beneficiato di risorse semantiche “locali”, utilizzate dai fornitori di contenuti e che spesso sono il risultato di grande impegno editoriale. I risultati ottenuti però sono pochi, anche perché i vocabolari non sono allineati tra loro. Secondo Europeana, Wikidata potrebbe rappresentare una soluzione per sfruttare meglio le specificità dei vocabolari, dal momento che consente il caricamento manuale e l’allineamento delle entità semantiche. E tutti ne beneficerebbero: la comunità GLAM, che vedrebbe i propri sforzi premiati dall’autorevolezza di Wikidata nel Web; Wikidata che arricchirebbe la propria base dati; terze parti come Europeana o altri aggregatori che potrebbero accedere a una piattaforma di conoscenza specialistica.

C’è già chi ha sperimentato questa strada, come l’esperta Sandra Fauconnier  che ha allineato il vocabolario di MIMO a Wikidata. Il vocabolario multilingue di MIMO, elaborato nel corso di un concluso progetto europeo dell’ecosistema di Europeana, viene utilizzato per classificare e quindi descrivere meglio gli strumenti musicali.  È il risultato della fusione tra una classificazione vernacolare e la classificazione professionale “Hornbostel-Sachs”.

Per conoscere il procedimento di importazione del vocabolario MIMO su Wikidata, potete consultare questo link: http://pro.europeana.eu/page/get-your-vocabularies-in-wikidata

[MTN]

Read Full Post »

La conservazione digitale ha un nuovo punto di riferimento italiano, il Centro italiano sulla conservazione digitale. Nato per iniziativa del CINI, il Consorzio Interuniversitario Italiano per l’Informatica, nell’ambito delle attività del progetto europeo sulla conservazione digitale APARSEN (Alliance for Permanent Access to the Records of  Science in Europe Network), il Centro è finalizzato a raccogliere documenti, materiale didattico, pagine di approfondimento, normativa, raccomandazioni e standard con specifica attenzione per le esigenze e gli interessi della comunità nazionale che si occupa di archivi digitali in ambito pubblico o privato.

Rispetto ad altre nazioni l’Italia ha avuto pionieristico nel regolamentare la gestione di oggetti digitali (si pensi alla firma digitale, al protocollo informatico, alla PEC), la qual cosa ha comportato la definizione di una normativa specifica. È anche questa la ragione per cui si è scelto di strutturare il portale di informazione del Centro in lingua italiana, nonostante l’inglese sia la lingua veicolare di questa specifica comunità scientifica. Non mancano però paralleli con la situazione e la normativa di altri paesi europei e non – la Francia, il Regno Unito, l’Australia e gli Stati Uniti – e un inquadramento delle iniziative di entità sovranazionali come ad esempio la Commissione europea.

Il sito è nella sua prima versione ed è in corso di arricchimento da parte dei suoi curatori, Silvio Salza e Maria Guercio dell’Università degli studi di Roma “La Sapienza”, che possono essere contattati da chi ha interesse a collaborare.

Un’altra importante iniziava istituzionale italiana in tema di conservazione digitale è il Servizio nazionale coordinato di conservazione e accesso a lungo termine per le risorse digitali accessibile tramite il sito www.depositolegale.it.

Il deposito legale, cioè la consegna obbligatoria delle pubblicazioni negli istituti depositari da parte dei soggetti previsti dalla legge (DPR 252/2006), è lo strumento normativo che  consente la raccolta e la conservazione dei diversi prodotti in archivi nazionali e regionali. Nel testo rinnovato della legge è stato inserito  anche l’obbligo del deposito per le opere native digitali (born digital). Il sito dedicato al deposito legale del digitale è un punto di riferimento operativo attraverso il quale è possibile depositare le tesi di dottorato in formato digitale presso le biblioteche nazionali centrali di Firenze e Roma e, per gli editori, sperimentare il deposito legale nazionale delle risorse digitali. [MP]

Read Full Post »

Un’interessante introduzione non tecnica, di facile comprensione, sotto forma di video, a:  Linked Data, Google’s Knowledge Graph, and Facebook’s Open Graph Protocol. Realizzato daManu Sporny, 2012 (in lingua inglese).

Read Full Post »

Si segnala la pubblicazione del manuale Open Data Handbook edito dalla  Open Knowledge Foundation con licenza  Creative Commons Attribution (Unported) v3.0 License. Il manuale illustra gli aspetti legali,  sociali e tecnici legati agli open data. Può essere utilizzato da tutti, anche se risulta utile in particolare a chi lavora con i dati delle amministrazioni centrali.

 

Read Full Post »

La recente pubblicazione, Your terminology as a part of the semantic web: recommendations for design and management curata dai gruppi di lavoro “Terminology and multilingualism” nell’ambito dei progetti europei ATHENA e Linked Heritage, si rivolge agli operatori delle istituzioni culturali, agli esperti di architettura dell’informazione e ai linguisti con interessi nei settori delle terminologie e del multiliguismo. Il volume propone una serie di raccomandazioni per la gestione delle proprie terminologie, per il loro adattamento e ottimizzazione ai fini del miglioramento della ricerca multilingue in Europeana e per renderli parte del Web Semantico.

La traduzione in lingua italiana, curata dall’ICCU, sarà disponibile entro maggio 2012.

Read Full Post »

La Commissione europea ha adottato una raccomandazione in cui invita gli Stati membri dell’UE ad intensificare le proprie iniziative, a mettere in comune le rispettive risorse e a coinvolgere il settore privato sul fronte della digitalizzazione del materiale culturale. La digitalizzazione è infatti uno strumento essenziale per ampliare l’accessibilità al patrimonio culturale dell’Europa e per promuovere la crescita nelle industrie culturali europee. I materiali digitalizzati dovrebbero essere resi disponibili attraverso Europeana, la biblioteca, l’archivio e il museo digitale d’Europa (www.europeana.eu).

La raccomandazione invita gli Stati membri a sviluppare piani affidabili e istituire partenariati per inserire in Europeana 30 milioni di oggetti entro il 2015 rispetto ai 19 milioni attualmente disponibili; incrementare la presenza in rete di materiale fuori commercio o coperto dai diritti d’autore e adattare le normative e le strategie nazionali al fine di garantire la conservazione a lungo termine dei materiali digitali.

La raccomandazione invita gli Stati membri a:

  • predisporre piani rigorosi per i propri investimenti nella digitalizzazione e favorire i partenariati pubblico-privato per la condivisione dei relativi costi. La raccomandazione stabilisce i principi fondamentali per garantire che tali partenariati siano equi ed equilibrati.
  • Rendere disponibili entro il 2015 tramite Europeana 30 milioni di oggetti, compresi i capolavori europei che non sono più protetti dai diritti d’autore e tutto il materiale digitalizzato grazie a finanziamenti pubblici.
  • Incrementare la presenza in rete di materiale coperto dai diritti d’autore, istituendo un quadro normativo di riferimento che consenta la digitalizzazione su larga scala e l’accessibilità transfrontaliera delle opere fuori commercio.
  • Rafforzare le proprie strategie e adattare la propria legislazione per garantire la conservazione a lungo termine del materiale digitalizzato, accertandosi, ad esempio, che il materiale depositato non preveda sistemi di protezione tecnologici che ostacolino la conservazione da parte dei bibliotecari.

Link utili:

Raccomandazione sulla digitalizzazione del materiale culturale e sulla sua conservazione in rete:

http://ec.europa.eu/information_society/activities/digital_libraries/index_it.htm

Europeana, la biblioteca, l’archivio e il museo digitale d’Europa:

http://www.europeana.eu/portal/

Sito Web dell’Agenda digitale:

http://ec.europa.eu/digital-agenda

Read Full Post »

Older Posts »