Feeds:
Articoli
Commenti

Archive for the ‘Condivisione delle risorse’ Category

Poster del progetto CrowdHeiritage

Poster del progetto CrowdHeritage

Si sta avviando alla conclusione il progetto europeo CrowdHeritage, finanziato dalla Commissione europea nell’ambito del Programma Connecting Europe Facility.  Obiettivo del progetto era la creazione di una piattaforma aperta attraverso la quale le istituzioni culturali potessero condividere i metadati di una selezione delle loro collezioni presenti su Europeana, il portale europeo del patrimonio culturale , in modo da poterli migliorare o arricchire. Il lavoro di arricchimento, rientrante nel campo della gamification,  era a carico degli utenti (scuole, studenti, ricercatori, curiosi, appassionati).

Spesso l’esperienza di ricerca degli utenti sul portale europeo è piuttosto frustrante proprio a causa della scarsità di metadati descrittivi arricchiti e granulari alla fonti.

Per arricchire i metadati, sono state attivate sei campagne di crowdsourcing: Colori in passerella, per verificare la correttezza dei colori dagli abiti, estratti automaticamente dalla piattaforma e appartenenti a tre famose collezioni di moda; Antichi strumenti musicali, per riconoscere gli antichi strumenti musicali rappresentati; Tipologia di capi di moda, per aggiungere o verificare la correttezza del tipo di oggetto di una serie di capi di moda; Città e paesaggi,  per annotare le collezioni che raffigurano paesaggi, carte geografiche, edifici, rappresentazioni urbane e rurali con i tipi di edifici, i mezzi di trasporto, gli elementi geografici, i mestieri; Sport e tempo libero, per identificare, convalidare o aggiungere le tipologia di sport, gli eventi sportivi, le attrezzature.

Al termine delle campagne, i risultati sono stati validati attraverso procedure automatizzate e manuali e i contributori più seri e attivi sono stati premiati con dei coupon per acquisti online.

La piattaforma CrowdHeritage è un sistema open-source che integra e supporta le API di Europeana e di altre istituzioni culturali di fama mondiale, come il Rijksmuseum di Amsterdam e la Digital Public Library of America. Essa è stata sviluppata dalla National Technical University of Athens, coordinatrice del progetto, in partenariato con la European Fashion Heritage Association, l’Associazione MICHAEL Culture, il Ministero della Cultura francese e la Fondazione Europeana.

Per maggiori informazioni:

https://crowdheritage.eu/it/

 

Read Full Post »

Sono ormai milioni le risorse digitali in rete disponibili attraverso biblioteche digitali, portali, aggregatori, applicazioni, rese disponibili agli utenti per scopi professionali, di ricerca, istruzione, turismo, creatività ecc. Oggi vi vogliamo raccontare di un interessante progetto di crowdsourcing sviluppato nell’ambito di Europeana 1914-1918, che ha raccolto migliaia di documenti di privati inerenti il periodo della Prima Guerra Mondiale: lettere, opuscoli, cartoline, manifesti, diari, ecc. Migliaia di documenti, migliaia di storie da scoprire… (chiunque può tuttora caricare risorse digitali sul portale).

Cos’è esattamente Europeana Transcribathon 1914-1918? Uno strumento per trascrivere, annotare e geolocalizzare materiale digitalizzato inedito con lo scopo di costituire un archivio di storie relativo al periodo della Prima Guerra Mondiale, consentirne il riutilizzo e conservarle anche per le generazioni future.

Come si può partecipare al Transcribathon?

Niente di più facile. Innanzitutto ci si registra e si attiva il proprio account. A quel punto è possibile partecipare a un evento, competizione o concorso organizzati dagli stessi gestori della piattaforma oppure si può selezionare un documento da trascrivere.

Nel primo caso, per esempio, in questo momento sono attive diverse iniziative: dalla trascrizione condivisa del manoscritto illustrato “La natura del Turkestan” di Ernst Kleiber, un prigioniero tedesco che durante la prigionia in Russia annotò con meticolosità scientifica le sue scoperte sulla flora e sulla fauna del Turkestan; oppure la trascrizione delle numerose poesie di guerra scritte da soldati e civili per esprimere meraviglia, pietà, gioia, disperazione, speranza (il partecipante può filtrare la scelta per lingua); oppure ancora la trascrizione delle lettere d’amore tra le coppie separate a causa degli eventi bellici, che testimoniano romanticherie, gelosie, tradimenti, drammi, fini e nuovi inizi. E così, periodicamente vengono avviate nuove iniziative alle quali gli utenti possono partecipare. Ti vuoi cimentare? Qui, nella pagina RUNS, puoi scorrere un elenco di progetti aperti: https://transcribathon.com/en/runs/

C’è una vera e propria gara tra i trascrittori, che possono contribuire autonomamente o in squadra, e in alcuni casi vincere dei punti o dei premi: https://transcribathon.com/en/progress/top-transcribers/

Dalla homepage della piattaforma puoi anche accedere a una mappa su cui è geolocalizzata un’ampia serie di documenti oppure accedere ad alcuni documenti disponibili per la trascrizione.

Mappa delle storie

Sulla mappa sono geolocalizzate tutte le storie disponibili

Elenco documenti

Oltre al titolo e all’immagine del documento, la linea colorata ci indica se la trascrizione non è ancora stata avviata, se è in corso oppure se essere completata.

Dei preziosi tutorial https://transcribathon.com/en/tutorial/ (purtroppo non disponibili in italiano) spiegano nel dettaglio come funziona la procedura di trascrizione.

Ma entriamo in maggior dettaglio. Selezioniamo un’immagine e iniziamo a trascrivere ex novo o proseguire il lavoro iniziato da altri. In caso di dubbi nella trascrizione, possiamo taggare la parola o la frase dubbia, sperando che altri possano risolvere il problema.

Descrizione di un documento

Un cerchio colorato indica lo stato e la percentuale di testo trascritto

Inoltre oltre alla trascrizione, possiamo geolocalizzare la storia e aggiungere una serie di informazioni (metadati) utili alla ricerca nel portale (come ad esempio, la lingua, delle tag, la data del documento. Si possono poi aggiungere delle note e porre dei quesiti e condividere la pagina con i principali social: Facebook. Twitter e GooglePlus.

Il documento con la sua trascrizione, i suoi metadati e la sua geolocalizzazione

Il documento con la sua trascrizione, i suoi metadati e la sua geolocalizzazione

Vedendo l’esempio che segue, possiamo vedere l’elenco delle diverse serie di documenti relativi al volume sul Turkestan sopra citato. Per ogni serie possiamo vedere lo stato dell’arte. Nel caso specifico, della serie centrale possiamo leggere che è costituita da 58 elementi, che 9 utenti stanno partecipando alla trascrizione, che il 60% (pari a 35 documenti) è stato completato, il 36% (pari a 21 documenti) è in revisione e il 3% (pari a 2 documenti) è stato avviato.

Informazioni sullo stato di trascrizione di una serie

Informazioni sullo stato di trascrizione di una serie

Il Transcribathon per l’education e la ricerca

Senz’altro si tratta di uno strumento interessantissimo, da sfruttare nella didattica, nell’ambito di progetti sulla storia, sulla memoria, sulla letteratura, sulla geopolitica, ecc. oppure in progetti di ricerca a livello universitario, coinvolgendo nelle attività anche istituzioni culturali locali (musei, archivi, biblioteche associazioni). Quali i benefici di partecipare a tale attività?

Gli studenti potranno interfacciarsi da vicino con coloro che parlavano la loro lingua in una guerra che ha ridisegnato l’Europa, apprenderanno le tecniche di trascrizione e metadatazione dei documenti del passato attraverso una tecnologia innovativa, potranno cimentarsi in un lavoro di gruppo (ad esempio con compagni della stessa classe o competendo con partecipanti di altre nazioni o regioni), sentirsi gratificati e orgogliosi dal terminare una trascrizione, uilizzare i risultati ottenuti in ulteriori ricerche e presentazioni.

Ovviamente, i progetti didattici possono prevedere attività di trascrizione oppure di semplice navigazione nel portale. Nella sezione DISCOVER https://transcribathon.com/documents/, infatti, si possono ricercare i documenti filtrandoli per tipo (Diari, lettere, immagini) , lingua, tag (per esempio, bambini, oppure Pasqua, oppure Berlino).

E se un’istituzione scolastica è interessata ad avviare un progetto, può contattare il team tecnico della piattaforma.

[MTN]

 

Read Full Post »

Un’interessante introduzione non tecnica, di facile comprensione, sotto forma di video, a:  Linked Data, Google’s Knowledge Graph, and Facebook’s Open Graph Protocol. Realizzato daManu Sporny, 2012 (in lingua inglese).

Read Full Post »

L’interoperabilità è la capacità di un sistema informatico di cooperare e di scambiare informazioni o servizi con altri sistemi o prodotti in maniera più o meno completa e priva di errori, con affidabilità e con ottimizzazione delle risorse [Wikipedia].

Esistono diversi tipi di interoperabilità, tra cui:

  • l’interoperabilità tecnica, resa possibile dall’utilizzo di standard tecnici comuni (formati dei file, metadati ecc.);
  • l’interoperabilità semantica, facilitata dall’uso di terminologie e vocabolari comuni.

Perché l’interoperabilità è un aspetto di cui un’istituzione culturale che detiene contenuti digitali deve tener conto? Perché:

  • consente di far trovare facilmente i propri contenuti da un ampio numero di agenti (portali, aggregatori di metadati, motori di ricerca)
  • consente a questi agenti (ad esempio, Google, Europeana o CulturaItalia) di promuovere i materiali. Gli utenti si aspettano oggi di trovare contenuti integrati (video, immagini, testi, suoni) nello stesso spazio, senza dover inserire ogni volta nuovi termini di ricerca nei singoli siti
  • produce traffico verso il proprio sito, rendendo così più accessibili i contenuti del deep web (web profondo)
  • accresce la visibilità dell’istituzione.

Il web semantico è un “web di dati” che consente ai calcolatori di comprendere la semantica, ovvero il significato delle informazioni sul web. Sempre più spesso, il termine “web semantico” è utilizzato per riferirsi ai formati e alle tecnologie che permettono questo processo.

I vantaggi dell’interoperabilità aumentano utilizzando i Linked Data. Con questo termine si definisce un metodo di pubblicazione di dati strutturati, che possono essere interconnessi tra loro. Tale metodo si basa sulla tecnologia web (protocollo HTTP, linguaggio RDF e utilizzo di URI) e il target cui si rivolge non è costituito dagli utenti umani quanto piuttosto dagli utenti non umani, come i motori di ricerca. In tal modo, dati provenienti da fonti diverse possono essere collegati e interrogati.

Il sito http://linkeddata.org fornisce tutte le informazioni su quest’iniziativa e pubblica la “nuvola”, ovvero il diagramma della situazione corrente del Linking Open (LOD) Data Project.

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”

Come si relazionano però Linked Data, Web Semantico e Linked Open Data?

Molto interessante è la definizione data da Paul Walk:

  1. I dati possono essere aperti, ma non linkati
  2. I dati possono essere linkati, ma non essere aperti
  3. I dati che siano sia aperti sia linkati sono assolutamente realizzabili
  4. Il Web semantico può funzionare solo con dati che siano sia aperti sia linkati.

Sempre secondo Walk, più dati sono linkati sul Web con un significato ben definito, più le applicazioni web saranno performanti.

Grazie al modello LOD, quindi, è come se i dati, resi interoperabili, entrassero a far parte di un immenso database “aperto” nel quale vengono pubblicati set di dati “grezzi” resi disponibili da istituzioni diverse, che però possono essere liberamente “incrociati” da terze parti, con la possibilità di generare valore aggiunto, inaspettato.

Facciamo un esempio pratico: immaginiamo, da un lato, un ente del turismo che pubblica una serie di dati sintetici relativi a strutture ricettive, ristoranti, musei e monumenti di un determinato luogo, dall’altro i musei che pubblicano i dati specifici delle opere esposte nel museo o degli artisti delle opere.

Attraverso i LOD un terzo soggetto ha la possibilità di combinare i due set di dati per offrire un nuovo servizio personalizzato, magari in base alle esigenze di una tipologia specifica di utenti. Naturalmente, questo collegamento potrebbe anche essere realizzato manualmente, però con maggior dispendio di tempo e con maggior possibilità di errore.

Per concludere la prima parte di questo post, invitiamo la visionare un video di Tim Berners Lee sui Linked Open Data, già visto migliaia di volte su You Tube.

http://www.youtube.com/watch?v=ga1aSJXCFe0

[MTN]

Read Full Post »

reCAPTCHA è un servizio CAPTCHA gratuito offerto, sotto forma di widget, da Google per proteggere il proprio sito o blog da spam e incursioni esterne indesiderate. Vi è mai capitato di dovervi registrare su un sito, di inserire un contenuto o compilare una form online e dover riconoscere una sequenza di lettere e/o numeri che appaiono distorti, prima di poter procedere con l’azione che state effettuando?

Questo test, chiamato per l’appunto CAPTCHA, serve a determinare se l’utente sia un umano (e non un computer o, più precisamente, un bot). L’acronimo coniato nel 2000 deriva dall’inglese “completely automated public Turing test to tell computers and humans apart”.

Oltre a proteggere la vostra applicazione online, reCAPTCHA è un progetto che contribuisce a riconoscere i testi di vecchi e libri e giornali digitalizzati.

Quando si digitalizza un volume, le pagine vengono scansionate fotograficamente e poi trasformate in testo utilizzando il sistema detto OCR (Optical Character Recognition). La trasformazione in testo avviene perché la scansione produce immagini pesanti da archiviare, difficili da scaricare e il cui testo non può essere ricercato. L’OCR però non è un sistema perfetto, che produce troppi errori soprattutto nei testi precedenti all’epoca della stampa su scala industriale.

Entrando nello specifico del progetto, ogni parola che non viene letta correttamente dall’OCR viene ritrasformata in immagine e utilizzata come CAPTCHA. Ciò è possibile perché molti programmi di OCR avvisano quando una parola non è stata letta correttamente.

Ma se un computer non riesce a leggere un CAPTCHA, come fa il sistema a riconoscere se la risposta è corretta? Ecco la soluzione.

Ogni nuova parola non riconosciuta dall’OCR viene sottoposta all’utente insieme a un’altra parola interpretata correttamente dall’OCR. All’utente viene quindi richiesto di leggere ambedue le parole. Se l’utente legge correttamente la parola già individuata dall’OCR, il sistema assume che la risposta sia corretta anche per il secondo termine.

La stessa immagine viene comunque sottoposta a più utenti e la parola viene validata solo dopo che più utenti hanno identificato la sequenza di lettere nello stesso modo.

reCAPTCHA è un servizio di social tagging per ottimizzare i metadati creati con l’OCR attraverso il contributo di utenti non professionali. [MTN]

Vuoi provare come funziona?
http://www.google.com/recaptcha/learnmore

Info per scaricare l’applicazione
http://www.google.com/recaptcha/whyrecaptcha

 

Read Full Post »

Old Weather è un progetto curato dalla Citizen Science Alliance, una collaborazione transatlantica tra università e musei dedicata a coinvolgere il cittadino comune nelle ricerche scientifiche.

Leggiamo nella homepage del sito:

Aiutate i ricercatori a raccogliere le osservazioni meteorologiche a livello mondiale fatte dalle navi della Royal Navy ai tempi della Prima guerra mondiale. Le vostre trascrizioni contribuiranno a definire delle proiezioni di modelli climatici e ad arricchire il database delle variazioni meteorologiche. Gli storici utilizzeranno il vostro lavoro per registrare i movimenti delle navi nel passato e le storie delle persone a bordo.

Il progetto si prefigge quindi, tramite la collaborazione degli utenti, di contribuire a identificare misurazioni meteorologiche per costruire modelli climatici futuri sulla base delle esperienze del passato e di scoprire a quali imbarcazioni appartenessero una serie di giornali di bordo e come questi dati possano alimentare la conoscenza.

Se Darwin sulla Beagle raccolse migliaia di informazioni utili per le sue ricerche zoologiche, il capitano della nave, Robert Fitzroy, registrò anche le variazioni climatiche osservate durante il viaggio. E così fecero capitani e ufficiali di tutte le imbarcazioni che solcavano i sette mari. Se si riuscissero a raccogliere migliaia di punti registrati nei giornali di bordo nei diversi periodi, si potrebbero realizzare mappe meteorologiche 3D e identificare pattern e variazioni climatiche estreme.

Il contributo umano nella trascrizione dei giornali di bordo è fondamentale, dal momento che per i computer è difficile interpretare testi manoscritti. La scrittura a mano è spesso confusa e può essere mal interpretata. Peraltro un lavoro così impegnativo con uno staff limitato sarebbe irrealizzabile in tempi accettabili.

Ecco quindi perché l’idea di un progetto di crowdsourcing. Quante più persone contribuiranno all’analisi dei giornali di bordo, tanto più sarà possibile correggere gli errori e aggiungere un maggior grado di accuratezza. Trascrizioni ripetute dei giornali di bordo consentiranno di correggere errori fatti da altri. L’utente inoltre potrà arricchire i contenuti con i propri ricordi: incontri con altre navi, iceberg aerei, vulcani, membri dell’equipaggio…

I dati forniti dagli utenti verranno processati dal team scientifico e quelli ritenuti validi contribuiranno ad arricchire i database internazionali con le registrazioni storiche delle variazioni atmosferiche e verranno resi accessibili anche a scienziati, geografi, storici e al pubblico interessato. [MTN]

Sito Web del progetto
http://www.oldweather.org/

Video sull’utilità del crowsourcing

http://vimeo.com/15193513

Read Full Post »

Il National Maritime Museum e il Royal Observatory di Greenwich hanno richiesto il contributo di utenti volontari per prendere parte a due progetti di Citizen Science.

Il primo progetto si chiama Solar Stormwatch. Gli appassionati di astronomia sono invitati a individuare tempeste solari e altri fenomeni negli archivi iconografici istituzionali.

Quest’attività viene chiamata forum-based science: in sintesi: i volontari perseguono i propri obiettivi di ricerca, e gli scienziati e i ricercatori devono prestare attenzione alle loro scoperte.

Il personale scientifico del museo ha deciso di avviare questo progetto avvalendosi del contributo degli utenti (UCG) perché non ha personale sufficiente ad analizzare tutti i dati in proprio possesso, 25,000 terabytes di informazioni, pari a più di 100.000 immagini raccolte in due anni mezzo dai veicoli spaziali in orbita.

Ci si potrebbe chiedere perché non far fare tutto questo lavoro ai computer. Gli esperti rispondono che ciò che l’occhio umano può riconoscere è molto di più di qualsiasi calcolatore che, invece, per poter riconoscere dei dati, deve avere dei modelli sui quali basare le proprie verifiche.

Un’altra ragione per cui è vantaggioso coinvolgere tanti utenti nel progetto è che si elimina la soggettività, a favore di un risultato basato sul consenso di più utenti. Più persone esprimono una stessa opinione su un certo dato, maggiore è la probabilità che l’ipotesi sia corretta. Una misurazione collettiva infatti ha certamente più valore di una misurazione condotta da un singolo.

Paradossalmente, se il 90% delle persone riconoscesse che un oggetto che si muove nello spazio si sta dirigendo verso la terra, la comunità scientifica sarebbe in possesso di un maggio numero di dati per prepararsi all’impatto. [MTN]

Info:
http://solarstormwatch.com/

Video informativi
http://solarstormwatch.com/why_scientists_need_you

Read Full Post »