Feeds:
Articoli
Commenti

Archive for the ‘Crowdsourcing’ Category

Sono ormai milioni le risorse digitali in rete disponibili attraverso biblioteche digitali, portali, aggregatori, applicazioni, rese disponibili agli utenti per scopi professionali, di ricerca, istruzione, turismo, creatività ecc. Oggi vi vogliamo raccontare di un interessante progetto di crowdsourcing sviluppato nell’ambito di Europeana 1914-1918, che ha raccolto migliaia di documenti di privati inerenti il periodo della Prima Guerra Mondiale: lettere, opuscoli, cartoline, manifesti, diari, ecc. Migliaia di documenti, migliaia di storie da scoprire… (chiunque può tuttora caricare risorse digitali sul portale).

Cos’è esattamente Europeana Transcribathon 1914-1918? Uno strumento per trascrivere, annotare e geolocalizzare materiale digitalizzato inedito con lo scopo di costituire un archivio di storie relativo al periodo della Prima Guerra Mondiale, consentirne il riutilizzo e conservarle anche per le generazioni future.

Come si può partecipare al Transcribathon?

Niente di più facile. Innanzitutto ci si registra e si attiva il proprio account. A quel punto è possibile partecipare a un evento, competizione o concorso organizzati dagli stessi gestori della piattaforma oppure si può selezionare un documento da trascrivere.

Nel primo caso, per esempio, in questo momento sono attive diverse iniziative: dalla trascrizione condivisa del manoscritto illustrato “La natura del Turkestan” di Ernst Kleiber, un prigioniero tedesco che durante la prigionia in Russia annotò con meticolosità scientifica le sue scoperte sulla flora e sulla fauna del Turkestan; oppure la trascrizione delle numerose poesie di guerra scritte da soldati e civili per esprimere meraviglia, pietà, gioia, disperazione, speranza (il partecipante può filtrare la scelta per lingua); oppure ancora la trascrizione delle lettere d’amore tra le coppie separate a causa degli eventi bellici, che testimoniano romanticherie, gelosie, tradimenti, drammi, fini e nuovi inizi. E così, periodicamente vengono avviate nuove iniziative alle quali gli utenti possono partecipare. Ti vuoi cimentare? Qui, nella pagina RUNS, puoi scorrere un elenco di progetti aperti: https://transcribathon.com/en/runs/

C’è una vera e propria gara tra i trascrittori, che possono contribuire autonomamente o in squadra, e in alcuni casi vincere dei punti o dei premi: https://transcribathon.com/en/progress/top-transcribers/

Dalla homepage della piattaforma puoi anche accedere a una mappa su cui è geolocalizzata un’ampia serie di documenti oppure accedere ad alcuni documenti disponibili per la trascrizione.

Mappa delle storie

Sulla mappa sono geolocalizzate tutte le storie disponibili

Elenco documenti

Oltre al titolo e all’immagine del documento, la linea colorata ci indica se la trascrizione non è ancora stata avviata, se è in corso oppure se essere completata.

Dei preziosi tutorial https://transcribathon.com/en/tutorial/ (purtroppo non disponibili in italiano) spiegano nel dettaglio come funziona la procedura di trascrizione.

Ma entriamo in maggior dettaglio. Selezioniamo un’immagine e iniziamo a trascrivere ex novo o proseguire il lavoro iniziato da altri. In caso di dubbi nella trascrizione, possiamo taggare la parola o la frase dubbia, sperando che altri possano risolvere il problema.

Descrizione di un documento

Un cerchio colorato indica lo stato e la percentuale di testo trascritto

Inoltre oltre alla trascrizione, possiamo geolocalizzare la storia e aggiungere una serie di informazioni (metadati) utili alla ricerca nel portale (come ad esempio, la lingua, delle tag, la data del documento. Si possono poi aggiungere delle note e porre dei quesiti e condividere la pagina con i principali social: Facebook. Twitter e GooglePlus.

Il documento con la sua trascrizione, i suoi metadati e la sua geolocalizzazione

Il documento con la sua trascrizione, i suoi metadati e la sua geolocalizzazione

Vedendo l’esempio che segue, possiamo vedere l’elenco delle diverse serie di documenti relativi al volume sul Turkestan sopra citato. Per ogni serie possiamo vedere lo stato dell’arte. Nel caso specifico, della serie centrale possiamo leggere che è costituita da 58 elementi, che 9 utenti stanno partecipando alla trascrizione, che il 60% (pari a 35 documenti) è stato completato, il 36% (pari a 21 documenti) è in revisione e il 3% (pari a 2 documenti) è stato avviato.

Informazioni sullo stato di trascrizione di una serie

Informazioni sullo stato di trascrizione di una serie

Il Transcribathon per l’education e la ricerca

Senz’altro si tratta di uno strumento interessantissimo, da sfruttare nella didattica, nell’ambito di progetti sulla storia, sulla memoria, sulla letteratura, sulla geopolitica, ecc. oppure in progetti di ricerca a livello universitario, coinvolgendo nelle attività anche istituzioni culturali locali (musei, archivi, biblioteche associazioni). Quali i benefici di partecipare a tale attività?

Gli studenti potranno interfacciarsi da vicino con coloro che parlavano la loro lingua in una guerra che ha ridisegnato l’Europa, apprenderanno le tecniche di trascrizione e metadatazione dei documenti del passato attraverso una tecnologia innovativa, potranno cimentarsi in un lavoro di gruppo (ad esempio con compagni della stessa classe o competendo con partecipanti di altre nazioni o regioni), sentirsi gratificati e orgogliosi dal terminare una trascrizione, uilizzare i risultati ottenuti in ulteriori ricerche e presentazioni.

Ovviamente, i progetti didattici possono prevedere attività di trascrizione oppure di semplice navigazione nel portale. Nella sezione DISCOVER https://transcribathon.com/documents/, infatti, si possono ricercare i documenti filtrandoli per tipo (Diari, lettere, immagini) , lingua, tag (per esempio, bambini, oppure Pasqua, oppure Berlino).

E se un’istituzione scolastica è interessata ad avviare un progetto, può contattare il team tecnico della piattaforma.

[MTN]

 

Annunci

Read Full Post »

reCAPTCHA è un servizio CAPTCHA gratuito offerto, sotto forma di widget, da Google per proteggere il proprio sito o blog da spam e incursioni esterne indesiderate. Vi è mai capitato di dovervi registrare su un sito, di inserire un contenuto o compilare una form online e dover riconoscere una sequenza di lettere e/o numeri che appaiono distorti, prima di poter procedere con l’azione che state effettuando?

Questo test, chiamato per l’appunto CAPTCHA, serve a determinare se l’utente sia un umano (e non un computer o, più precisamente, un bot). L’acronimo coniato nel 2000 deriva dall’inglese “completely automated public Turing test to tell computers and humans apart”.

Oltre a proteggere la vostra applicazione online, reCAPTCHA è un progetto che contribuisce a riconoscere i testi di vecchi e libri e giornali digitalizzati.

Quando si digitalizza un volume, le pagine vengono scansionate fotograficamente e poi trasformate in testo utilizzando il sistema detto OCR (Optical Character Recognition). La trasformazione in testo avviene perché la scansione produce immagini pesanti da archiviare, difficili da scaricare e il cui testo non può essere ricercato. L’OCR però non è un sistema perfetto, che produce troppi errori soprattutto nei testi precedenti all’epoca della stampa su scala industriale.

Entrando nello specifico del progetto, ogni parola che non viene letta correttamente dall’OCR viene ritrasformata in immagine e utilizzata come CAPTCHA. Ciò è possibile perché molti programmi di OCR avvisano quando una parola non è stata letta correttamente.

Ma se un computer non riesce a leggere un CAPTCHA, come fa il sistema a riconoscere se la risposta è corretta? Ecco la soluzione.

Ogni nuova parola non riconosciuta dall’OCR viene sottoposta all’utente insieme a un’altra parola interpretata correttamente dall’OCR. All’utente viene quindi richiesto di leggere ambedue le parole. Se l’utente legge correttamente la parola già individuata dall’OCR, il sistema assume che la risposta sia corretta anche per il secondo termine.

La stessa immagine viene comunque sottoposta a più utenti e la parola viene validata solo dopo che più utenti hanno identificato la sequenza di lettere nello stesso modo.

reCAPTCHA è un servizio di social tagging per ottimizzare i metadati creati con l’OCR attraverso il contributo di utenti non professionali. [MTN]

Vuoi provare come funziona?
http://www.google.com/recaptcha/learnmore

Info per scaricare l’applicazione
http://www.google.com/recaptcha/whyrecaptcha

 

Read Full Post »

Old Weather è un progetto curato dalla Citizen Science Alliance, una collaborazione transatlantica tra università e musei dedicata a coinvolgere il cittadino comune nelle ricerche scientifiche.

Leggiamo nella homepage del sito:

Aiutate i ricercatori a raccogliere le osservazioni meteorologiche a livello mondiale fatte dalle navi della Royal Navy ai tempi della Prima guerra mondiale. Le vostre trascrizioni contribuiranno a definire delle proiezioni di modelli climatici e ad arricchire il database delle variazioni meteorologiche. Gli storici utilizzeranno il vostro lavoro per registrare i movimenti delle navi nel passato e le storie delle persone a bordo.

Il progetto si prefigge quindi, tramite la collaborazione degli utenti, di contribuire a identificare misurazioni meteorologiche per costruire modelli climatici futuri sulla base delle esperienze del passato e di scoprire a quali imbarcazioni appartenessero una serie di giornali di bordo e come questi dati possano alimentare la conoscenza.

Se Darwin sulla Beagle raccolse migliaia di informazioni utili per le sue ricerche zoologiche, il capitano della nave, Robert Fitzroy, registrò anche le variazioni climatiche osservate durante il viaggio. E così fecero capitani e ufficiali di tutte le imbarcazioni che solcavano i sette mari. Se si riuscissero a raccogliere migliaia di punti registrati nei giornali di bordo nei diversi periodi, si potrebbero realizzare mappe meteorologiche 3D e identificare pattern e variazioni climatiche estreme.

Il contributo umano nella trascrizione dei giornali di bordo è fondamentale, dal momento che per i computer è difficile interpretare testi manoscritti. La scrittura a mano è spesso confusa e può essere mal interpretata. Peraltro un lavoro così impegnativo con uno staff limitato sarebbe irrealizzabile in tempi accettabili.

Ecco quindi perché l’idea di un progetto di crowdsourcing. Quante più persone contribuiranno all’analisi dei giornali di bordo, tanto più sarà possibile correggere gli errori e aggiungere un maggior grado di accuratezza. Trascrizioni ripetute dei giornali di bordo consentiranno di correggere errori fatti da altri. L’utente inoltre potrà arricchire i contenuti con i propri ricordi: incontri con altre navi, iceberg aerei, vulcani, membri dell’equipaggio…

I dati forniti dagli utenti verranno processati dal team scientifico e quelli ritenuti validi contribuiranno ad arricchire i database internazionali con le registrazioni storiche delle variazioni atmosferiche e verranno resi accessibili anche a scienziati, geografi, storici e al pubblico interessato. [MTN]

Sito Web del progetto
http://www.oldweather.org/

Video sull’utilità del crowsourcing

http://vimeo.com/15193513

Read Full Post »

Il National Maritime Museum e il Royal Observatory di Greenwich hanno richiesto il contributo di utenti volontari per prendere parte a due progetti di Citizen Science.

Il primo progetto si chiama Solar Stormwatch. Gli appassionati di astronomia sono invitati a individuare tempeste solari e altri fenomeni negli archivi iconografici istituzionali.

Quest’attività viene chiamata forum-based science: in sintesi: i volontari perseguono i propri obiettivi di ricerca, e gli scienziati e i ricercatori devono prestare attenzione alle loro scoperte.

Il personale scientifico del museo ha deciso di avviare questo progetto avvalendosi del contributo degli utenti (UCG) perché non ha personale sufficiente ad analizzare tutti i dati in proprio possesso, 25,000 terabytes di informazioni, pari a più di 100.000 immagini raccolte in due anni mezzo dai veicoli spaziali in orbita.

Ci si potrebbe chiedere perché non far fare tutto questo lavoro ai computer. Gli esperti rispondono che ciò che l’occhio umano può riconoscere è molto di più di qualsiasi calcolatore che, invece, per poter riconoscere dei dati, deve avere dei modelli sui quali basare le proprie verifiche.

Un’altra ragione per cui è vantaggioso coinvolgere tanti utenti nel progetto è che si elimina la soggettività, a favore di un risultato basato sul consenso di più utenti. Più persone esprimono una stessa opinione su un certo dato, maggiore è la probabilità che l’ipotesi sia corretta. Una misurazione collettiva infatti ha certamente più valore di una misurazione condotta da un singolo.

Paradossalmente, se il 90% delle persone riconoscesse che un oggetto che si muove nello spazio si sta dirigendo verso la terra, la comunità scientifica sarebbe in possesso di un maggio numero di dati per prepararsi all’impatto. [MTN]

Info:
http://solarstormwatch.com/

Video informativi
http://solarstormwatch.com/why_scientists_need_you

Read Full Post »