Feeds:
Articoli
Commenti

Posts Tagged ‘User generated content’

reCAPTCHA è un servizio CAPTCHA gratuito offerto, sotto forma di widget, da Google per proteggere il proprio sito o blog da spam e incursioni esterne indesiderate. Vi è mai capitato di dovervi registrare su un sito, di inserire un contenuto o compilare una form online e dover riconoscere una sequenza di lettere e/o numeri che appaiono distorti, prima di poter procedere con l’azione che state effettuando?

Questo test, chiamato per l’appunto CAPTCHA, serve a determinare se l’utente sia un umano (e non un computer o, più precisamente, un bot). L’acronimo coniato nel 2000 deriva dall’inglese “completely automated public Turing test to tell computers and humans apart”.

Oltre a proteggere la vostra applicazione online, reCAPTCHA è un progetto che contribuisce a riconoscere i testi di vecchi e libri e giornali digitalizzati.

Quando si digitalizza un volume, le pagine vengono scansionate fotograficamente e poi trasformate in testo utilizzando il sistema detto OCR (Optical Character Recognition). La trasformazione in testo avviene perché la scansione produce immagini pesanti da archiviare, difficili da scaricare e il cui testo non può essere ricercato. L’OCR però non è un sistema perfetto, che produce troppi errori soprattutto nei testi precedenti all’epoca della stampa su scala industriale.

Entrando nello specifico del progetto, ogni parola che non viene letta correttamente dall’OCR viene ritrasformata in immagine e utilizzata come CAPTCHA. Ciò è possibile perché molti programmi di OCR avvisano quando una parola non è stata letta correttamente.

Ma se un computer non riesce a leggere un CAPTCHA, come fa il sistema a riconoscere se la risposta è corretta? Ecco la soluzione.

Ogni nuova parola non riconosciuta dall’OCR viene sottoposta all’utente insieme a un’altra parola interpretata correttamente dall’OCR. All’utente viene quindi richiesto di leggere ambedue le parole. Se l’utente legge correttamente la parola già individuata dall’OCR, il sistema assume che la risposta sia corretta anche per il secondo termine.

La stessa immagine viene comunque sottoposta a più utenti e la parola viene validata solo dopo che più utenti hanno identificato la sequenza di lettere nello stesso modo.

reCAPTCHA è un servizio di social tagging per ottimizzare i metadati creati con l’OCR attraverso il contributo di utenti non professionali. [MTN]

Vuoi provare come funziona?
http://www.google.com/recaptcha/learnmore

Info per scaricare l’applicazione
http://www.google.com/recaptcha/whyrecaptcha

 

Annunci

Read Full Post »

Old Weather è un progetto curato dalla Citizen Science Alliance, una collaborazione transatlantica tra università e musei dedicata a coinvolgere il cittadino comune nelle ricerche scientifiche.

Leggiamo nella homepage del sito:

Aiutate i ricercatori a raccogliere le osservazioni meteorologiche a livello mondiale fatte dalle navi della Royal Navy ai tempi della Prima guerra mondiale. Le vostre trascrizioni contribuiranno a definire delle proiezioni di modelli climatici e ad arricchire il database delle variazioni meteorologiche. Gli storici utilizzeranno il vostro lavoro per registrare i movimenti delle navi nel passato e le storie delle persone a bordo.

Il progetto si prefigge quindi, tramite la collaborazione degli utenti, di contribuire a identificare misurazioni meteorologiche per costruire modelli climatici futuri sulla base delle esperienze del passato e di scoprire a quali imbarcazioni appartenessero una serie di giornali di bordo e come questi dati possano alimentare la conoscenza.

Se Darwin sulla Beagle raccolse migliaia di informazioni utili per le sue ricerche zoologiche, il capitano della nave, Robert Fitzroy, registrò anche le variazioni climatiche osservate durante il viaggio. E così fecero capitani e ufficiali di tutte le imbarcazioni che solcavano i sette mari. Se si riuscissero a raccogliere migliaia di punti registrati nei giornali di bordo nei diversi periodi, si potrebbero realizzare mappe meteorologiche 3D e identificare pattern e variazioni climatiche estreme.

Il contributo umano nella trascrizione dei giornali di bordo è fondamentale, dal momento che per i computer è difficile interpretare testi manoscritti. La scrittura a mano è spesso confusa e può essere mal interpretata. Peraltro un lavoro così impegnativo con uno staff limitato sarebbe irrealizzabile in tempi accettabili.

Ecco quindi perché l’idea di un progetto di crowdsourcing. Quante più persone contribuiranno all’analisi dei giornali di bordo, tanto più sarà possibile correggere gli errori e aggiungere un maggior grado di accuratezza. Trascrizioni ripetute dei giornali di bordo consentiranno di correggere errori fatti da altri. L’utente inoltre potrà arricchire i contenuti con i propri ricordi: incontri con altre navi, iceberg aerei, vulcani, membri dell’equipaggio…

I dati forniti dagli utenti verranno processati dal team scientifico e quelli ritenuti validi contribuiranno ad arricchire i database internazionali con le registrazioni storiche delle variazioni atmosferiche e verranno resi accessibili anche a scienziati, geografi, storici e al pubblico interessato. [MTN]

Sito Web del progetto
http://www.oldweather.org/

Video sull’utilità del crowsourcing

http://vimeo.com/15193513

Read Full Post »

Il National Maritime Museum e il Royal Observatory di Greenwich hanno richiesto il contributo di utenti volontari per prendere parte a due progetti di Citizen Science.

Il primo progetto si chiama Solar Stormwatch. Gli appassionati di astronomia sono invitati a individuare tempeste solari e altri fenomeni negli archivi iconografici istituzionali.

Quest’attività viene chiamata forum-based science: in sintesi: i volontari perseguono i propri obiettivi di ricerca, e gli scienziati e i ricercatori devono prestare attenzione alle loro scoperte.

Il personale scientifico del museo ha deciso di avviare questo progetto avvalendosi del contributo degli utenti (UCG) perché non ha personale sufficiente ad analizzare tutti i dati in proprio possesso, 25,000 terabytes di informazioni, pari a più di 100.000 immagini raccolte in due anni mezzo dai veicoli spaziali in orbita.

Ci si potrebbe chiedere perché non far fare tutto questo lavoro ai computer. Gli esperti rispondono che ciò che l’occhio umano può riconoscere è molto di più di qualsiasi calcolatore che, invece, per poter riconoscere dei dati, deve avere dei modelli sui quali basare le proprie verifiche.

Un’altra ragione per cui è vantaggioso coinvolgere tanti utenti nel progetto è che si elimina la soggettività, a favore di un risultato basato sul consenso di più utenti. Più persone esprimono una stessa opinione su un certo dato, maggiore è la probabilità che l’ipotesi sia corretta. Una misurazione collettiva infatti ha certamente più valore di una misurazione condotta da un singolo.

Paradossalmente, se il 90% delle persone riconoscesse che un oggetto che si muove nello spazio si sta dirigendo verso la terra, la comunità scientifica sarebbe in possesso di un maggio numero di dati per prepararsi all’impatto. [MTN]

Info:
http://solarstormwatch.com/

Video informativi
http://solarstormwatch.com/why_scientists_need_you

Read Full Post »

Il British Museum ha avviato da alcuni mesi un’insolita forma di collaborazione con Wikipedia, per garantire che le informazioni inerenti il museo siano pubblicate correttamente e che le opere più importanti delle collezioni e l’autorevolezza dell’istituzione siano ben rappresentate nelle pagine dell’enciclopedia online creata con il contributo di utenti volontari.

Circa 40 wikipediani residenti nel distretto londinese hanno trascorso alcuni venerdì al museo, incontrando i curatori delle collezioni e scattando fotografie. Al contrario, i curatori erano invitati a revisionare le schede informative presenti sul museo e a verificare importanti omissioni o descrizioni carenti.

In un articolo sul New York Times leggiamo che il responsabile del sito web del museo e supervisore della collaborazione con Wikipedia ha verificato quante volte la Stele di Rosetta, uno degli oggetti più importanti delle collezioni del British, venisse cliccata sull’enciclopedia online. Qual è stato il risultato? La pagina su Wikipedia che descrive la stele viene cliccata cinque volte di più di quella del museo.

La lezione appresa è che se non si può battere Wikipedia, bisogna collaborare con essa.

Il venticinquenne wikipediano australiano Liam Wyatt, che a proprie spese ha soggiornato a Londra cinque settimane per portare avanti questo progetto presso il British Museum, ha commentato che ciò che avvicina le due istituzioni, una nata nel 1753 e l’altra nel 2001, è il comune obiettivo di diffondere conoscenza tra il pubblico. Se il museo ha le conoscenze e gli oggetti, Wikipedia ha l’utenza online.

Nel programmare il lavoro da svolgere, i Wikipediani si sono impegnati a non trattare argomenti che sarebbero potuti apparire promozionali o controversi, come per esempio la descrizione di alcune collezioni che il governo greco considera derubate, mentre invece i curatori erano concordi nell’affermare che un articolo ben fatto può convogliare traffico verso il museo, sia online che di persona.

Lo scorso anno il sito web del museo e altri siti web satelliti hanno potuto contare su un traffico di 15 milioni di visite, a fronte di 6 milioni di visitatori reali che hanno visitato il museo forse più di una volta. [MTN]

Per saperne di più:
Lezione online di Liam Wyatt su SlideShare

Read Full Post »

A maggio 2010 l’Agenzia culturale della Danimarca (Kultur Arv) ha inaugurato in versione beta il sito web sulla memoria culturale danese “1001 stories about Denmark” (http://www.1001stories.dk), dove si possono leggere e ascoltare storie su 1001 luoghi danesi: dagli insediamenti dell’età del ferro dell’isola di Bornholm alla Caverna del Cavallo nero di Vesterbro, dall’isola Christiansø nella Danimarca orientale all’industria chimica Cheminova in quella occidentale, dai palazzi reali ai monumenti ai megaliti sparsi lungo tutta la penisola. Le storie sono state scritte da 180 esperti di storia e memoria culturale danese.
Il sito, che ha anche fini didattici, si rivolge ai danesi e ai turisti che vogliono visitare la Danimarca. Gli utenti sono invitati a condividere tra loro le proprie conoscenze sui siti e sui luoghi danesi e a lasciare commenti sulla storia della Danimarca.
I viaggiatori possono scoprire nuovi luoghi o ascoltare storie interessanti anche attraverso i propri dispositivi mobile.
Tutte le storie sono disponibili in formato testuale, audio e video sia in danese sia in inglese e ricercabili attraverso una mappa georeferenziata e una timeline.
Il progetto, del quale è disponibile un video introduttivo (http://www.youtube.com/user/1001fortaellinger#p/u/0/NFw2x20y6vo) è stato finanziato con 7,4 milioni di corone danesi dal Danish Labour Market Holiday Fund. [MTN]

Read Full Post »