Indire, sito ufficiale
    home chi siamo contatti help miur usr   invalsi  

Agenzia Nazionale per lo Sviluppo dell'Autonomia Scolastica

Ex Indire
 
    Formazione     Documentazione     Didattica     Comunicazione Europa
MEDIA EDUCATION

Organizzare l’informazione del mondo e renderla accessibile
Una missione semplice e ambiziosa: Google Books
di Valentina Piattelli
10 Aprile 2006

  

Dia, IndireSi sta avverando quello che fino ad ora era solo un sogno di ogni topo di biblioteca: scatenare un motore di ricerca fra gli scaffali di una grande biblioteca.

Se si interroga il nuovo motore di ricerca sui libri http://books.google.it, si ottiene la copia della pagina cartacea che contiene le parole cercate, informazioni sul libro, la possibilità di comprarlo presso le librerie online o addirittura le biblioteche locali più vicine che lo possiedono. Se si tratta di un libro coperto da diritto d’autore, vengono mostrate solo alcune pagine, o addirittura solo alcuni stralci; se invece si tratta di un libro non coperto da diritto d’autore (perché pubblicato prima del 1922 o perché l’editore ha rinunciato ai diritti), allora è possibile leggere l’intero libro online.

In effetti il “progetto libri” nasce davvero dal sogno di uno dei fondati di Google, coltivato fin dai tempi dell’Università. Come ricorda Mary Sue Coleman, preside della University of Michigan: “... uno dei nostri ex studenti, Larry Page, ci disse che gli sarebbe piaciuto digitalizzare la biblioteca dell’università, un’istituzione che conta circa 7 milioni di volumi. Poteva sembrare l’asserzione spavalda di un 29enne, se non fosse che Larry si era laureato splendidamente in ingegneria informatica e che si trattava di uno dei fondatori di Google”.

Ma non si tratta solo di una fantasia, è Google stesso che è stato fondato su questo sogno. Infatti nel 1996 Larry Page e Sergey Brin (che faranno nascere Google soltanto due anni dopo) cominciarono a lavorare ad un progetto di ricerca sulle biblioteche virtuali sostenuto dallo Stanford Digital Library Technologies Project. L’idea che ebbero per questo progetto è alla base del funzionamento di Google stesso: “In futuro, quando grandi quantità di libri saranno digitalizzati, le persone useranno un motore di ricerca all’interno di questi libri. I contenuti saranno indicizzati e lo stesso accadrà per le interconnessioni fra i vari libri. In questo modo sarà possibile determinare la rilevanza e l’utilità di un libro rilevando il numero e la qualità delle citazioni che un libro ha ricevuto all’interno degli altri libri”. Com’è noto, questo è esattamente il sistema grazie al quale funziona Google, le cui risposte ad ogni ricerca vengono elencate in base alla rilevanza quantitativa (rating), cioè i collegamenti che ciascun sito ottiene nella rete di tutti i siti.

Le prime ad aderire entusiasticamente al progetto sono state antiche biblioteche come la Bodleian Library di Oxford e case editrici universitarie come quelle di Oxford e Cambridge, ma anche di Chicago, Princeton e altri celebri editori come Blackwell, Houghton Mifflin, Hyperion, McGraw-Hill, Pearson, Penguin, Perseus, Springer, Taylor & Francis, Thomson Delmar e Warner Books. Nel 2004 Google annunciò ufficialmente alla Fiera del Libro di Francoforte il progetto di acquisire in formato digitale i testi dei milioni di libri posseduti dai cinque soci del “progetto libri” - le Università di Harvard, Stanford, Oxford, Michigan, e la Biblioteca pubblica di New York – e i testi saranno resi disponibili per la ricerca su Internet.

Dia, IndireMa come verrà realizzato tecnicamente un progetto così ambizioso?
I creatori di Google sono sempre stati molto parchi di informazioni sul proprio lavoro e quando è stato chiesto all’ingegnere responsabile del Progetto Libri di Google, Daniel Clancy, come intendesse realizzarlo, questi disse che non poteva far commenti su come era stato deciso di risolvere la questione. Tanta riservatezza non stupisce, dato che devono aver trovato soluzioni nuove per riuscire a scannerizzare milioni di libri in pochi anni. Infatti, se si prende ad esempio un progetto simile, quello dell’Università Carnegie Mellon chiamato Million Book Project e che prevede appunto la scannerizzazione di un milione di libri, vediamo che per arrivare ad un milione ci sono voluti 7 anni e 40 centri di scannerizzazione in India e Cina, dove i lavoratori scannerizzano manualmente i libri arrivati via nave da mezzo mondo. Ma Clancy ha detto che faranno diversamente dal Million Book Project e che hanno sviluppato un nuovo ed esclusivo software per l’OCR (Optical-Character Recognition) e che la scannerizzazione dei libri sarà la meno distruttiva mai fatta. Sappiamo inoltre anche che i libri saranno scannerizzati vicino alle 5 università e biblioteche che partecipano al progetto, quindi certo non nel Terzo Mondo da lavoratori sottopagati. C’è poi il problema dei testi scritti in caratteri diversi da quelli latini. Per il Million Book Project sono stati sviluppati OCR nuovi per il cinese, per i testi scritti a mano e per l’arabo. Google prevede di scannerizzare libri in centinaia di lingue, ma non si sa ancora niente del software che useranno per il riconoscimento dei caratteri diversi da quelli latini.

Le uniche informazioni fatte trapelare da Google si trovano nella “History of Google Book Search”, un sito con cui Google stesso racconta le proprie gesta. Il “progetto libri” sarebbe cominciato veramente soltanto nel 2002, a partire da una domanda semplice e ambiziosa: quanto tempo occorre per scannerizzare tutti i libri del mondo? Per rispondere a questa domanda, Larry Page avrebbe personalmente scannerizzato un libro di 300 pagine e ci avrebbe messo 40 minuti. Nel 2003 un dipendente di Google sarebbe stato inviato a Phoenix, in Arizona, per comprare ad un mercatino di beneficenza una gran quantità di libri da utilizzare per fare prove con una nuova tecnica di “scan non distruttivo”: “Dopo innumerevoli prove, il team di Google ha sviluppato un metodo di scan molto più delicato di quelli ultra-veloci attualmente usati, con gran gioia del team e dei libri stessi. Nel frattempo gli ingegneri informatici avevano fatti progressi nel risolvere le questioni tecniche più spinose che avevano incontrato nello scannerizzare libri con caratteri particolarmente strani e desueti e le altre questioni inaspettate incontrate nelle 430 lingue del progetto”.

Allo stato attuale, la “Google Book Search” è composta di due parti: il Programma Editori e il Programma Biblioteche; con il primo gli editori autorizzano Google a scannerizzare i propri libri, resi disponibili per la ricerca, ma gli editori decidono la quantità di testo che può essere letto in rete; con il secondo i libri posseduti da svariati grandi biblioteche nel mondo vengono scannerizzati e resi disponibili per la ricerca. Se il primo non presenta problemi di copyright, il secondo permette di cercare con Google all’interno di libri ancora coperti da diritto d’autore, anche se vengono rese visibili soltanto alcune frasi prima e dopo il testo cercato. Nonostante questo accorgimento, nel 2005 la Società degli Editori Americani (AAP) ha denunciato Google per violazione del diritto d’autore. La causa è ancora in corso, ma nel diritto statunitense c’è stato di recente un caso simile, Kelly contro Arriba Software - 2003, che sembrerebbe dar ragione a Google. Un motore di ricerca di immagini, Arriba, in risposta alla ricerca fatta dagli utenti mostrava minuscole immagini (thumbnails) di anteprima delle foto tratte da siti web. Un fotografo lo ha denunciato dicendo che le sue foto erano coperte da diritto d’autore e che non potevano essere utilizzate in alcun modo da Arriba. Il tribunale ha ritenuto che il motore di ricerca portasse clienti al sito di Kelly, piuttosto che glieli sottraesse, e che la scarsa risoluzione delle anteprime mostrate dal motore di ricerca ne impedissero qualsiasi utilizzo anche se ingrandite. Comunque è la dottrina del statunitense “fair use” - derivata direttamente dalla Costituzione americana - a permettere la citazione non autorizzata, purché circoscritta e contenente tutti i riferimenti al lavoro originale. L’eventuale vittoria di Google negli Usa però non lo tutela da future cause legali nei vari paesi che con diversi sistemi legali proteggono il diritto d’autore.

Nel frattempo, Dia, Indireuna delle maggiori sostenitrici del progetto, la già citata preside della University of Michigan, Mary Sue Coleman, ha tenuto un discorso appassionato alla Società degli Editori Americani difendendo non solo la legalità del progetto, ma la sua importanza per il progresso dell’umanità: “Noi riteniamo che sia un’iniziativa legale, etica e nobile, che trasformerà la nostra società. Legale perché riteniamo che le leggi sul diritto di autore ci consentano il fair use di milioni di libri. Etica perché la conservazione e la protezione del sapere sono di importanza critica per il progresso dell’umanità. E nobile perché quest’impresa è giusta per il nostro tempo, giusta per il futuro, giusta per il mondo dell’editoria, giusta per tutti noi”. Secondo la preside, l’Università del Michigan aveva il dovere di partecipare al progetto poiché rientra pienamente fra i suoi scopi: la conservazione dei libri, l’accesso sempre più ampio all’informazione e la diffusione della conoscenza. In molte situazioni e contesti (es. guerre civili o disastri naturali), i libri digitali possono essere gli unici libri a sopravvivere, e anche dove vi sia massima cura nel preservare i libri, una buona parte va comunque persa per il normale deterioramento progressivo.

Ovviamente la preside ha voluto rassicurare gli editori sulla tutela del diritto d’autore da parte di Google, sottolineando come sarà permessa la lettura solo dei libri ormai non più coperti da copyright: “Il fatto che la nostra biblioteca possegga una copia digitale di un testo, non ci autorizza certo a ignorare la legge e distribuirlo in modo non autorizzato. Credetemi, gli studenti non leggeranno copie digitali di Harry Potter nei dormitori. Salvaguarderemo l’integrità di questo archivio con la stessa diligenza che accordiamo ai nostri materiali più preziosi, come i registri medici, i dati del Dipartimento della Difesa, e i virus altamente infettivi usati per la ricerca”.
Inutile dire che l'esito della causa legale in corso negli Stati Uniti avrà conseguenze in tutto il mondo soprattutto riguardo alla questione cruciale della tutela del diritto d'autore contrapposta alla libera diffusione della conoscenza, in rete e non solo.

 
Articoli correlati

Social network, narrazioni e identità digitali
[leggi]

Il tablet e l’inclusione scolastica
[leggi]

Manipolare quel che si crea, un altro modo per imparare
[leggi]

Quando la classe è digitale
[leggi]

Soluzioni di apprendimento e tecnologie didattiche
[leggi]

Rappresentare la conoscenza
[leggi]

Dalle mappe concettuali allo spazio digitale
[leggi]

I database digitali e la carta geografica
[leggi]

Dalle digital skills alla digital competency
[leggi]

Il contributo dell’Unione Europea per ogni europeo digitale
[leggi]

A colloquio con l’Europa sulle classi creative
[leggi]

Intervista al Prof. Alfonso Molina
[leggi]

Il valore educativo delle dinamiche del gioco
[leggi]

Visible Thinking, Slow Learning
[leggi]

Crossmedialità e apprendimento
[leggi]


    © indire 2014 crediti