Category Archives: Open data

L’onore degli ambasciatori: citazioni ad accesso aperto

Chi pubblica i propri lavori ad accesso aperto fa un uso pubblico della ragione. Chi preferisce l’accesso chiuso ne fa un uso privato: anziché rivolgersi ai cittadini del mondo valendosi della miglior tecnologia di comunicazione disponibile al momento, parla a un gruppo ristretto, selezionato con criteri economici. La scelta dell’accesso chiuso è di solito dovuta o a un’adesione d’abitudine alla prassi della comunità accademica di riferimento, o alla cura per la propria carriera e al timore che una pubblicazione ancora percepita come poco tradizionale possa condurre a valutazioni negative. Qui il teatro dell’azione non è una sfera pubblica virtualmente universale, bensì istituzioni particolari.

La citazione è “la moneta corrente nel commercio della comunicazione scientifica ufficiale“. Serve, quando costruisco tesi su idee altrui, sia a pagare dei debiti, sia a esibire la solidità del mio credito: la mia voce suona più forte, sostenuta dal patrimonio di letteratura che ho prelevato dalla banca del sapere.

La citazione è anche la materia prima degli indici bibliometrici, che possono essere decisivi per la valutazione della ricerca, gli avanzamenti nella carriera e le politiche d’acquisto delle riviste nelle biblioteche. In questa seconda funzione, le citazioni non sono moneta soltanto metaforicamente, ma anche in un senso assai letterale.

In un’opera pubblicata in rete le citazioni, in forma di link, sono moneta anche nel senso dell’economia dell’attenzione: tutte le volte che faccio un collegamento a una risorsa, migliorando il suo ranking nei motori di ricerca e rendendola più visibile, aumento il suo valore. E dato che i testi ad accesso aperto sono citati di più, ottenervi citazioni significa ricevere un bellissimo regalo.

Se le risorse citate sono a loro volta ad accesso aperto, la citazione è un segno di gratitudine per il dono della loro presenza. Ma se sono ad accesso chiuso si può dire lo stesso?

George Monbiot, in un recente articolo sul Guardian, ha chiamato gli oligopolisti dell’editoria scientifica “i capitalisti più spietati del mondo occidentale”, perché sfruttano il lavoro, per loro gratuito, di ricercatori e revisori finanziati con fondi pubblici, privatizzandone il prodotto e imponendogli un prezzo esorbitante. Che senso ha, per chi sceglie l’accesso aperto, far loro pubblicità gratis e senza reciprocità, per il loro profitto?

Potremmo raccomandare a chi pubblica ad accesso aperto la soluzione radicale, ma ingiusta, di citare esclusivamente risorse ad accesso aperto. Il marketing dell’attuale oligopolio della comunicazione scientifica tende a farci credere che la validità di un contenuto dipenda dal luogo in cui viene pubblicato (Björn Brembs, What’s wrong with scholarly publishing today? slide 87): se escludessimo la possibilità che un’idea veramente buona appaia in una rivista ad accesso chiuso commetteremmo lo stesso errore. Si può allora pensare a una politica di riduzione del danno, con alcune innovazioni rispetto alla consuetudine.

1. Preferire sistematicamente la letteratura ad accesso aperto;

2. citare i documenti ad accesso aperto depositati negli archivi istituzionali e disciplinari anche quando ne è stata pubblicata una versione ad accesso chiuso;

3, quando il testo da citare è rilevante per le idee che contiene e non per l’autore, cercare un documento ad accesso aperto che riporti tesi analoghe, anche quando questo significhi menzionare il lavoro di un dottorando in luogo di quello di un’academic star;

4. se il testo ad accesso chiuso è insostituibile, non citarlo direttamente, ma citare le risorse ad accesso aperto che lo segnalano e lo schedano; se mancano, produrre una sua breve presentazione ad accesso aperto per l’uso della citazione, avendo cura di sottolineare, quando è il caso, che la risorsa è ad accesso chiuso e a pagamento, mentre avrebbe potuto non esserlo.

La citazione di seconda mano non solo lascia quasi invariato l’impatto citazionale del testo ma ha un altro, importante, pregio.

In un ambiente in cui l’informazione è fin troppo abbondante il curatore – o il battitore di piste alla Vannevar Bush – ha un ruolo creativo; indica da che parte voltarsi, riduce la complessità con criteri più raffinati e umani degli algoritmi basati sulla popolarità, produce idee nuove da nuove combinazioni di concetti già noti. Già soltanto per questo merita di essere riconosciuto.

Ma il curatore che segnala in accesso aperto una risorsa ad accesso chiuso, esponendone il contenuto, fa qualcosa di ancora più significativo: libera per l’uso pubblico della ragione una risorsa che era a uso privato, dice nella luce quanto è stato detto nelle tenebre, grida sui tetti quanto gli è stato sussurrato all’orecchio. In questo senso il vero studioso è lui: perché è lui che racconta ai cittadini del mondo quanto l’autore aveva riservato agli eletti selezionati da un carisma economico.

A tutti noi, quando abbiamo scritto la nostra tesi di laurea, è stato detto non era bello fare citazioni di seconda mano, perché ci si esponeva al sospetto di non aver letto i testi citati e al rischio di recepire le eventuali inesattezze della citazione copiata. La politica di citazione qui proposta innova questa regola, indicando una situazione in cui la citazione di seconda mano è doverosa, perché non è un segno della pigrizia del citante, ma di una scelta – spesso non del tutto consapevole – del citato, che parla a pochi e per interessi particolari quando potrebbe parlare a tutti e per interessi universali. La citazione di seconda mano renderebbe evidente che chi rinuncia a entrare in prima persona nella sfera pubblica deve rassegnarsi alla mediazione – non necessariamente benevola e accurata – di qualcun altro che si prende il suo merito. E che oggi l’uso pubblico della ragione, superati i limiti tecnologici ed economici dell’età della stampa, si fa nell’accesso aperto.

Questa proposta nasce dall’esperienza della comunicazione ancora prevalente nell’ambito umanistico e tenta di affrontare il problema della mancanza di reciprocità nel rapporto fra accesso aperto e accesso chiuso, in un mondo in cui buona parte della ricerca mainstream continua ad adottare la seconda opzione, spesso soltanto per mancanza di consapevolezza. Ci possono essere soluzioni migliori? La discussione è aperta.

–dnt

Tags:

Accessi: 351

Antonella De Robbio, Silvia Giacomazzi, Dati aperti con LODe

In questo articolo in italiano, pubblicato su Bibliotime, Antonella De Robbio e Silvia Giacomazzi ci raccontano che cosa sono gli Open Data e in particolare i dati bibliografici aperti, dati che, affermano le autrici, si trovano a metà tra due territori: da una parte, l’ambito della trasparenza amministrativa e delle forme di cittadinanza attiva che la prima rende possibile (Open Government Data), e dall’altra il cosiddetto Open Access inteso in senso ampio: l’accesso libero e gratuito ai risultati e ai dati scientifici (Open Science).

Le autrici ci danno così una definizione completa di dati bibliografici aperti, considerando sia gli aspetti giuridici che consentono un reale uso e riuso dell’informazione, sia i requisiti tecnici (Linked Data) che ne permettono l’interoperabilità e la contestualizzazione, spiegando anche perché oggi i tempi siano finalmente maturi per una convergenza tra il movimento Open Access e la comunità del Web semantico (ora Linked Data).

Accessi: 238

Andrea Zanni, Collaboratory Digital Libraries for Humanities in the Italian context

Archiviato su E-Lis, il testo si occupa del senso attuale e futuro dell’uso delle tecnologie informatiche nella ricerca umanistica, nell’interessante prospettiva dell’autore, matematico per formazione e segretario di Wikimedia Italia.

Il web, secondo Tim Berners-Lee, non è stato inventato come un mezzo per scorrere delle pagine, ma come uno spazio di informazione per permettere a chiunque di comunicare condividendo conoscenza – uno spazio nel quale perfino lo studioso di scienze umane potrebbe uscire dalla solitudine.

Il fondatore dell’informatica umanistica (digital humanities) è un italiano, il gesuita Roberto Busa, che durante la seconda guerra mondiale cominciò a cercare macchine per l’automazione dell’analisi linguistica dei testi scritti, trovandole nel 1949 presso l’IBM. La composizione del suo Index Thomisticus è dunque parallela alla storia della rivoluzione digitale della seconda metà del secolo scorso.

Le digital humanities usano strumenti informatici per l’ecdotica e la filologia, linguaggi di mark-up per la rappresentazione dei testi in modo strutturato, formale e semantico e la loro connessione con metadati interpretativi e descrittivi, nonché con strumenti per la meta-informazione multimediale, e riflettono sui documenti digitali e sulle loro caratteristiche. Secondo padre Busa, l’informatica testuale si divide in una corrente documentaristica, che si occupa delle infrastrutture della comunicazione telematica, una editoriale, che si occupa della pubblicazione dei testi in entità discrete, e una ermeneutica, associata con l’analisi linguistica – e col suo personale progetto di un linguaggio disciplinato che consenta la traduzione automatica.

Tradizionalmente, la ricerca umanistica è un mondo irto di barriere disciplinari, popolato da studiosi individualisti. L’Italia, in particolare, dominata dal conservatorismo di una gerarchia gerontocratica, è priva di progetti istituzionali di digitalizzazione in grande stile – sul modello di Gallica e lascia questo compito a iniziative amatoriali, come LiberLiber o la stessa Wikipedia. Eppure, il potenziale di collaborazione intrinseco nel web può dare i suoi frutti anche nel nostro ambito: io stessa, senza essere una studiosa di Tommaso, ho potuto facilmente individuare come tale un importante riferimento tomistico in un testo di Kant, proprio grazie al lavoro iniziato da padre Busa. Ma si può fare molto di più: come afferma Gregory Crane, fondatore del Perseus Project, mentre l’invenzione della scrittura, amplificata da quella della stampa, ha reso possibile immagazzinare le idee fuori dai cervelli umani, le biblioteche digitali, con testi che non sono più letti e connessi solo da esseri umani, ma anche da macchine, hanno già cominciato a separare dai cervelli l’intelligenza e l’azione. I limiti di questo processo sono ormai soltanto culturali. Il mondo della stampa era un mondo di autori, che legittimavano se stessi in quanto individualmente creativi o singolarmente sapienti, quello che sta nascendo è un mondo di auctores, di promotori di imprese collettive il cui senso cresce e si costruisce fuori di loro.

Le biblioteche digitali possono essere dei meri depositi per raccogliere testi, o anche degli ambienti virtuali di ricerca, con strumenti, interazioni e nessi più complessi, dal Memex fino ai Linked data. Nel contesto italiano, una biblioteca digitale per la comunità umanistica può essere collaborativa, o, ancor meglio, può diventare un ambiente virtuale condiviso di collaborazione (collaboratory)? E questa biblioteca digitale collaborativa e condivisa può essere costruita su un wiki?

Per rispondere a queste domande, l’autore sceglie la via dalla ricerca qualitativa tramite interviste a studiosi di scienze umane, fra le quali quella ad Umberto Eco, resa interamente pubblica su Wikinews. Le tre questioni pongono all’ambiente accademico sfide di complessità crescente.

Al primo livello, la libera disponibilità dei testi è nell’interesse immediato di chi fa ricerca. Perfino Umberto Eco, come autore, si rende conto che la cosiddetta pirateria è pubblicità a sua vantaggio e, come utente, apprezza la comodità di Wikipedia – salvo rifiutarsi di correggerla quando si imbatte in errori: “Se poi l’errore è di un altro, non vedo perché dovrei perdere tempo a modificare. Non sono la Croce Rossa.

Eco, nella sua intervista, presupponendo che le tecniche di selezione e di valutazione dell’attendibilità dei testi siano necessariamente il patrimonio di una élite, sostiene che la ricchezza di informazione non filtrata dalla rete faccia bene ai ricchi – cioè alla minoranza degli studiosi e faccia male ai poveri, cioè alla maggioranza composta da persone mediaticamente ingenue, incapaci di discernere l’informazione con la perizia del professore. Per questo l’azione di filtro da parte di comunità scientifiche ristrette e gerarchiche sarà sempre necessario. E sarà sempre necessaria, in luogo del sapere collettivo, l’individualità dell’autore: nelle scienze umane non esiste un progresso, nel quale le teorie inesatte vengono superate, ma da una parte non si butta via nulla e tutto viene riscoperto, dall’altra ciascuno ha pretesa di originalità e mal si adatta ad essere un mero “portatore d’acqua”.

Se le cose stessero per natura come le vede Umberto Eco, gli umanisti professionisti, nel pascolo tragico dei beni comuni della conoscenza, potrebbero tutt’al più fare i free rider che sfruttano parassitariamente il lavoro altrui. Altri intervistati, probabilmente meno famosi e influenti, la pensano però – come si riassume nel capitolo finale – in maniera diversa.

La cooperazione ha indubbiamente un forte potenziale di innovazione, in discipline altrimenti immobili. Un editing collettivo nello stile di Wikipedia, oltre ad abbassare i costi, favorisce un processo simile a quella neutralizzazione con la quale i filologi cercano di pervenire alla versione più attendibile del documento che studiano. Una voce di Wikipedia non è mai definitiva, ma è solo l’esito provvisorio di un comune work in progress, al di sotto del quale rimangono visibili le discussioni e le stratificazioni che hanno contribuito a crearla.

La stratificazione renderebbe anche possibile la convivenza di interpretazioni diverse, per esempio partendo dall’immagine del testo, sovrapponendovi la sua trascrizione con eventuali variazione, aggiungendovi all’esterno uno stand off mark up, dei link per rendere il testo concretamente intertestuale, e delle annotazioni collaborative e no, e lasciando alla fine uno spazio grande quanto la rete per la collaborazione sociale attorno ai testi. Il mondo della scrittura e del libro ci ha abituato a pensare all’umanista come uno studioso solitario; ma questa immagine potrebbe essere tanto mitica quanto quella dell’autore come individuo dotato di una creatività primigenia.

Perché questa virtualità diventi attuale, in modo tale che la digitalizzazione del nostro patrimonio culturale non rimanga prevalentemente nelle mani di dilettanti – sarebbe però necessario che ci fosse certezza sulla valutazione delle pubblicazioni digitali nei concorsi, e, soprattutto, che venisse creata, anche con pochi fondi – com’è reso possibile dal software libero – un’infrastruttura istituzionale per l’e-science.

Ma perché occorre attendere l’intervento – di questi tempi, improbabile – di immaginarie autorità lungimiranti? Uno degli intervistati di Zanni, con la sincerità dell’anonimato, ci aiuta a capirlo (pp. 99-100). L’accademico è dominato dalla paura di perdere il suo senso e il suo potere, ed è letteralmente terrorizzato dalla parola “collaborativo” – perfino quando la cooperazione renderebbe la ricerca più efficiente.

Una simile considerazione mi porta – avendo dedicato del tempo alla segnalazione e alla discussione del testo di un altro – a chiedermi perché questi studiosi così impauriti facciano ricerca. La cooperazione paritaria, per chi lavora per diffondere e far crescere delle idee, è uno strumento prezioso, che può apparire temibile solo se lo scopo implicito della ricerca si esaurisce nella conquista di fama e influenza individuale. Il disprezzo con il quale Umberto Eco distingue se stesso dalla Croce Rossa suggerisce – volendo insistere sulla metafora da lui scelta – che per molti di noi il dottor Guido Tersilli rimane ancora più degno di stima del medico che si impegna per salvare delle vite.

Tags:

Accessi: 283

Francesca Di Donato, Lo stato trasparente. Linked Open Data e cittadinanza attiva

Il libro, liberamente scaricabile a partire da qui,  presenta un’istantanea di un fenomeno recente: il movimento Open Government Data.

Questo movimento trae ispirazione dal software libero e della pubblicazione ad accesso aperto, fondate entrambi sulla scelta d considerare la conoscenza come un bene comune. Si tratta, questa, d una scelta perché i nostri ordinamenti impongono agli autori un regime di monopolio intellettuale, se questi non manifestano un’esplicita volontà contraria. Il movimento caldeggia l’adozione di licenze completamente aperte, senza la clausola “non commerciale”, per promuovere sviluppo economico e innovazione. In questa prospettiva, illustrando lo stato dell’arte del movimento alla fine del 2010, il libro cerca di chiarire le condizioni giuridiche e tecniche alle quali i dati possono essere definiti aperti, per l’uso degli amministratori pubblici.

Il movimento per i dati aperti lavora per la trasparenza e la leggerezza: in luogo di grandi progetti dall’alto, costosi e inefficienti (e-gov) propone semplici infrastrutture per pubblicare i dati, i quali, a loro volta, sono di per sé l’infrastruttura della nostra autocoscienza sociale. Questo modello, detto anche gov2.0, propugna dunque un’amministrazione trasparente e un controllo democratico partecipativo: la rete è un essenziale spazio di cittadinanza. Una sensibilizzazione politica su questo tema può avere anche un forte effetto di ritorno su dati non propriamente amministrativi, come per esempio quelli scientifici. Chi vuole che l’università pubblica metta a disposizione i suoi esperimenti e i suoi testi sta appunto chiedendo che un’amministrazione pubblica offra a tutti i suoi, peculiari, dati.

Non è sufficiente però che i dati siano aperti: essi possono diventare significativi solo se sono collegati fra loro e contestualizzati come linked data. Questa filosofia poggia su idee antiche – da Platone fino all’illuminismo – e può condurre a un vero e proprio rischiaramento digitale. Il Web Semantico, poi Linked Data, è stato a lungo confinato nelle discussioni di specialisti: il movimento OGD ha il pregio di metterne in luce le implicazioni politiche. Ora i dati a disposizione sono moltissimi e crescono in misura esponenziale, e ci sono anche tante applicazioni che permettono di usarli. Un esempio? OpenBilancio, che si propone di tenere sotto controllo le spese dei comuni italiani, in modo tale che chiunque possa vederle e incrociarle con altri dati, presenti e futuri, in formati linked.

Tags:

Accessi: 467