Grafo

I media telematici come strumento per la comunicazione scientifica

Bollettino telematico di filosofia politica
bfp
Home > Didattica > Media telematici

La ricerca come attività collaborativa e distribuita

Introduzione
a. Biblioteche e web: l’accesso al sapere scientifico
b. La pratica della ricerca in rete

Introduzione

Le formulazioni teoriche alla base delle invenzioni tecnologiche trattate in precedenza, in particolare l’articolo di Alan Turing e il saggio di Vannevar Bush, condividono un importante presupposto comune: il fatto che la scienza, intesa tanto come processo di creazione del sapere quanto come il bagaglio delle conoscenze acquisite accumulatesi nel corso della storia, sia un insieme continuo, un’infrastruttura mobile costruita tramite collegamenti tra elementi preesistenti. Turing è scandalizzato dal fatto che, un’osservazione tanto banale, non sia ovvia: l’errore, comune ai filosofi e ai matematici, “consiste nel presupporre che appena un fatto si presenta alla mente, tutte le conseguenze di questo fatto saltino fuori simultaneamente”. La ricerca scientifica, tuttavia, non funziona così; ogni scoperta poggia sulla conferma o sulla confutazione di precedenti risultati, propri o altrui. “Siamo nani sulle spalle di giganti”, scriveva Newton, riprendendo un topos che, a partire da Platone, attraversa il pensiero filosofico occidentale e che ha il suo culmine nella filosofia dell’illuminismo; la stessa ipotesi che Vannevar Bush pone a fondamento dell’idea di ricerca, il fatto che la conoscenza umana sia il prodotto di un processo collaborativo, che attraversa la storia e la trascende 2 .

Le sezioni che seguono sono dedicate a descrivere i principali strumenti per la conservazione e la comunicazione del sapere scientifico e a suggerirne possibili usi.

a. Biblioteche e web: l’accesso al sapere scientifico

Tradizionalmente, i centri di archiviazione e di disseminazione del sapere sono state e sono le biblioteche. Si narra che nella Biblioteca di Alessandria, la più grande dell’antichità, fossero contenuti oltre 500.000 rotoli. Oggi, la quantità e le tipologie di documenti raccolti nelle biblioteche (pubbliche, statali, universitarie, ma anche collezioni e archivi privati, etc.) sono numerosissime: oltre alle riviste, vi si trovano monografie, collane, raccolte di saggi e atti di convegni, documenti ufficiali (tra cui quelli legislativi) più la cosiddetta letteratura grigia (tesi di laurea e di dottorato, report interni e altra documentazione di ricerca). I materiali vengono archiviati e catalogati in molteplici forme generalmente standardizzate, per essere reperiti, consultati e riutilizzati (citati, tradotti, etc.) dal pubblico dei lettori.

Nell’arco degli ultimi decenni, le biblioteche si sono informatizzate ed automatizzate, mettendo in rete i propri cataloghi e offrendo strumenti di ricerca sempre più avanzati. L’articolo di Bush, più volte ricordato, ha avuto un influsso fondamentale non soltanto sullo sviluppo dell’idea alla base del Web, ma anche sulla messa a punto di uno strumento importantissimo nella storia recente ed attuale delle biblioteche e della conservazione della letteratura scientifica, Lo Science Citation Index (SCI).

Lo SCI è uno strumento ideato nei primi anni Cinquanta da Eugene Garfield in risposta all’esigenza di poter disporre di un sistema bibliografico per la letteratura scientifica in grado di rendere ininfluenti le citazioni non rilevanti (di dati falsi, incompleti e obsoleti). Non potendo leggere tutto, chi fa ricerca deve poter disporre di criteri di qualità sui quali basarsi: lo scopo di un “indice delle citazioni scientifiche” sarebbe stato quello di rendere possibile al ricercatore la selezione delle citazioni importanti e degli articoli fondamentali per la sua ricerca.

Come Bush, Garfield pone al centro della riflessione due elementi essenziali: l’importanza delle “citazioni”; e il problema della selezione dell’informazione scientifica.

Perché un indice basato sulle citazioni? “Se uno considera i libri le macro-unità del pensiero, e gli articoli di rivista le micro-unità, l’indice delle citazioni si concentra sulle sub-micro-unità (molecolari) del pensiero”, scrive Garfield. Gli scienziati, spesso, sono interessati ad un’idea particolare piuttosto che ad una concezione generale, e se appropriatamente pensati e sviluppati, indici di “pensieri” possono essere estremamente utili ai fini della selezione dell’informazione: nel processo della ricerca bibliografica, gli indici per soggetto ricoprono un ruolo minimo, anche se significativo, poiché servono semplicemente da punto di partenza della ricerca. I limiti del mezzo, secondo Garfield, stanno nel fatto che è impossibile creare indici per soggetto che coprano tutte le possibili impostazioni di cui lo scienziato ha bisogno. Gli indici a soggetto sono schematici, e la possibilità di incrementare il numero dei soggetti non elimina la rigidità del mezzo; perciò, neppure una migliore standardizzazione della classificazione è risolutiva. Viceversa, sono necessari nuovi strumenti bibliografici che aiutino a colmare la distanza tra chi crea il documento, cioè l’autore, e l’impostazione dello scienziato che cerca l’informazione.

L’indice delle citazioni viene così descritto come un indice “basato sull’associazione delle idee”, in grado di offrire al lettore tutta la libertà d’azione che richiede, permettendo un metodo di ricerca modellato sul soggetto.

Garfield fa riferimento ad alcuni esempi di indici che funzionano, già dalla prima metà dell’Ottocento, grazie a sistemi analoghi, e propone di sviluppare un codice di citazioni per la scienza: ad ogni articolo è associata una doppia serie di numeri, la prima corrispondente alla rivista in cui è stato pubblicato, la seconda scelta arbitrariamente, che identifica l’articolo stesso. La tabella mostra un esempio del sistema di codifica di un articolo:

Nella figura l’elenco delle fonti citanti si limita alla seconda voce; per l’elenco completo e una descrizione dettagliata del meccanismo, si può consultare l’articolo di Garfield on-line.

Sotto ciascun codice numerico, per esempio 3001-6789, sarebbero ordinati altri codici numerici che rappresentano gli articoli che citano l’articolo in questione, accompagnati da un’indicazione sul tipo di fonte citante (es. articolo, recensione, traduzione, opera originale, etc..). Nei fatti, il sistema offrirebbe una lista completa, relativa alle pubblicazioni coperte, di tutti gli articoli originali che hanno citato l’articolo in questione.

Come lo stesso Garfield mette in luce, l’impatto di un articolo si riferisce ad un elenco di pubblicazioni limitato (il corsivo nel testo). Perché tale sistema funzioni è infatti necessario stendere un elenco delle pubblicazioni (le riviste) e catalogarle (assegnando a ciascuna un codice, nell’esempio sotto: 11123s). L’esempio in figura (sotto) mostra l’elenco delle citazioni di un articolo, e indica le fonti citanti.

Nello stesso articolo Garfield suggerisce possibili impieghi pratici di un simile indice, che si rivelerebbe in particolare molto utile nelle ricerche storiche al fine di valutare il significato di un’opera calcolando il suo impatto sulla letteratura e il pensiero del tempo, e nelle scienze umane, filosofiche e sociali, nel tracciare percorsi che ricostruiscono l’origine e l’evoluzione di un’idea. Garfield aggiunge che un tale fattore d’impatto (impact factor) potrebbe rivelarsi uno strumento di valutazione più indicativo e significativo rispetto al conteggio assoluto del numero delle pubblicazioni scientifiche. Infine, l’indice delle citazioni faciliterebbe la comunicazione tra scienziati e la nascita e lo sviluppo di nuove idee.

Garfield si pone il problema di gestire grandi quantità di dati, e propone di applicare il sistema ad un numero ristretto di riviste, poi rientrate nel numero dei “core journals”, le riviste più prestigiose. Il sistema abbraccia, dalla sua ideazione, un’impostazione centralizzata al controllo bibliografico – e se i limiti di tale impostazione sono connaturati al mondo della stampa, e un’impostazione distribuita poteva suonare impensabile a causa della limitatezza dei mezzi a disposizione (in primo luogo dall’assenza della rete), questi limiti hanno riscontri negativi di portata ampia.

L’accentramento dell’indice:

  • può diventare un potente strumento di controllo dell’informazione, e creare profonde distorsioni nell’organizzazione della comunicazione scientifica. Lo SCI, ristretto ad un numero limitato di riviste fondamentali (core journals), si è rivelato un efficace strumento per la gestione delle carriere universitarie ed ha attribuito molto potere ad un ristretto numero di editori, dando luogo alla cosiddetta “crisi del prezzo dei periodici” 3

  • Riduce la possibilità di trovare informazioni al di fuori del nucleo fondamentale delle riviste SCI, limitando l’impatto di un sistema basato sulle associazioni; se la ricerca si nutre spesso di annotazioni secondarie e segue piste parzialmente esplorate, l’esclusione di intere aree della conoscenza umana dall’indice crea una “scienza di serie A” e una “scienza di serie B”, e rende l’accesso alla seconda pressoché impossibile.

A metà degli anni Sessanta, quando Internet non era ancora stata concepita, anche Teodor Nelson, umanista di formazione, ha avanzato l’ipotesi di costruire un sistema informativo basato sulle associazioni. A differenza del sistema di Garfield, orientato prevalentemente al lettore, il progetto di Nelson non distingue il punto di vista del ricercatore-lettore e quello dell’autore: l’“ipertesto”, scrive Nelson, è la forma più generale di scrittura, una scrittura non sequenziale che riflette la struttura di ciò che scriviamo e facilita la produzione collaborativa e il riuso della conoscenza. La struttura reticolare del pensiero (figura di sinistra), viene riprodotta nell’organizzazione dell’informazione collegata attraverso associazioni (figura di destra):

In Literary Machines 90.1, Nelson descrive, contestualmente all’idea di “ipertesto”, il progetto (oggi ancora in atto) Xanadu, “un sistema universale di editoria e di archiviazione elettronica”. Xanadu è un programma per creare e organizzare la letteratura scientifica in forma ipertestuale che, se realizzato, incarnerebbe tanto il ruolo degli editori, quanto i compiti delle biblioteche tradizionali. Si tratterebbe infatti di una vera e propria reinvenzione della biblioteca per costituire un unico sistema planetario integrato e decentrato, in grado di rappresentare la struttura dell’informazione tenendo traccia del modo di operare quotidiano del ricercatore, e di offrire strumenti più adatti a metterlo in pratica.

L’ipotesi alla base di Xanadu era la possibilità di creare un sistema che unificasse tutti gli altri, in grado di offrire tanto uno strumento di archiviazione quanto un mezzo di indicizzazione per il materiale archiviato – “una rete ipertestuale aperta e facile da usare”. Sin dalla sua prima formulazione, l'ipertesto avrebbe mantenuto una parte delle funzioni assolte dalle riviste cartacee e ne avrebbe integrate altre: “lo sviluppo della parola scritta ha perfezionato, in un continuo processo evolutivo, i meccanismi della citazione, del riferimento e della bibliografia. Le pubblicazioni scientifiche hanno sviluppato convenzioni molto precise, i giornali popolari sono molto più vaghi rispetto alle fonti, e la maggioranza di ciò che si pubblica è una via di mezzo tra questi due estremi”. La struttura dei collegamenti, indipendentemente dal rigore con cui sono codificati, scrive ancora Nelson, fornisce gli elastici invisibili che, attraverso i documenti, tengono assieme i pensieri. Così, Xanadu e programmi simili avrebbero svolto un’importante funzione formativa, abolendo la sequenzialità e promuovendo l’iniziativa; ognuno sarà libero di scegliere la propria spiegazione, profetizzava nel 1981 Nelson, e di tornare sui propri passi, come il lavoro creativo impone.

La previsione di Nelson suona molto simile a come oggi il Web ci appare: un enorme contenitore o una ragnatela di informazioni di tipo molteplice, scientifiche e no. La caratteristica fondamentale che accomuna l’ipertesto e il Web è la possibilità di evidenziare le relazioni tra documenti, ovvero di collegarli tra loro, citandoli. A differenza diXanadu, il Web non è un programma, ma un insieme di protocolli, e la pubblicità dei protocolli rende lo spazio dell’informazione aperto ad ogni tipo di contenuti, compresi i cataloghi delle biblioteche, e le risorse tradizionalmente scientifiche. Nell’ultima sezione dell’ipertesto, che segue, confronteremo diversi strumenti pratici per la ricerca della letteratura scientifica in rete.

Anche se il Web contiene grano frammisto a loglio, le potenzialità di un sistema informativo basato su collegamenti si sono mostrate dirompenti nello stesso ambito ristretto della comunicazione scientifica: i link ipertestuali possono essere seguiti nel giro di pochi secondi, invece che in settimane di telefonate e di inoltro della posta, e le possibilità della ricerca tramite collegamenti si stanno sviluppando in più direzioni.

Tuttavia, perché Internet e il Web possano essere a pieno titolo considerati mezzi per la comunicazione scientifica deve essere affrontato il problema, che Tim Berners-Lee non ha mancato di considerare, relativo alla selezione delle risorse secondo criteri di qualità; è lo stesso problema affrontato da Garfield, per la cui risoluzione l’inventore del Web avanza una diversa risposta, basata sulla decentralizzazione e su un sistema di filtri semantici scelti dal navigatore che restano all’esterno del sistema; grazie ad essi, il Web del futuro sarà probabilmente in grado di sfruttare le nuove tecnologie e di trasformare i lettori in veri e propri “battitori di piste”, che sappiano scegliere le piste migliori e arricchire le precedenti, aprendo percorsi nuovi e inesplorati.

b. La pratica della ricerca in rete

Come si legge in rete 4 ? Banalmente, esistono tre modi per raggiungere una pagina sul Web:

  • inserendo l’indirizzo (URL) esatto nel browser, si stabilisce una connessione diretta col punto desiderato (quando ad esempio cominciamo una ricerca, e digitiamo l’URL www.google.it nel browser, il protocollo http ci collega direttamente al sito di Google);

  • navigando, cioè seguendo una pista tra i link che collegano il punto di partenza al punto di arrivo. Se non si sa necessariamente che cosa si cerca; a volte ci si ritrova lontano da dove siamo partiti. L’idea di registrarle e poi scambiarle è parzialmente realizzata dai bookmark. In realtà, alcuni sistemi permettono di visualizzare i grafi dei percorsi; se diffusi, saranno strumenti molto utili.

  • cercandola tramite un motore di ricerca. I motori di ricerca fanno uso di differenti algoritmi (generalmente segreti) che rispondono a criteri abbastanza noti: Peter Suber, uno dei massimi esponenti del movimento Open Access, ha recentemente redatto, assieme con Google, un elenco di raccomandazioni da seguire per rendere i documenti depositati negli archivi aperti, più facili da indicizzare e da trovare a chi fa ricerche con Google.

Un’utile pratica è provare diversi motori (si può cominciare a partire dalla pagina dell'hacker finlandese Fravia: http://www.searchlores.org/main.htm, dietro cui vale la pena perdere un po’ di tempo), sperimentandone le caratteristiche.

Strumenti specifici per la ricerca scientifica sono gli OPAC (cataloghi on-line ad accesso pubblico delle biblioteche), tramite i quali si ottengono le informazioni bibliografiche e la collocazione nella biblioteca (es. la Library of Congress; il MetaOPAC pisano). Per informazioni su libri recenti e stranieri che non si trovano in biblioteca, è utile consultare anche siti commerciali come Amazon, che offrono servizi di grande utilità anche per la ricerca bibliografica come “Customers who bought this book also bought”.

Le biblioteche offrono oggi potenti strumenti di ricerca, e –in alcuni casi - l’accesso via rete alle risorse digitali; sempre più fonti sono accessibili, anche grazie alla diffusione del movimento Open Access 5 In Italiano, esistono alcuni progetti degni di nota che mettono a disposizione libri, articoli e, in generale, fonto primarie; due esempi sono:

In inglese e in altre lingue esistono numerosi strumenti che facilitano la ricerca di letteratura scientifica, e permettono l’accesso ai contenuti. Tra questi:

  • Perseus, (particolarmente utile per leggere i classici greci e latini, in lingua originale e in traduzione inglese).

  • HyperNietzsche (che permette l'accesso ai manoscritti del filosofo tedesco, alle trascrizioni e alla letteratura secondaria)

  • La "Directory of Open Access Journals" (che indicizza più di 2500 riviste)

Recentemente, sono stati sviluppati strumenti ancora non molto evoluti che rintracciano le citazioni tra i testi. Due esempi significativi sono:

La rete offre inoltre varie guide introduttive all’interpretazione e alla redazione delle citazioni delle fonti bibliografiche, utili sia per leggere che per scrivere:



[2] Che le idee siano “di tutti” suona oggi un’affermazione peregrina. Il concetto di paternità intellettuale infatti, pur di origine piuttosto recente, si è ben radicato nella cultura della carta stampata. La sua nascita è legata al modo in cui la comunità degli scienziati, al diffondersi della stampa a caratteri mobili, ha deciso di strutturare il discorso scientifico; la prima rivista scientifica (fondata nel 1665), funzionando da “ufficio brevetti delle idee scientifiche”, garantiva, col conferimento da parte di pari di un titolo di "nobiltà”, un particolare titolo di proprietà (quella intellettuale); nel 1710, lo Statute of Anne ne sanciva il diritto che si estendeva a 14 anni dalla pubblicazione. Oggi, in Italia, il diritto alla paternità intellettuale dura settant’anni dopo la morte dell’autore. Le cause di una tale estensione, e il dibattito relativo, sono questioni che esulano dallo spazio di questo ipertesto.

[3] Si confronti, su questo, l’articolo di J-C. Guédon, La lunga ombra di Oldenburg: i bibliotecari, i ricercatori, gli editori e il controllo dell'editoria scientifica, e in particolare il paragrafo 6: Lo Science Citation Index e alcune delle sue conseguenze, BTFP 2004.

[4] La maggior parte dei documenti viene raggiunta a partire da un numero limitato di nodi, detti hub (connettori), che si collegano alle diverse risorse tramite link monodirezionali. Il Web è, in particolare, un grafo etichettato orientato, e la sua topologia rende il 60% dei nodi inaccessibili. Ciò nonostante, tramite la rete è possibile un’enorme quantità di informazioni in continua crescita.

[5] Negli ultimi dieci anni, la diffusione della rete degli "archivi aperti" (Open archives), ha aperto ulteriori possibilità, anche fuori dalle biblioteche e dalle loro reti locali (la gran parte delle risorse che le biblioteche acquistano, infatti, non sono accessibili a chi è esterno). Quale sarà l’impatto di simili iniziative è una questione delicata: l’accesso ai metadati (tramite OAIster, ARC - A Cross Archive Search Service, e altri software analoghi) non comporta direttamente l’accesso ai contenuti; e l’accesso ai contenuti non è sufficiente alla disseminazione degli stessi tanto che il reale impatto dell’Open Access, come ha avuto il merito di sottolineare Jean Claude Guédon, dipenderà da quanto sarà capace di far crescere l’accessibilità.


Creative Commons License
This work is licensed under a Creative Commons License