Logo Laterza Fabio Metitieri _blank Riccardo Ridi
Logo Laterza Biblioteche in rete Biblioteche in rete Biblioteche in rete
Logo Laterza IndiceVai all'indice completo AcquistoAcquista il volume su www.laterza.it Torna all'homepage
Editori Laterza

Aggiornamento
giugno 2008

Introduzione

1. Le ricerche bibliografiche

2. Information retrieval:
strumenti e strategie

3. Opac e biblioteca virtuale

4. Biblioteche e Opac
nel mondo

5. Biblioteche e Opac
in Italia

6. Biblioteche
e Opac europei

7. Le biblioteche
e gli Opac statunitensi

8. Opac specializzati,
archivi e musei

9. Oltre i cataloghi: i testi

10. Banche dati: archivi
e host computer in Internet

11. Metarisorse generali
e informazioni per bibliotecari

Principali acronimi utilizzati

Bibliografia

Parte terza – Oltre i cataloghi: testi e banche dati

9. Oltre i cataloghi: i testi

[Introduzione]
Editoria elettronica e biblioteche digitali
Tavole di caratteri Iso
I formati dei testi digitali
I formati per gli e-book
Dagli e-book ai bit quasi di carta
Alcune biblioteche digitali italiane
Alcune biblioteche digitali francesi
Alcune biblioteche digitali di altri paesi
Google Print e la googlizzazione delle biblioteche
La conservazione dei bit
Riferimenti sull'analisi dei testi e sulle nuove forme del linguaggio
I periodici elettronici
Prestito interbibliotecario (Ill) e fornitura documenti (Dd)
Prestito interbibliotecario e fornitura di documenti in Sbn
Alcuni fornitori commerciali di documenti
Current contents, Current awareness services e Individual article supply
Copyright: un problema spinoso
Librerie virtuali
Le differenze tra Opac e librerie virtuali
La stampa on demand


 

[Questo paragrafo è stato scritto da Eugenio Gatto, del Centro interdipartimentale di documentazione e museo del Politecnico di Torino; su tali argomenti è disponibile in Rete Rappresentazione grafica del linguaggio, dello stesso autore, con Url <http://www.aib.it/aib/lis/std/b3.htm>]

Storicamente, gli elaboratori sono nati per eseguire calcoli numerici, ed era inizialmente sufficiente poter esprimere dati e risultati con le dieci cifre, e pochissimi altri segni. Presto, con i linguaggi di programmazione, anche solo per scrivere qualcosa che somigliasse alle ordinarie espressioni algebriche, venne aggiunto l'alfabeto (maiuscolo); per lungo tempo questo è stato l'aspetto caratteristico del «tabulato da calcolatore»: lettere maiuscole, numeri, segni di punteggiatura.

Già negli anni Sessanta le applicazioni ai testi (e a quei particolari testi che sono i cataloghi di biblioteche) erano numerose: meno importavano in quel caso numeri e calcoli, ma diventava indispensabile, soprattutto per una più umana leggibilità, l'uso di maiuscolo e minuscolo. La necessità fu enormemente accentuata dall'avvento dei piccoli (allora!) elaboratori, diffusi soprattutto per uso d'ufficio, e quindi come minimo a sostituire la macchina da scrivere.

Rispetto ad altri concorrenti, divenne predominante la scelta di caratteri che in ambiente internazionale si preferisce indicare come Iso 646 (nota storicamente anche come «Ascii character set»: i due nomi indicano strettamente la stessa cosa). [Nota degli autori: questo set in altre parti del libro è chiamato anche «Ascii ristretto», «Plain vanilla Ascii» o «Us-Ascii».] Si tratta di un insieme di 128 caratteri (le combinazioni possibili di 7 bit), 95 dei quali sono «stampabili» (numeri, lettere maiuscole e minuscole, segni d'interpunzione, accenti), e 33 sono invece «di controllo» (cioè corrispondono a significati specifici, spesso meccanici, per la macchina che li interpreta, come «a capo», «indietro di uno», ecc.).

Nella variante Irv (International reference version), questa tavola resta tuttora la sola universalmente condivisa da tutte le macchine, cioè interpretata allo stesso modo, per cui, per esempio, il 65º carattere è per tutti «A (maiuscola)». La posta elettronica, uno degli strumenti di comunicazione che più presto ha dovuto porsi il problema di essere leggibile anche su macchine diversissime, tuttora usa ordinariamente questo insieme di caratteri.

La situazione si è comunque complicata immediatamente, non appena quella tavola ha dovuto essere adattata per servire a lingue diverse, in caratteri non latini (greci, cirillici, ebraici, per non parlare delle lingue non alfabetiche, come il giapponese e il cinese). Ma anche per i caratteri latini: soprattutto per riprodurre, negli uffici, la situazione a cui le ben note tastiere delle macchine da scrivere ci avevano abituato, in modo da avere con un tasto solo le più comuni lettere accentate.

Per cui sono state definite numerose varianti nazionali di Iso 646 (ma non esiste ufficialmente una variante italiana), che rinunciavano ad alcuni caratteri (tipicamente parentesi quadre e graffe, barre dritte e rovesce, accento grave, circonflesso e tilde), per mettere al loro posto lettere accentate, giudicate «più utili». Si può immaginare come questo comprometta l'interpretazione del testo su macchine diverse, per quanto l'inconveniente sia di solito limitato ad alcune zone della tavola (sono salvi numeri, lettere maiuscole e minuscole, segni d'interpunzione principali).

Più solida, come soluzione, è quella, ora di uso normale, che ricorre a tavole da 256 caratteri (le combinazioni possibili di un ottetto, cioè di una sequenza di 8 bit: che è anche l'unità minima che ordinariamente si trasmette e su cui le macchine lavorano internamente). La tavola più usata in questa serie è la Iso 8859-1 (assai simile ad una precedente di nome «Latin1»), che è anche quella di base per i testi Html. La dicitura «-1» indica che si tratta in realtà della prima di una serie di tavole, in particolare quella adatta per l'alfabeto latino usato dalle lingue europee occidentali (dal portoghese al norvegese); Iso 8859-2 è piuttosto per quelle orientali (per esempio polacco); le altre della serie specificano alfabeti non latini (greco, ecc.).

In questa famiglia le tavole sono costruite tutte allo stesso modo: per la prima metà garantiscono la comprensione internazionale, e i primi 128 caratteri sono esattamente quelli di Iso 646 Irv; la seconda metà cerca di soddisfare, con altri 96 caratteri stampabili, le necessità di specifiche lingue o gruppi di lingue. Come esempio può valere il caso della posta elettronica: è tuttora richiesto che le sue «buste» (che qualunque sistema di transito deve poter interpretare correttamente) siano scritte con caratteri della tavola breve, ma il testo contenuto all'interno può usare le tavole estese (purché sia immediatamente specificato quale delle tavole estese viene usata).

Naturalmente, questo non vuole affatto dire che ogni possibile esigenza sia soddisfatta: l'elaboratore è arrivato, come disponibilità di caratteri, al livello di una macchina da scrivere (ricca, e spesso più di quanto siamo direttamente in grado di controllare). Ma senza essere, se non con software specifici e non ancora di uso ordinario, né una macchina da scrivere universale (il tentativo a cui mira Iso 10646, o «Unicode», complesso sistema per la gestione contemporanea di più famiglie di caratteri, ideogrammi compresi), né una macchina automaticamente incline all'equilibrio e alle finezze a cui ci ha abituato la buona composizione tipografica.