eBook. Il problema del formato

Delineati negli articoli precedenti alcuni degli aspetti fondamentali sulla storia dell’idea del libro elettronico, sui dispositivi di lettura e sul loro sviluppo, collegatone poi le caratteristiche alle situazioni di lettura, affronterò ora un altro importante aspetto della testualità elettronica: la ‘resa’ del testo.

A dispetto del libro a stampa, nel mondo digitale dispositivo di lettura e testo elettronico — il supporto e la ‘forma’ del testo — sono oggetti separati. Si incontrano nel momento della lettura ma hanno, prima e dopo, vita autonoma.

L’idea che per realizzare un libro elettronico basti trascrivere al computer un testo di un libro su carta è assolutamente ingenua; il lavoro da fare è molto più complesso.

Gino Roncaglia, La quarta rivoluzione. Sei lezioni sul futuro del libro

Emblematici sono gli eBook ‘solo testo’ del progetto Gutemberg a cui, all’intero dello stesso file, è premessa, per gli aspetti paratestuali, una sezione con alcuni metadati di base — come il nome dell’autore, il titolo, informazioni sull’edizione, compreso un breve riassunto sulle condizioni di distribuzione dei testi del progetto. Ancora più complessi poi nel caso di eBook in cui la rappresentazione non è esclusivamente testuale. Il risultato finale, un unico file, crea ambiguità nella differenziazione di ogni elemento. Inoltre, diventa complicato rappresentare altri aspetti del libro da cui si è partiti: sparisce la paginazione, la copertina, gli indici, mentre la suddivisione in capitoli deve affidarsi solo ad artifici grafici come qualche salto di riga e all’uso di maiuscole nei titoli.

In sostanza: il formato .txt è certo comodo perché quasi universalmente riconosciuto, ma è assai povero per la rappresentazione del complesso fenomeno testuale rappresentato da un libro. Ecco perché quasi tutti i formati utilizzati per la realizzazione di un e-book si basano, in una forma o nell’altra, su linguaggi di marcatura.

Gino Roncaglia, La quarta rivoluzione. Sei lezioni sul futuro del libro

Nel mondo digitale i linguaggi di marcatura sono ormai onnipresenti, anche se di norma rimangono nascosti all’utente — le pagine web sono costruite usando un linguaggio di marcatura, HTML, Hyper-Text Mark-up Language. Ciononostante, i linguaggi di marcatura disponibili sono molti, anche se basati o ispirati tutti su un unico meta linguaggio denominato XML1, eXtensible Mark-up Language, che può essere paragonato a «una specie di laboratorio in cui fabbricare linguaggi di marcatura specifici, rispettando alcune norme generali e comuni.» [Gino Roncaglia]

Al momento non abbiamo un linguaggio di marcatura adatto a rappresentare in maniera sufficientemente articolata e potente la ‘forma libro’ in tutte le sue caratteristiche. Fin dagli anni dei progetti di Kay e Hart, l’attenzione si è indirizzata verso due differenti direzioni: una è costituita dai fenomeni testuali di interesse soprattutto tipografico-editoriale — in primo luogo le caratteristiche della sua impaginazione, la resa sui dispositivi, la gestione dei diritti, i metadati che permettono di organizzare una biblioteca di titoli e di reperire quelli che ci servono. L’altra direzione porta invece a considerare il testo dal punto di vista filologico-critico, attento ai fenomeni testuali che possono interessare lo studioso — la struttura del testo (più che la sua resa a schermo), il rapporto di un testo con le sue eventuali fonti (manoscritti e edizioni diverse), la sua storia (revisioni e modifiche), e così via.

Naturalmente, fra queste due prospettive vi sono larghe sovrapposizioni. Ma al momento la scelta dell’uno o dell’altro approccio suggerisce l’uso di uno fra due diversi schemi: da un lato la marcatura .ePub, dall’altro la marcatura Text Encoding Initiative (TEI)2.

La nascita del formato .ePub

L’eBook ha conosciuto nel tempo diversi formati, alcuni proprietari altri no, ma nessuno di questi è riuscito a imporsi come standard.3

Gli sviluppi del Progetto Gutenberg, intrapreso da Micheal Hart negli anni Settanta, ha determinato un crescente interesse attorno alle potenziali opportunità scientifiche e commerciali dell’eBook. Diversi produttori si misero all’opera nel realizzare lettori dedicati che tuttavia leggevano esclusivamente formati di digitalizzazione differenti. Questo sviluppo caotico impose una riflessione sulla necessità di stabilire punti di riferimento comuni, spesso sottoposta però a meccanismi proprietari interessati soprattutto alla conquista di fette di mercato ai danni dei potenziali concorrenti.

Fu alla fine degli anni Novanta che un primo gruppo di lavoro, all’interno del quali troviamo produttori di dispositivi di lettura e relativi software, editori, distributori, principali associazioni bibliotecarie e vari esperti del settore, nacque allo scopo di formulare un linguaggio di mark-up comune. Questo gruppo, primo nucleo dell’Open eBook Forum (OeBF), realizzò come primo lavoro uno standard denominato OEB-PS o semplicemente OEB4.

In sostanza, un file OEB è una sorta di scatola compressa che contiene le componenti testuali dell’eBook in uno o più file, e le ’istruzioni’ per la loro corretta visualizzazione.

Lo standard OEB fu introdotto allo scopo di porre un freno alla guerra dei formati che caratterizza i primi anni del fenomeno eBook. L’OEB si proponeva infatti come uno standard aperto e condiviso in grado non solo di ricoprire il ruolo di formato sorgente per eBook protetti, ma anche per eBook senza protezione destinati alla pubblica condivisione.

Tuttavia, all’epoca, l’interesse delle aziende del settore non era rivolto alla ricerca di standard comuni e aperti, quanto piuttosto alla vendita commerciale del prodotto eBook. Il meccanismo di protezione costituiva pertanto un ulteriore elemento strategico fondamentale.

Nel 2000 la crisi che colpì le aziende Internet e produsse, come si è accennato precedentemente, un forte rallentamento nello sviluppo dei dispositivi di lettura, privilegiando la lettura lean forward su PC connessi in rete e pertanto di contenuti più adatti al formato PDF. Di conseguenza, lo sviluppo del formato eBook aperto e basato sull’XML venne rallentato notevolmente.

Ciononostante, il crescente numero di formati diversi di eBook e il sempre maggior numero di testi disponibili in rete, rese sempre più urgente il bisogno di uno standard che fosse, per le differenti dimensioni e marche di device di lettura, fluido e aperto.

Lo sviluppo del formato standard riprese tra il 2006 e il 2007, in corrispondenza della diffusione della seconda generazione di dispositivi dedicati e degli smartphone con schermi evoluti. L’Open eBook Forum cambia nome in International Digital Publishing Forum (IPDF)9 e OEB 2.0 diventa ePub con estensione .epub. L’acronimo sta per ‘Electronic PUBlication’, a indicare l’intenzione di fornire un formato generico adatto a rendere qualsiasi tipo di pubblicazione, dai libri alle riviste, dai quotidiani ai documenti ufficiali. Come formato di pubblicazione esso specifica e documenta una serie di caratteristiche che le pubblicazioni devono includere (il contenuto dei documenti, i fogli di stile, le immagini, i media, gli script, i font e altro ancora); mentre «da un punto di vista tecnico si può descrivere come un formato dichiarativo che codifica il testo in buona parte in XHTML e archivia molte informazioni in XML.»5

Per capire l’importanza del formato ePub e la sua affermazione come standard mondiale del libro digitale, bisogna innanzitutto capire come funziona, e come si differenzia dagli altri formati. Cosa lo rende più articolato di un documento HTML, più flessibile di un PDF e più gestibile di un doc? La risposta è una sola: quelli citati finora sono semplici formati, mentre l’ePub è un pacchetto che tiene insieme più tecnologie, e la sua forza sta nel modo in cui si riorganizza i singoli documenti contenuti al suo interno per fornire al lettore un unico testo.

L’ePub non porta con sé solo il testo e le immagini, ma anche tutto quello che serve a una corretta lettura del libro: dalla struttura XML ai fogli di stile CSS, dai font ai file audio, agli script. E permette a chi produce questi contenuti di veicolarli in un unico formato leggibile da tutti, piuttosto che in una serie di infiniti formati proprietari. È inoltre stato progettato per consentire ai sistemi di lettura di conoscere in anticipo, in modo semplice e affidabile, ciò che è contenuto in una determinata pubblicazione, dove trovare ogni elemento, che cosa si può fare con essa e come le parti sono in relazione tra di loro.

Tra le potenzialità di questo formato troviamo infatti l’accessibilità, possibile grazie al fatto che utilizza linguaggi web largamente condivisi.

Inoltre, permette di restituire la maggior parte delle caratteristiche del libro a stampa, tra cui: layout ben definito, con una struttura precisa ed elementi extratestuali e paratestuali (immagini, tabelle, note), il controllo sulle caratteristiche grafiche del volume — font, corpo e interlinea, corsivi, grassetti, maiuscoletti, immagini a tutti pagina o in linea e così via — e la creazione di elementi paratestuali come indice e copertina differenziati dal corpo del testo.

E ancora! Permette tutta una serie di implementazioni tipiche del digitale, dai link interni o esterni al testo agli elementi multimediali, di animazione o interazione — inserimenti di file audiovisivi, inserimento di audio sincronizzato con il testo, scena animate e interazioni con l’utente.

Infine, essendo un formato aperto, oltre a non essere legato a nessuno editore, distributore o produttore di eReader, può essere migliorato da chiunque, studiandone le tecnologie e cercando nuovi applicativi.

Nella pratica, l’IDPF ha messo a punto un formato che fosse riconducibile dalla maggior parte degli strumenti di lettura, e continua a implementarlo per venire incontro all’esigenza di veicolare contenuti sempre più complessi, che siano al contempo accessibili a tutti (sia in senso tecnico che culturale) e prevedibili, vale a dire che vengano letti alla stessa maniera da diversi strumenti eReader. Ma, come si vedrà, non è poi così vero.


Fonti

1 Extensible Markup Language (XML)
2 Un riferimento introduttivo al riguardo: Fabio Ciotti (a cura di), Il manuale TEI Lite: introduzione alla codifica elettronica dei testi letterari, Edizioni Sylvestre Bonnard, Milano 2005
3 Per definizione corretta si veda la voce ‘standard’ in Microsoft. Dizionario di informatica, Mondadori informatica, Segrate (Milano), 2006, 5° ed.
4 Per la documentazione sul formato OEBPS si rimanda al sito Internet Archive: Wayback Machine
5 Teresa Lupia, Mirko Tavosanis, Vincenzo Gervasi, Editoria Digitale, UTET, 2011, pp. 32

International Digital Publishing Forum
Gino Roncaglia, La quarta rivoluzione. Sei lezioni sul futuro del libro, Roma, Edizioni Laterza, 2010
Matt Garrish e Markus Gylling, EPub 3: le tecniche migliori per pubblicare ebook, Tecniche nuove, Milano, 2013
Alba Carella (a cura di), Dal libro all’ePub. Guida ragionata alla realizzazione di ebook, Carocci editore, Roma, 2014

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *