15 01 | 2012

Structure d'un document EPUB 2

Written by Tanguy

Classified in : Homepage, Debian-FR, Libre, April

Le logo EPUB : un E vert, avec en légende le mot ePUB

J'ai détaillé dans un autre billet l'intérêt du format EPUB. Comme on me pose souvent des questions sur la nature technique de ce format, et que je m'en pose moi-même de temps en temps, voici quelques explications concernant la version 2 de cette norme. Je n'ai pas encore eu le temps ni l'occasion d'étudier le format EPUB 3 pour le moment.

Objectif de conception

Le format EPUB a été conçu pour les publications électroniques, en utilisant autant que possible des technologies existantes :

  • les textes utilisent le format XHTML 1.1 ;
  • la table de navigation utilise le format NCX défini précédemment pour les livres numériques parlants ;
  • la description du livre avec ses méta-données utilise un format spécifique, OPF, qui intègre la sémantique Dublin Core ;
  • le point d'entrée utilise un format XML ultra-simple qui provient visiblement d'OpenDocument, quoiqu'il ne soit pas mentionné dans cette dernière norme ;
  • le tout est empaqueté dans un conteneur ZIP, une idée récupérée d'OpenDocument, qui la tient vraisemblablement de StarOffice et de Java.

Cette volonté de réutilisation comporte quelques inconvénients, parmi lesquels un certain manque d'homogénéité et un recoupement partiel entre les formats NCX et OPF qui implique la duplication de certaines informations. Bref, c'est à mon avis un peu plus compliqué que si ça avait été conçu de zéro, mais on ne peut pas dire que ça réinvente la roue, bien au contraire.

Le format EPUB est donc défini par l'International Digital Publishing Forum (IDPF), sous le forme de trois volets :

  • Open Container Format, qui définit ce qu'on appellerait naturellement la structure d'empaquetage ;
  • Open Packaging format, qui définit les formats de structuration qui font qu'un livre n'est pas seulement une série de documents HTML en vrac ;
  • Open Publishing Structure, qui définit les formats internes des fichiers qui constituent le contenu d'un livre, en se référant aux formats XHTML et CSS, pour l'essentiel.

Read more Structure d'un document EPUB 2

07 11 | 2011

De nouvelles liseuses numériques

Written by Tanguy

Classified in : Homepage, Divers, Debian-FR, April

Journée faste dans le domaine des liseuses numériques : deux nouveaux modèles viennent d'être annoncés coup sur coup, par la Fnac et Bookeen.

La Fnac commercialise sous son propre nom des liseuses numériques fabriquées par d'autres entreprises. Bookeen, quant à elle, est une société française spécialisée dans la fabrication de liseuses numériques.

Read more De nouvelles liseuses numériques

28 09 | 2011

Rédigez de l'EPUB !

Written by Tanguy

Classified in : Homepage, Debian-FR, Libre, April

Le logo EPUB : un E vert, avec en légende le mot ePUB

De nombreux ouvrages de documentation informatique libre sont distribués en PDF ou parfois en HTML. Le format EPUB, plus approprié pour de nombreux usages, est souvent négligé, probablement par ignorance. Voici donc quelques informations sur ce format.

Read more Rédigez de l'EPUB !

03 09 | 2011

Repacking ZIP-based containers

Written by Tanguy

Classified in : Homepage, Debian, Command line

An open package showing two egg-like objects

Several modern complex file formats are based on a ZIP container: this is at least the case of OpenDocument and EPUB. However, they are not simply a bunch of files joined into an archive, but they follow some rules in order to be easily recognized by tools such as file. As I had to unpack, modify and repack such a container, here is a recipe to do that.

Read more Repacking ZIP-based containers