Introducción
El formato PDF no es el más cómodo para los lectores de libros electrónicos, básicamente porque no es repaginable. La solución se encuentra en otros formatos, como es el EPUB, que es un formato estándard y libre. De echo, es bastante sencillo de implementar, pero sin embargo, no existen muchas herramientas disponibles para ello.
Y entonces, ¿que hacemos con aquellos libros que tenemos en PDF?¿Cómo los convertimos a EPUB?
Existen varias soluciones, pero yo voy a decantarme por convertir el PDF a html y posteriomente a EPUB utilizando eCub, que es una herramienta para la creación de libros electrónicos en formato MobiPocket y EPUB.
También podemos decantarnos por Calibre, que es una muy buena solución, con el único inconveniente de utilizar las librerías Qt.
Voy a utilizar el libro «Copia este libro» de David Bravo, para hacer este ejemplo. Aunque las fuentes en html están disponibles, con lo que podríamos saltarnos el primer paso de convertir de html a pdf. «Copia este libro» en formato pdf, lo puedes descargar de microsiervos.
De pdf a html
Lo primero asegúrate que tienes el paquete «poppler-utils» instalado en Ubuntu. Para instalarlo desde el terminal:
sudo apt-get install poppler-utils
Una vez instalado, pasamos a convertir el archivo pdf en html, para ello, igualmente en el terminal:
pdftohtml copia_este_libro.pdf copia_este_libro.html
Una vez realizada la conversión, tienes que eliminar algunos archivos, para que el archivo EPUB quede algo mejor:
rm -f copia_este_libro.html
rm -r copia_este_libro_ind.html
Instalar eCub
eCub te permite importar texto y archivos html, para crear un archivo EPUB. Además te permite comprobar el EPUB generado, eso sí utilizando herramientas externas y generar audiolibros, utilizando eSpeak. Aunque es gratuito, no es de código abierto.
Lo primero es descargarlo desde la página del autor, seleccionado la opción que más te interese:
- 32-bit packages:
- eCub 1.11 tarball for 32-bit Linux
- eCub 1.11 Debian package for 32-bit Linux (Debian, Ubuntu, Xandros, gOS)
- eCub 1.11 RPM package for 32-bit Linux (Fedora, SuSE, Linpus)
- 64-bit packages:
Ahora en el terminal, pasamos a instalarla:
dpkg -i ecub_1.11-1_amd64.deb
Crear el archivo EPUB
En el menú de Ubuntu > Oficina > eCub
En la pantalla de inicio, seleccionanos New Project:
Y comienza el asistente, que nos guiará en el proceso de creación del archivo:
Rellenamos los datos básicos, hacemos clic en el botón Next:
Le damos nombre al archivo «Copiestelibro», y seleccionamos la carpeta donde hemos realizado la conversión de pdf a html, y pulsamos en botón «Next»:
Entre las opciones disponibles, elijo la primera puesto que en el directorio se encuentran los archivos que queremos compilar. Si quisieramos partir de un archivo en blanco seleccionamos la segunda, y hacemos clic en «Next»:
Aquí tenemos que decidir si queremos añadir archivos txt, en nuestro caso, no lo marcamos porque lo hemos importado directamente desde html. Otra posibilidad sería convertir directamente desde txt, el problema serían las imágenes que no se incorporan al archivo EPUB.
Marcamos todos los archivos que queremos incluir. Si no hubiéramos borrado los archivos antes indicados, podemos dejarlos sin marcar ahora. Ahora seleccionamos la que será la portada del libro, y pulsamos el botón «Finish»:
Lo que veremos a continuación, será la ventana principal de eCub:
Ya solo te queda hacer clic sobre «Compile» y ya lo tienes…
eCub NO ES LIBRE – Calibre SI ES LIBRE!!!
El problema es que normalmente no se realiza bien la separación de párrafos (ni la reconstrucción de palabras separadas por guiones al final de la línea) durante la conversión de pdf a html.
Esto es un problema si eres un perfeccionista. En tal caso debes editar el html antes de importarlo con eCub (o después si «abres» el epub) y repararlo mediante la herramienta «Sustituir» con expresiones regulares.
De todos los métodos que he probado para realizar la conversión de pdf a html la que mejor resultado me ha dado han sido la combinación Acrobat Professional (pdf -> doc) + Microsoft Word (doc -> html), pero el resultado final tenía muchísima mierda.
Pero también he de reconocer que el conversor de Calibre lo hace genial y crea poca mierda.
dices «Calibre, que es una muy buena solución, con el único inconveniente de utilizar las librerías Qt» como si las librerias Qt fueran malas, cuando son de lejos las mejores librerías gráficas libres. Deberías especificar un poco más porque resulta un inconveniente para TI, ya que algunos lectores podrían malinterpretarte…
Tienes razón, tenía que haber sido más explícito como en otras ocasiones al hablar de mis manías por no mezclar las librerías Qt con las de Gnome, igual que mi manía con Mono.
Al fin y al cabo se trata únicamente de mis manías personales.
Gracias por la aclaración
Muchas gracias por la info y muy buen libro, David es un crack
tengo unos apuntes de la universidad que quiero pasar a epub, el problema con el calibre son las imágenes que se encuentran descuadradas. ¿Existe algún programa que mantenga el texto e imágenes correctamente?
gracias
No conozco ninguno, y no creo que sea posible, dado que la ventaja de epub y otros formatos similares es que se adaptan al tamaño de la pantalla, con lo que finalmente descuadran imágenes y texto