Libros electronicos: de pdf a epub en Ubuntu

Introducción

El formato PDF no es el más cómodo para los lectores de libros electrónicos, básicamente porque no es repaginable. La solución se encuentra en otros formatos, como es el EPUB, que es un formato estándard y libre. De echo, es bastante sencillo de implementar, pero sin embargo, no existen muchas herramientas disponibles para ello.

Y entonces, ¿que hacemos con aquellos libros que tenemos en PDF?¿Cómo los convertimos a EPUB?

Existen varias soluciones, pero yo voy a decantarme por convertir el PDF a html y posteriomente a EPUB utilizando eCub, que es una herramienta para la creación de libros electrónicos en formato MobiPocket y EPUB.

También podemos decantarnos por Calibre, que es una muy buena solución, con el único inconveniente de utilizar las librerías Qt.

Voy a utilizar el libro “Copia este libro” de David Bravo, para hacer este ejemplo. Aunque las fuentes en html están disponibles, con lo que podríamos saltarnos el primer paso de convertir de html a pdf. “Copia este libro” en formato pdf, lo puedes descargar de microsiervos.

De pdf a html

Lo primero asegúrate que tienes el paquete “poppler-utils” instalado en Ubuntu. Para instalarlo desde el terminal:

sudo apt-get install poppler-utils

Una vez instalado, pasamos a convertir el archivo pdf en html, para ello, igualmente en el terminal:

pdftohtml copia_este_libro.pdf copia_este_libro.html

0025_atareao@zorita: -home-atareao-Desktop-copia_este_libro

Una vez realizada la conversión, tienes que eliminar algunos archivos, para que el archivo EPUB quede algo mejor:

rm -f copia_este_libro.html
rm -r copia_este_libro_ind.html

0026_atareao@zorita: -home-atareao-Desktop-copia_este_libro

Instalar eCub

eCub te permite importar texto y archivos html, para crear un archivo EPUB. Además te permite comprobar el EPUB generado, eso sí utilizando herramientas externas y generar audiolibros, utilizando eSpeak. Aunque es gratuito, no es de código abierto.

Lo primero es descargarlo desde la página del autor, seleccionado la opción que más te interese:

Ahora en el terminal, pasamos a instalarla:

dpkg -i ecub_1.11-1_amd64.deb

Crear el archivo EPUB

En el menú de Ubuntu > Oficina > eCub

0028_Menú

En la pantalla de inicio, seleccionanos New Project:

0029_Welcome to eCub

Y comienza el asistente, que nos guiará en el proceso de creación del archivo:

0027_New Project

Rellenamos los datos básicos, hacemos clic en el botón Next:

0030_New Project

Le damos nombre al archivo “Copiestelibro”, y seleccionamos la carpeta donde hemos realizado la conversión de pdf a html, y pulsamos en botón “Next”:

0031_New Project

Entre las opciones disponibles, elijo la primera puesto que en el directorio se encuentran los archivos que queremos compilar. Si quisieramos partir de un archivo en blanco seleccionamos la segunda, y hacemos clic en “Next”:

0032_New Project

Aquí tenemos que decidir si queremos añadir archivos txt, en nuestro caso, no lo marcamos porque lo hemos importado directamente desde html. Otra posibilidad sería convertir directamente desde txt, el problema serían las imágenes que no se incorporan al archivo EPUB.

0033_New Project

Marcamos todos los archivos que queremos incluir. Si no hubiéramos borrado los archivos antes indicados, podemos dejarlos sin marcar ahora. Ahora seleccionamos la que será la portada del libro, y pulsamos el botón “Finish”:

0034_New Project

Lo que veremos a continuación, será la ventana principal de eCub:

0036_Copiaestelibro - Anthemion eCub

Ya solo te queda hacer clic sobre “Compile” y ya lo tienes…

Si te ha gustado el artículo, apúntate y te mantendré actualizado sobre el que es el mejor sistema operativo. Te mostraré como mejorar tu entorno de trabajo y conseguir ser mucho mas productivo

Publicado en la categoría... Ubuntu, una distribución Linux, un entorno de trabajo
Etiquetado como... ,
  • Distopico Vegan

    eCub NO ES LIBRE – Calibre SI ES LIBRE!!!

  • Rafa_el

    El problema es que normalmente no se realiza bien la separación de párrafos (ni la reconstrucción de palabras separadas por guiones al final de la línea) durante la conversión de pdf a html.

    Esto es un problema si eres un perfeccionista. En tal caso debes editar el html antes de importarlo con eCub (o después si “abres” el epub) y repararlo mediante la herramienta “Sustituir” con expresiones regulares.

    De todos los métodos que he probado para realizar la conversión de pdf a html la que mejor resultado me ha dado han sido la combinación Acrobat Professional (pdf -> doc) + Microsoft Word (doc -> html), pero el resultado final tenía muchísima mierda.

    Pero también he de reconocer que el conversor de Calibre lo hace genial y crea poca mierda.

  • avlas

    dices “Calibre, que es una muy buena solución, con el único inconveniente de utilizar las librerías Qt” como si las librerias Qt fueran malas, cuando son de lejos las mejores librerías gráficas libres. Deberías especificar un poco más porque resulta un inconveniente para TI, ya que algunos lectores podrían malinterpretarte…

    • Tienes razón, tenía que haber sido más explícito como en otras ocasiones al hablar de mis manías por no mezclar las librerías Qt con las de Gnome, igual que mi manía con Mono.
      Al fin y al cabo se trata únicamente de mis manías personales.

      Gracias por la aclaración

  • Roberto Garcia

    Muchas gracias por la info y muy buen libro, David es un crack

  • Victorcuesta

    tengo unos apuntes de la universidad que quiero pasar a epub, el problema con el calibre son las imágenes que se encuentran descuadradas. ¿Existe algún programa que mantenga el texto e imágenes correctamente?
    gracias

    •  No conozco ninguno, y no creo que sea posible, dado que la ventaja de epub y otros formatos similares es que se adaptan al tamaño de la pantalla, con lo que finalmente descuadran imágenes y texto