Como converter PDF a DJVU

Djvu (pronunciado deja-vu) é un formato de ficheiro informático deseñado principalmente para almacenar imaxes dixitalizadas. Caracterízase por incorporar tecnoloxías avanzadas como a separación de capas de imaxe, carga progresiva, codificación aritmética e compresión sen perdas para imaxes bitonais (dúas cores), o que permite almacenar imaxes de alta calidade nun espazo mínimo.


A carga progresiva (ou descarga) fai que o formato sexa ideal para imaxes publicadas desde Internet. Promoveuse Djvu como alternativa ao PDF e hoxe supera a este formato na maioría dos documentos escaneados. Isto levouno a ser moi utilizado na distribución de libros de matemáticas en redes de uso compartido de ficheiros (Emule, Bittorrent, etc.). Do mesmo xeito que o PDF, Djvu pode conter unha capa de texto obtida mediante un proceso de recoñecemento óptico (OCR), o que facilita a súa copia e pegado noutros documentos.

A tecnoloxía DjVu foi desenvolvida orixinalmente por Yann Le Cun, Léon Bottou, Patrick Haffner e Paul G. Howard en AT&T Labs en 1996. DjVu é un formato de ficheiro aberto. As especificacións de formato e o código fonte da biblioteca de referencia están publicados e dispoñibles. A propiedade dos dereitos para o desenvolvemento comercial do software de codificación foi transferida a diferentes empresas ao longo dos anos, incluíndo AT&T e LizardTech. Os autores orixinais manteñen unha implementación GPL chamada DjVuLibre.

Comparación con PDF

A principal diferenza entre DjVu e PDF é que o primeiro é un formato de gráficos raster, mentres que o segundo é un formato de gráficos vectoriais. Isto implica as seguintes consecuencias:

A resolución máxima dun ficheiro DjVu está preestablecida (especifícase ao crealo). Pola contra, un ficheiro PDF pódese ampliar ou reducir arbitrariamente, sempre que a imaxe de orixe estea en formato vectorial (as imaxes dixitalizadas non o son), sen perder a súa calidade.

Os caracteres dun ficheiro DjVu son imaxes, non usa tipos de letra. O PDF usa tipos de letra, que poden non estar empaquetados dentro do ficheiro, polo que se non se atopan no sistema, úsase outro dispoñible.

O formato PDF ofrece diferentes xeitos de incluír e presentar imaxes raster, que adoitan empregarse para crear ficheiros con documentos dixitalizados. Estes ficheiros teñen as mesmas limitacións que os ficheiros DjVu.

Se a calidade é o que importa para ti, as DJVU IMHO son moito mellores. Todo parece moito máis nítido. Se, por outra banda, necesitas espazo no teu disco, senta ben: ao converter os meus pdf a djvus, de media, este último ocupou 3 veces menos que os meus pdf antigos.

Converte os teus PDF a DJVU

Facer isto é unha merda. Simplemente instalamos pdf2djvu:

sudo apt-get install pdf2djvu

Despois, para usalo, executamos:

pdf2djvu file.pdf -o file.djvu

Para que isto funcione, non esqueza substituír file.pdf e file.djvu polas rutas de ficheiro correspondentes.

Vexa o DJVU

Ubuntu xa sae "da caixa" coa posibilidade de ver DJVU. Para iso, use o mesmo programa que para PDF: Evince. Entón, nese sentido, témolo fácil.

Respecto dun comentario que me fixera noutra publicación, podes seleccionar texto nunha DJVU. Do mesmo xeito que os PDF, se o documento era OCR (ou se se converteu un ficheiro de texto a ese formato), pode facelo.

O problema é que debido a un erro en Evince (ver erro y comentar), o programa co que Ubuntu abre os nosos PDF e DJVU por defecto, non se pode realizar esta operación.

Para solucionar este problema, podemos instalar DjView, outro pequeno programa para ver DJVU.

sudo apt-get install djview4

Unha vez instalado, atopalo en Gráficos> DJView.

Algunhas ligazóns que poden interesarche:


O contido do artigo adhírese aos nosos principios de ética editorial. Para informar dun erro faga clic en aquí.

10 comentarios, deixa os teus

Deixa o teu comentario

Enderezo de correo electrónico non será publicado. Os campos obrigatorios están marcados con *

*

*

  1. Responsable dos datos: Miguel Ángel Gatón
  2. Finalidade dos datos: controlar SPAM, xestión de comentarios.
  3. Lexitimación: o seu consentimento
  4. Comunicación dos datos: os datos non serán comunicados a terceiros salvo obrigación legal.
  5. Almacenamento de datos: base de datos aloxada por Occentus Networks (UE)
  6. Dereitos: en calquera momento pode limitar, recuperar e eliminar a súa información.

  1.   Helena_ryuu dixo

    Moitas grazas pola información en inglés> w

  2.   imos usar linux dixo

    Helena: O que quere facer é chamarse "edición de imaxes por lotes" (é dicir, editar moitas imaxes ao mesmo tempo). Hai varias formas de facelo en Linux. Quizais o máis práctico sexa usar nautilus-image-converter ou phatch. Ambos están nos repositorios de Ubuntu. O primeiro permítelle editar as imaxes de Nautilus (google it, seguramente terá moitos titoriais). Phatch, por outra banda, é un pequeno programa independente que, na miña opinión, é máis poderoso (permítelle facer máis cousas).
    Unha vez que teñas todas as imaxes listas, podes empregar imagemagick para convertelas a pdf (por exemplo, coloque todas nun único pdf). Para facelo, recoméndolle que lea este post: https://blog.desdelinux.net/como-manipular-imagenes-desde-el-terminal/ Por se precisas máis axuda, avísame ... se non, o comentario fíxome moi longo.
    Ánimo! Paul.

  3.   imos usar linux dixo

    Helena: O que quere facer é chamarse "edición de imaxes por lotes" (é dicir, editar moitas imaxes ao mesmo tempo). Hai varias formas de facelo en Linux. Quizais o máis práctico sexa usar nautilus-image-converter ou phatch. Ambos están nos repositorios de Ubuntu. O primeiro permítelle editar as imaxes de Nautilus (google it, seguramente terá moitos titoriais). Phatch, por outra banda, é un pequeno programa independente que, na miña opinión, é máis poderoso (permítelle facer máis cousas).
    Unha vez que teñas todas as imaxes listas, podes empregar imagemagick para convertelas a pdf (por exemplo, coloque todas nun único pdf). Para facelo, recoméndolle que lea este post: https://blog.desdelinux.net/como-manipular-imagenes-desde-el-terminal/ Por se precisas máis axuda, avísame ... se non, o comentario fíxome moi longo.
    Ánimo! Paul.

  4.   Helena_ryuu dixo

    ¿Sabes como podo crear ficheiros djvu directos a partir de imaxes dixitalizadas?

  5.   imos usar linux dixo

    Ola Helena! Recoméndoche que lea o seguinte artigo: http://www.howtoforge.com/creating_djvu_documents_on_linux
    Claro, está en inglés, pero creo que é bastante sinxelo e ben entendido.
    Ánimo! Paul.

  6.   Helena_ryuu dixo

    ben, xa fixen o pdf con imagemagik (moi sinxelo; D) e agradezo moito a túa axuda, moi atento> w <, como postscript, uso archlinux con xfce e o Phatch é xenial, uso o gimp para pequenas tarefas como cortar imaxes ._., ....
    En fin, mil grazas pola túa axuda! ^^

  7.   imos usar linux dixo

    Estou contento!
    Unha aperta! Paul.

  8.   Juan Camilo dixo

    grazas

  9.   botánico dixo

    marabilloso ... Moitas grazas!

  10.   mosteiro dixo

    interesante grazas