Cómo crear y combinar archivos PDF en la línea de comandos de Linux


Jane Kelly/Shutterstock.com

Los archivos PDF fueron diseñados para promover el intercambio. Todos pueden abrirlos, en su navegador web si no tienen nada más. Linux le permite manipular, fusionar y dividir archivos PDF en la línea de comandos.

El formato de documento portátil

El formato de documento portátil (PDF) resolvió un problema. Cuando creabas un documento en una computadora y querías compartirlo con otra persona, enviarles el documento no siempre funcionaba.

Incluso si tuvieran el mismo paquete de software que usó para crear su documento, es posible que no tengan las mismas fuentes instaladas en su computadora que usted tenía en la suya. Podrían abrir el documento, pero se vería mal.

Si no tuvieran una copia del software que usó para crear el paquete, no podrían abrirlo. Si usó un software que solo estaba disponible en Linux, no tenía sentido enviar ese documento a alguien que solo usaba Windows.

Adobe creó un nuevo formato de archivo en 1992 y lo llamó formato de documento portátil. Los documentos creados con ese estándar, ISO 32000, contienen las imágenes y las fuentes necesarias para representar correctamente el contenido del archivo. Los visores de PDF pueden abrir archivos PDF en cualquier plataforma. Era una solución multiplataforma, simple y elegante.

Un archivo PDF no está diseñado para ser maleable como un documento de procesador de texto. No se prestan fácilmente a la edición. Si necesita cambiar el contenido de un PDF, siempre es mejor volver al material de origen, editarlo y generar un nuevo PDF. En contraste con tratar de cambiar el contenido, estructural las manipulaciones se pueden realizar en archivos PDF con relativa facilidad.

Aquí hay algunas formas de crear archivos PDF en Linux y cómo realizar algunas de las transformaciones que se les pueden aplicar.

Creación de archivos PDF en Linux

Muchas de las aplicaciones disponibles en Linux pueden generar archivos PDF directamente. LibreOffice tiene un botón en la barra de herramientas que genera un PDF del documento actual. No podría ser más fácil.

El botón PDF de LibreOffice Writer

Para un control detallado de la creación de PDF, la aplicación de autoedición Scribus es difícil de superar.

Si necesita crear documentos con contenido científico o matemático, tal vez para enviarlos a revistas académicas, una aplicación que use LaTeX, como Texmaker, será perfecta para usted.

Si prefiere un flujo de trabajo de texto sin formato, tal vez usando Markdown, puede usar pandoc para convertir hacia y desde una gran cantidad de formatos de archivo, incluido PDF. Tenemos una guía dedicada a pandoc pero un ejemplo sencillo le mostrará lo fácil que es utilizarlo.

Instale Texmaker primero. pandoc se basa en algunas bibliotecas LaTeX para la generación de PDF. Instalar Texmaker es una forma conveniente de cumplir con esas dependencias.

los -o La opción (salida) se utiliza para especificar el tipo de archivo que se creará. El archivo «raw-notes.md» es un archivo Markdown de texto sin formato.

pandoc -o new.pdf raw-notes.md

Uso de pandoc para crear un PDF a partir de un archivo Markdown

Si abrimos el archivo “nuevo.pdf” en un visor de PDF, vemos que es un PDF correctamente formado.

Abriendo el PDF creado por pandoc

El comando qpdf

los qpdf El comando le permite manipular archivos PDF existentes, conservando su contenido. Los cambios que puedes hacer son estructural. Con qpdf puede realizar tareas como fusionar archivos PDF, extraer páginas, rotar páginas y configurar y eliminar el cifrado.

Instalar qpdf en Ubuntu usa este comando:

sudo apt install qpdf

Instalación de qpdf en Ubuntu

El comando en Fedora es:

sudo dnf install qpdf

Instalando qpdf en Fedora

En Manjaro debes escribir:

sudo pacman -S qpdf

Instalando qpdf en Manjaro

Combinar archivos PDF

Al principio, algunos de los qpdf La sintaxis de la línea de comandos puede parecer confusa. Por ejemplo, muchos de los comandos esperan un archivo PDF de entrada.

Si un comando no requiere uno, necesita usar el --empty opción en su lugar. esto dice qpdf no esperar un archivo de entrada. los --pages La opción le permite elegir páginas. Si solo proporciona los nombres de PDF, se utilizan todas las páginas.

Para combinar dos archivos PDF para formar un nuevo archivo PDF, utilice este formato de comando.

qpdf --empty --pages first.pdf second.pdf -- combined.pdf

Combinar dos archivos PDF para crear un nuevo archivo PDF

Este comando está compuesto por:

  • qpdf: llama al qpdf dominio.
  • -vacío: Dice qpdf no hay PDF de entrada. Podría argumentar que «primero.pdf» y «segundo.pdf» son archivos de entrada, pero qpdf los considera como parámetros de línea de comando.
  • –páginas: Dice qpdf vamos a trabajar con páginas.
  • primero.pdf segundo.pdf: Los dos archivos de los que vamos a extraer las páginas. No hemos utilizado rangos de páginas, por lo que se utilizarán todas las páginas.
  • : Indica el final de las opciones del comando.
  • combinado.pdf: El nombre del PDF que se creará.

Si buscamos archivos PDF con lsveremos nuestros dos archivos originales, intactos, y el nuevo PDF llamado «combined.pdf».

ls -hl first.pdf second.pdf combined.pdf

Usando ls para enumerar los archivos PDF existentes y nuevos

Hay dos páginas en «primero.pdf» y una página en «segundo.pdf». El nuevo archivo PDF tiene tres páginas.

El nuevo archivo PDF tiene todas las páginas de los dos archivos PDF originales

Puede utilizar comodines en lugar de enumerar una gran cantidad de archivos de origen. Este comando crea un nuevo archivo llamado «all.pdf» que contiene todos los archivos PDF en el directorio actual.

qpdf --empty --pages *.pdf -- all.pdf

Uso de comodines en la línea de comandos de qpdf

Podemos usar rangos de páginas agregando los números de página o rangos detrás de los nombres de archivo de los que se extraerán las páginas.

Esto extraerá las páginas uno y dos de «first.pdf» y la página dos de «second.pdf». Tenga en cuenta que si ya existe «combined.pdf», no se sobrescribe. Tiene las paginas seleccionadas adicional lo.

qpdf --empty --pages first.pdf 1-2 second.pdf 1 -- combined.pdf

Uso de rangos de páginas para seleccionar las páginas para agregar al nuevo archivo

Los rangos de páginas pueden ser tan detallados como desee. Aquí, estamos solicitando un conjunto muy específico de páginas de un archivo PDF grande y estamos creando un archivo PDF de resumen.

qpdf --empty --pages large.pdf 1-3,7,11,18-21,55 -- summary.pdf

Usar un conjunto complicado de rangos de páginas

El archivo de salida, “summary.pdf” contiene las páginas 1 a 3, 7, 11, 18 a 21 y 55 del archivo PDF de entrada. Esto significa que hay 10 páginas en “summary.pdf”

La página 10 del nuevo PDF es la página 55 del archivo de origen

Podemos ver que la página 10 es la página 55 del PDF de origen.

Dividir archivos PDF

Lo contrario de fusionar archivos PDF es dividir archivos PDF. Para dividir un PDF en archivos PDF separados, cada uno con una sola página, la sintaxis es simple.

El archivo que estamos dividiendo es «summary.pdf», y el archivo de salida se proporciona como «page.pdf». Esto se usa como el nombre base. Cada nuevo archivo tiene un número agregado al nombre base. los --split-pages opción dice qpdf qué tipo de acción estamos realizando.

qpdf summary.pdf page.pdf --split-pages

Dividir un archivo PDF en muchos archivos PDF de una página cada uno

La salida es una serie de archivos PDF numerados secuencialmente.

ls page*.pdf

usando ls para enumerar los archivos PDF numerados

Si no desea dividir cada página, use rangos de páginas para seleccionar las páginas que desea.

Si emitimos este siguiente comando, dividiremos una colección de archivos PDF de una sola página. Los rangos de páginas se usan para especificar las páginas o rangos que queremos, pero cada página aún se almacena en un solo PDF.

qpdf large.pdf section.pdf --pages large.pdf 1-5,11-14,60,70-100 -- --split-pages

Dividir un PDF con rangos de páginas

Las páginas extraídas tienen nombres basados ​​en «sección.pdf» con un número secuencial agregado.

ls section*.pdf

usando ls para enumerar los archivos PDF numerados

Si desea extraer un rango de páginas y almacenarlo en un solo PDF, use un comando de este formulario. Tenga en cuenta que no incluimos el --split-pages opción. Efectivamente, lo que estamos haciendo aquí es una combinación de PDF, pero solo estamos «combinando» páginas de un archivo de origen.

qpdf --empty --pages large.pdf 8-13 -- chapter2.pdf

Extraer un rango de páginas de un archivo PDF y almacenarlas en un nuevo archivo PDF

Esto crea un solo PDF de varias páginas llamado «chapter2.pdf».

Páginas giratorias

Para rotar una página, creamos un nuevo PDF que es igual al PDF de entrada con la página especificada rotada.

usamos el --rotate opción para hacer esto. los +90 significa girar la página 90 grados en el sentido de las agujas del reloj. Puede rotar una página 90, 180 o 270 grados. También puede especificar la rotación en grados en el sentido contrario a las agujas del reloj, utilizando un número negativo, pero no es necesario hacerlo. Una rotación de -90 es lo mismo que una rotación de +270.

El número separado de la rotación por dos puntos “:” es el número de la página que desea rotar. Esta podría ser una lista de números de página y rangos de páginas, pero solo estamos rotando la primera página. Para rotar todas las páginas, use un rango de páginas de 1-z.

qpdf --rotate=+90:1 summary.pdf rotated1.pdf

Rotación de la primera página de un PDF

La primera página ha sido rotada para nosotros.

Un archivo PDF con la primera página girada 90 grados en el sentido de las agujas del reloj

Cifrado y descifrado

Los documentos PDF se pueden cifrar para que requieran una contraseña para abrirlos. Esa contraseña se llama contraseña de usuario. Hay otra contraseña que se requiere para cambiar la seguridad y otras configuraciones de permisos para un PDF. se llama el contraseña de propietario.

Para encriptar un PDF necesitamos usar el --encrypt y proporcione ambas contraseñas. La contraseña de usuario viene primero en la línea de comando.

También especificamos la fuerza de cifrado a utilizar. Solo necesita pasar del cifrado de 256 bits a 128 bits si desea admitir visores de archivos PDF muy antiguos. Le sugerimos que siga con el cifrado de 256 bits.

Vamos a crear una versión cifrada de «summary.pdf» llamada «secret.pdf».

qpdf --encrypt hen.rat.squid goose.goat.gibbon 256 -- summary.pdf secret.pdf

Creación de un PDF encriptado

Cuando intentamos abrir el PDF, el visor de PDF nos solicita una contraseña. Introducir la contraseña de usuario autoriza al espectador a abrir el archivo.

Un visor de PDF que solicita la contraseña para abrir un archivo PDF encriptado

Recuérdalo qpdf no cambia el PDF existente. Crea uno nuevo con los cambios que le hemos pedido que haga. Entonces, si crea un PDF encriptado, aún tendrá la versión original sin encriptar. Dependiendo de sus circunstancias, es posible que desee eliminar el PDF original o guardarlo de forma segura.

Para descifrar un archivo, utilice el --decrypt opción. Evidentemente, debe conocer la dueño contraseña para que esto funcione. Necesitamos usar el --password opción para identificar la contraseña.

qpdf --decrypt --password=goose.goat.gibbon secret.pdf unlocked.pdf

Creación de un PDF descifrado a partir de un PDF cifrado

El «desbloqueado.pdf» se puede abrir sin contraseña.

qpdf es una excelente herramienta

Estamos profundamente impresionados con qpdf. Proporciona un conjunto de herramientas flexible y con muchas funciones para trabajar con archivos PDF. Y es muy rápido, también.

Consulte su documentación bien escrita y detallada para ver cuánto más puede hacer.





Source link-39