¿Qué causa que el tamaño del file PDF aumente al save en Vista previa?

Parece que realizar ediciones, annotations o incluso simplemente abrir y save un file PDF en Vista previa causará un aumento significativo en el tamaño del file. Me di count de que para algunos libros que he escaneado esto también mejora el time de renderización de la página.

¿Alguien puede arrojar algo de luz sobre lo que está sucediendo para causar estos cambios? Estoy interesado en sincronizar las annotations de los libros electrónicos PDF entre la vista previa y el iPad (tal vez GoodReader), pero esto puede ser muy poco práctico con files PDF grandes.

  • Configure Vista previa para volver a cargar automáticamente el pdf y permanecer en el mismo lugar
  • ¿Por qué la Vista Previa imprime text borroso cuando hay color en un documento?
  • Safari añadiendo .EXE al final de .PDF
  • Páginas arrastradas más grandes que el documento fuente
  • Importar varias páginas desde un PDF como diapositivas por separado en Keynote
  • ¿Puedo hacer un pdf de forma eficiente de 10 imágenes JPEG?
  • Agregar numbers de página y cabeza ejecutiva a un file pdf
  • ¿Por qué los documentos jpeg y pdf están cubiertos con rectangularjs negros sólidos?
  • ¿Cómo combino dos o más imágenes para get un solo file pdf?
  • Yosemite: ¿No se puede agregar una nota de text en una position arbitraria en Vista previa?
  • ¿Cómo hacer que Safari abra todos los files PDF en el browser?
  • ¿Cómo puedo combinar varios PDF usando la línea de command?
  • 4 Solutions collect form web for “¿Qué causa que el tamaño del file PDF aumente al save en Vista previa?”

    En su novela poco conocida, PDF Karenina , Leo Tolstoy escribió:

    Los files PDF con encoding óptima son todos iguales; cada file PDF con encoding subóptima está codificado de manera subóptima a su manera.

    Es difícil para cualquiera responder por qué sus files PDF son más grandes después de que la vista previa los modifique. Un file PDF consta de muchos types diferentes de datos: imágenes, flujos de contenido, fonts, sobrecarga de documentos, espacios de color, estados de charts extendidos y una tabla de references cruzadas. Al igual que una oración puede ser concisa y otra detallada, pero ambas son válidas en inglés y dicen lo mismo, por lo que también un file PDF podría tener una forma más detallada de representar el mismo contenido que un file PDF más conciso. Tendríamos que mirar sus files PDF exactos. Es probable que hayan sido creados por una variedad de diferentes piezas de software, algunos consise, otros less.

    También importa qué versión de Mac OS X y Vista previa está utilizando, porque eso determina el software que escribe el nuevo file PDF cuando se hace un Guardar como en la Vista previa.

    Sin embargo, puedo decirte qué se agranda con algunos de mis files PDF. Esta historia se aplica a mi computadora, ejecutando Mac OS X 10.5.8 y Apple Preview 4.2 (469.5).

    Un file, Giulio.pdf , es un documento de 22 páginas con text como text, no imágenes escaneadas. Tiene 461,092 bytes de ancho. Lo abrí en Vista previa, hice Archivo … Guardar como … y lo guardé bajo un nuevo nombre de file. El nuevo file tiene 724,421 bytes, o un 57% más.

    Abrí cada file con Adobe Acrobat Professional, versión 8.3.1 para Mac OS. Hice Advanced … PDF Optimizer … Uso del espacio de auditoría …. Un pequeño cuadro de dialog dio un desglose de cuántos bytes se debían a cada categoría de uso, más el porcentaje del tamaño total del file para la categoría.

    El Giulio.pdf original tiene 390.754 bytes (84,75%) dedicados a secuencias de contenido y cero bytes dedicados a imágenes. Está en formatting PDF 1.4. El file guardado por Vista previa tiene 675,846 bytes (93.29%) dedicados a flujos de contenido, también cero bytes de imágenes, y está en formatting PDF 1.3. La vista previa hizo que el contenido fluyera 285,092 bytes más grande, y eso representa el 73% de la diferencia de tamaño de file entre los dos.

    Me preguntaba si el formatting de file PDF 1.3 era inherentemente less eficiente para almacenar este tipo de file. Abrí el Giulio.pdf original en Adobe Acrobat Professional 8, e hice Advanced … PDF Optimizer … Hace compatible con: Acrobat 3.0 y posterior y presioné OK. Guardé el file resultante con un nuevo nombre. El file resultante está en formatting PDF 1.3 y tenía 452,356 bytes o less que el original. Sus flujos de contenido son 375.171 bytes (82.94%), una proporción similar, pero más pequeña que las secuencias de contenido del file original.

    Por lo tanto, parece que podemos concluir que la aplicación Vista previa en Mac OS X 10.5.8 no es tan eficiente como otros creadores de PDF para hacer flujos de contenido concisos en files PDF, y la diferencia es suficiente para representar tres cuartas partes de la diferencia de tamaño en un file PDF sin imágenes.

    Hice un experimento similar en form k.pdf , un documento de 1 página escaneado en papel. El file original tiene 303,730 bytes, de los cuales 298,197 bytes (98.18%) son imágenes. Una copy de este file creado por Vista previa usando Guardar como … es 300,601 bytes, o 1% más pequeño. Esta diferencia de tamaño de file es más que explicada por una categoría de bytes de documento más pequeña en el file creado por Vista previa.

    Por lo tanto, parece que también podemos concluir que Vista previa no siempre hace que un file PDF aumente de tamaño. Depende de la naturaleza del file PDF original y de lo conciso que fue para empezar.

    Sé que esto es bastante tarde, pero he encontrado algo que parece funcionar, al less si se usa inicialmente: he intentado usar el filter de cuarzo para "Reducir el tamaño del file". Parece que funciona, pero no está activado por defecto. Puedo elegirlo específicamente a través del menu Guardar como (mantener presionada Opción), pero me preocupa que este sea el método habitual en los autoguardados.

    Esto es lo que me está sucediendo y cómo llegué a esta página en primer lugar: el PDF comienza como un libro de 900 páginas de 900 MB. Agrego una sola anotación y la guardo, y el file salta hasta 2.29 GB. Para colmo, lleva mucho time save, especialmente porque estoy guardando en un disco externo. ¡Gracias a Dios que la unidad es USB 3!

    ¿Hay alguna forma de extraer estas annotations? Puedo anotar y destacar en GoodReader y PDF Expert en mi iPad. Si la Vista previa no puede permitirme hacer esto en mi computadora, ¿hay alguna otra aplicación que lo haga? ¿Por qué no puede simplemente save las annotations / resaltados, pero no tratar de volver a comprimir todas las imágenes, como si volviera a save un file JPEG cada vez? ¡Gracias por la ayuda!

    El problema sigue siendo serio. En Preview 7.0 (Mac Os 10.9.5.) Genere un pdf usando Acrobat 9.5.5. que resultó en un file de 5 MB. En Vista previa, agregué exactamente 12 caracteres (usando las herramientas de edición). Después de save este file balooned a 14 MB.

    Puede solucionarlo abriendo y guardando nuevamente en Acrobat (puede tener que usar la opción "networkingucir tamaño de file").

    No se pueden agregar pistas a la solución. Puedo agregar un escenario similar (OS X 10.11.3): un PDF escaneado con un peso de ~ 800kb se abre en la vista previa, se eliminan un par de páginas escaneadas vacías, el PDF resultante de dos páginas es ~ 2,2Mb. "Opción-Guardar como" y seleccionando el filter de cuarzo "networkingucir tamaño de file" comprime el file hasta … 1,9Mb.

    El file original ha sido generado por una copydora Xerox WC 7830, que en mi experiencia (en comparación con las impresoras / copydoras multifunction anteriores que teníamos) produce un PDF escaneado bastante optimizado.

    No se puede ver ninguna diferencia en el file, visualmente; Supongo que las imágenes de la página se vuelven a comprimir en 24 ppp, mientras que el file original es claro con mucho less profundidad de color, probablemente de 6 bits (es un documento impreso y firmado, solo text, el escáner hace un buen trabajo al mantener el background blanco blanco puro). Lamentablemente, Vista previa no es lo suficientemente inteligente como para detectar y mantener esto, y parece que necesita volver a comprimir todo el file, aunque no se realizan cambios en las páginas restantes (de nuevo, solo se han eliminado un par de páginas.

    Loving Apple Products like poisoning (iPhone, iPad, iMac, Macbook, iWatch).