Re: Documentos PDF

From: Horacio Miranda <hmiranda(at)gmail(dot)com>
To: "(Syswarp) Carlos Enrique Perez" <carlos(dot)perez(at)syswarp(dot)com(dot)ar>
Cc: Postgres <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: Re: Documentos PDF
Date: 2010-09-22 02:36:54
Message-ID: AANLkTinPyU1LU7kGGBHvBAysC+HZqAi7zKGo2UJ=Grca@mail.gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Como dice Alvaro, muchos temas estan arreglados en la base de datos,
pero lo mas importante es el modelo, sí el PDF es parte de tu modelo
transaccional debes asegurar esa transaccion y la base de datos hace
eso ACID, si se te corrompe aplicas respaldo y recuperas en el
tiempo... (consistencia de datos y los PDF) en una institución del
estado teniamos una base que hacia eso en Oracle, eran 10T y los datos
eran imagenes, resumen al primer problema serio de hardware y perdida
de datos, recuperación y listo. Eso no es posible si se manejan solo
las referencias.

Ahora una pregunta, el PDF es generado ? o es recivido ? por que si
estas generando ese PDF lo puedes volver a genrar a menos que sea algo
como PDF de facturas electrónicas y en ese caso te conviene guardar
los XML y no los PDF.

Otra idea es hacer un gzip del PDF y manejar los PDF comprimidos en la
base, cosa que cuando los quieras mirar lo descomprimes en caliente.
Ppara dar velocidad a tu APP, (si es web) puede usar gzip en el
apache, eso envia todo comprimido a los clientes y es mas rapido el
envio de todo archivo, pagina o contenido.

2010/9/22 (Syswarp) Carlos Enrique Perez <carlos(dot)perez(at)syswarp(dot)com(dot)ar>:
> Tenes que hacer busquedas sobre ocurrencias dentro del pdf?
> Seria algo tipo base de datos documental?
> Si no es asi, entonces guarda el path del documento y ahorrate problemas.
>
> -----Mensaje original-----
> De: pgsql-es-ayuda-owner(at)postgresql(dot)org [mailto:pgsql-es-ayuda-owner(at)postgresql(dot)org] En nombre de Carlos Joaniquet
> Enviado el: martes, 21 de septiembre de 2010 17:19
> Para: Alvaro Herrera
> CC: Ariel Centeno; marcosluis2186; alexfvmx; Postgres
> Asunto: Re: [pgsql-es-ayuda] Documentos PDF
>
> Totalmente de acuerdo, aunque nosotros manejamos una considerable cantidad de pdf y doc al día (entre 500 y 800) y lo hacemos almacenando la referencia a un disco de red en el que la aplicación crea una carpeta anual y otra subcarpeta del día y guarda y recupera los archivos allí. Es cierto que has de hacer los dos respaldos y que se ha de tener un buen control para que la cosa no sea un cachondeo, pero hasta la fecha no hemos tenido problemas.
> No se si metiéndolos en los registros crecería mucho la DB y disminuiría el rendimiento...
>
> Carlos Joaniquet Tamburini
>
> El 21/09/2010, a las 18:34, Alvaro Herrera <alvherre(at)commandprompt(dot)com> escribió:
>
>> Excerpts from Ariel Centeno's message of mar sep 21 07:29:29 -0400 2010:
>>>
>>> Me parece lo mas logico guardar solo las referencias a los documentos en la base de datos. Es la forma mas rapida y evitas conversiones que por hay no funcionan del todo bien.
>>
>> Si la conversión no funciona "del todo bien", es un bug de tu
>> aplicación.
>>
>> Respecto a que sea lo m√°s l√≥gico, no estoy de acuerdo.  Puede ser lo
>> más simple, si sólo haces la parte más sencilla, pero si quieres
>> manejar los documentos en forma transaccional, es mucho m√°s
>> complicado; en cambio si almacenas los documentos en la base de datos,
>> la parte transaccional se maneja sola.
>>
>> Lo otro a considerar son los respaldos.  Si los metes en la BD, los
>> documentos son parte del pg_dump.  De lo contrario debes respaldarlos
>> por separado (y tienes que tener cuidado de que los respaldos de los
>> archivos sean consistentes con los de la BD).
>>
>> También está el tema de la seguridad: cómo hacer que cada usuario
>> sólo vea los documentos a los que tiene acceso.
>>
>> Otro: si pones los dctos en la BD puede ser mas simple hacer
>> indexacion del texto en ellos.
>>
>> Y supongo que otras consideraciones se me olvidan.
>>
>> En resumen, no es tan facil como parece; en la BD muchos problemas ya
>> estan resueltos.
>>
>> --
>> Álvaro Herrera <alvherre(at)commandprompt(dot)com> The PostgreSQL Company -
>> Command Prompt, Inc.
>> PostgreSQL Replication, Consulting, Custom Development, 24x7 support
>> -
>> Enviado a la lista de correo pgsql-es-ayuda
>> (pgsql-es-ayuda(at)postgresql(dot)org) Para cambiar tu suscripciÛn:
>> http://www.postgresql.org/mailpref/pgsql-es-ayuda
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org) Para cambiar tu suscripcin:
> http://www.postgresql.org/mailpref/pgsql-es-ayuda
>
> __________ Information from ESET NOD32 Antivirus, version of virus signature database 5468 (20100921) __________
>
> The message was checked by ESET NOD32 Antivirus.
>
> http://www.eset.com
>
>
>
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org)
> Para cambiar tu suscripción:
> http://www.postgresql.org/mailpref/pgsql-es-ayuda
>

--
Saludos,
Horacio Miranda Aguilera.

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Carlos Edward Grajales Marmolejo 2010-09-22 04:13:21 Re: Algo raro en una inserccion
Previous Message Horacio Miranda 2010-09-22 02:28:45 Re: Ventajas Postgresql vs Oracle !!!