Arquivos PDF são atualmente um formato popular para a disponibilização de documentos em mídia digital.
Esse formato foi criado pela Adobe com o objetivo de garantir que documentos impressos em folhas de papel pudessem ser reproduzidos de forma consistente e bem controlada. Mas por motivos históricos o seu uso se difundiu muito, muito além desse uso inicial.
Hoje em dia existem várias versões e formatos secundários derivados do PDF. Um deles é o PDF/A, que ganhou importância em anos recentes ao ser favorecido para certos tipos de uso junto a órgãos governamentais.
Uma transição apressada
Documentos digitais e documentos físicos (em papel) são dois tipos bastante diferentes de entidades, com necessidades, vantagens e deficiências muito diferentes. A ampla adoção do formato PDF e de suas variantes deve-se principalmente à sua popularidade e base instalada; o formato era bem conhecido pelo público em geral e muitos já sabiam lidar com ele em certa medida, não precisando portanto ser apresentados a um novo formato e treinados no seu uso.
Formatos melhor concebidos para documentos puramente digitais de fato existem, e apresentam vantagens técnicas enormes para esse uso quando comparados a todo o espectro do formato PDF e suas variantes. Formatos como XML, XHTML, HTML 5, ePUB 3. Formatos que não foram feitos pensando especificamente na impressão em papel, e por isso tiveram espaço para desenvolver a contento vantagens e recursos que estão fora do alcance do PDF.
No entanto, ainda temos talvez dez ou mesmo vinte anos antes que algum ou vários desses formatos (ou seus sucessores) se tornem amplamente difundido junto ao público em geral. Até lá, ainda temos alguns anos de uso do PDF para documentos digitalizados ou verdadeiramente digitais, mesmo que os motivos sejam mais próximos do pragmatismo realista (e resignado) do que da eficiência produtiva.
Problemas com PDFs e como lidar com eles
A preocupação mais frequente com PDFs que se mostram de alguma forma problemáticos costuma ser o tamanho do arquivo (em Kbytes). Existem outros, porém, e mais sérios. Alguns ocorrem sozinhos, outros também aumentam o tamanho do arquivo.
As categorias gerais dos problemas mais comuns são:
- PDFs mal formados: o formato PDF é bastante complexo; não é tão raro encontrar arquivos com problemas exóticos, que não foram corretamente formados e podem inclusive ser recusados por completo. Geralmente há como tratar deles, mas pode ser preciso usar técnicas semi-artesanais.
- Imagens de baixa qualidade: qualquer imagem pode ser integrada a um PDF, mas nem toda imagem é nítida a ponto de ser realmente útil. Algumas imagens são úteis, mas apresentam defeitos ou ineficiências de algum tipo.
- Arquivos PDF sem texto. Como o formato foi feito pensando em documentos em papel, é possível e relativamente frequente encontrar PDFs que a rigor não contém texto algum, cujo conteúdo é composto apenas por imagens (possivelmente de página inteira). São arquivos tecnicamente corretos, mas de utilidade muito limitada. Podem precisar ser processados via OCR e editados penosamente à mão para ser realmente úteis.
- Problemas técnicos menores, como por exemplo tamanhos de página fora do desejado. Podem ter solução plena ou de contorno simples, ou não.
Medidas preventivas
Existem cuidados simples que podem ajudar bastante a evitar problemas mais adiante com PDFs.
- Crie o documento como PDF/A no momento mais inicial possível do ciclo de vida do documento, e mantenha-o como tal até o fim.
- Certifique-se de que todas as imagens sejam nítidas; tente trocá-las, melhorá-las ou substituí-las se praticável e necessário.
- Compare os resultados obtidos com vários softwares e configurações diferentes. Pode haver variações significativas.
- Identifique softwares e configurações que se mostrem problemáticos com alguma regularidade, e procure por alternativas melhores.
Rotina recomendada
Em situações em que a preocupação maior seja de simplesmente garantir tamanhos administráveis de arquivo, muitas vezes o mais prático é simplesmente usar programas como o PDF Split & Merge ("PDFSAM") para dividir o arquivo em arquivos menores.
Pode acontecer de em certos arquivos até mesmo as páginas individuais se mostrem problemáticas.
Nesses casos, pessoalmente gosto de tentar "reimprimir" com o PDF reDirect.
Se o PDF reDirect também não se mostrar suficiente, pode ser necessário abrir o PDF para no LibreOffice Draw, que permite tratar de cada página individual e exportar depois para PDF novamente (inclusive no subformato PDF/A). No LibreOffice Draw é possível e fácil, embora trabalhoso, substituir páginas inteiras por imagens trabalhadas para apresentar a mesma informação de forma mais nítida.
No comments:
Post a Comment