Professional Documents
Culture Documents
DIGITALIZAO DE DOCUMENTOS
ARQUIVSTICOS PERMANENTES
Cmara Tcnica de Documentos Eletrnicos
MINISTRIO DA JUSTIA
ARQUIVO NACIONAL
CONSELHO NACIONAL DE ARQUIVOS
Anexo
RESOLVE:
CONARQ
abril
2010
Crditos
Abril
2010
SUMRIO
1. APRESENTAO
2. PBLICO-ALVO
3. O QUE ESSA RECOMENDAO ABORDA
4. O QUE ESSA RECOMENDAO NO ABORDA
5. O QUE A DIGITALIZAO
6. POR QUE DIGITALIZAR
7. PROJETO DE DIGITALIZAO
8. CAPTURA DIGITAL DA IMAGEM
9. ACESSO
10. ASPECTOS GERAIS PARA SEGURANA, ARMAZENAMENTO E PRESERVAO
DOS REPRESENTANTES DIGITAIS
11. UTILIZAO DE TERCEIRIZAO DE SERVIOS DE DIGITALIZAO
ANEXO II - REFERENCIAS
3
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
1. APRESENTAO
2. PBLICO ALVO
5. O QUE A DIGITALIZAO
4 Captura digital. Nos termos dessa recomendao, significa a converso em imagem, por dispositivo eletrnico
(escner), para o formato digital de um documento originalmente no digital. Ver nota 2, Representante Digital.
5 Indicamos algumas boas prticas em: Aspectos Gerais para Segurana, Armazenamento e Preservao dos
Representantes Digitais.
5
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
Contribuir para o amplo acesso e disseminao dos documentos arquivsticos por meio
da Tecnologia da Informao e Comunicao;
Permitir o intercmbio de acervos documentais e de seus instrumentos de pesquisa por
meio de redes informatizadas;
Promover a difuso e reproduo dos acervos arquivsticos no digitais, em formatos e
apresentaes diferenciados do formato original;
Incrementar a preservao e segurana dos documentos arquivsticos originais que
esto em outros suportes no digitais, por restringir seu manuseio.
TRatamento arquivstico
7. PROJETO DE DIGITALIZAO - avaliao e seleo dos documentos
- higienizao
- identificao e organizao
Antes do incio do projeto, pressupe-se que o tratamento arquivstico dos documentos
e a avaliao e seleo dos conjuntos documentais a serem digitalizados, j tenham sido
desenvolvidos, e que o acervo arquivstico selecionado tenha sido previamente higienizado,
identificado e organizado (arranjo, descrio e indexao) .
A fim de se gerar um representante digital fiel ao documento original, deve-se
identificar o menor caractere (linha, trao, ponto, mancha de impresso) a ser digitalizado
para a determinao da resoluo ptica que garantir sua legibilidade na verso digital. Para
a definio do tipo de equipamento de captura digital a ser utilizado, deve-se observar os tipos
documentais existentes no acervo e sua quantificao, alm das caractersticas fsico-qumicas
de cada tipo de documento, para reduzir os riscos6 integridade fsica do original.
O processo de digitalizao dever ser realizado, preferencialmente, nas instalaes
das instituies detentoras do acervo documental, evitando seu transporte e manuseio
inadequados, e a possibilidade de danos causados por questes ambientais, roubo ou extravio.
Na eventualidade de terceirizao ou contratao de servios ver: Utilizao de servios
terceirizados de digitalizao e correlatos.
Recomenda-se a digitalizao de conjuntos documentais integrais, como
fundos/colees ou sries. No entanto, possvel digitalizar itens documentais isolados,
6 Recomenda-se a consulta aos Cadernos Tcnicos do Projeto de Conservao Preventiva de Bibliotecas e Arquivos
CPBA,de ns 1 a 9: Armazenagem e Manuseio; ns 10 a 12: Procedimentos de Conservao, 13 - Manual de Pequenos
Reparos em Livros, n 39 - Preservao de fotografias: mtodos bsicos para salvaguardar suas colees e, n 41 -
Indicaes para o cuidado e a identificao da base de filmes fotogrficos. Disponveis em:
<http://siarq49.siarq.unicamp.br/cpba>.
6
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
devido frequncia de uso, estado de conservao, ou alto valor intrnseco7 com necessidade de
incremento de sua segurana, sem entretanto descontextualiz-los do conjunto a que
pertencem.
7 Valor intrnseco : Valor que um documento possui em razo de seu contedo, das circunstncias de sua produo,
de suas assinaturas ou selo. Cf. Dicionrio brasileiro de terminologia arquivstica. Rio de Janeiro: Arquivo Nacional, 2005.
232 p. Publicaes Tcnicas; n 51.
8 V. nota 4.
9 Recomendamos a consulta aos Cadernos Tcnicos do CBPA, de n 51: Requisitos de resoluo digital para
textos: mtodos para o estabelecimento de critrios de qualidade de imagem; e de n 44, O bsico sobre o processo de
digitalizar imagens. Disponveis em: <http://siarq49.siarq.unicamp.br/cpba>.
Ver tambm a recomendao do National Archives and Records Administration (NARA): Technical Guidelines
for Digitizing Archival Materials for Electronic Access: Creation of Production Master Files Raster Images For the
Following Record Types- Textual, Graphic Illustrations/Artwork/Originals, Maps, Plans, Oversized, Photographs,
Aerial Photographs, and Objects/Artifacts e as referncias contidas no seu Anexo II.
10 Escaneamento: Nessa recomendao o termo que designa a converso em imagem em arquivo digital por meio
de um utlizando-se dispositivo eletrnico.
7
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
11 Pixel: o menor ponto que forma uma imagem digital. Quanto maior for o nmero de pixels, melhor a resoluo da
imagem. Utilizado para estabelecer a resoluo da imagem em formato digital e padro de visualizao em tela.
12 Interpolao: aumento artificial, por meio de software, da quantidade de pontos (pixels).
8
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
Escneres planetrios
Este tipo de equipamento utiliza uma unidade de captura semelhante a uma cmera
fotogrfica, uma mesa de reproduo13 que define a rea de escaneamento e uma fonte de
luz. So usados para a digitalizao de documentos planos em folha simples, de documentos
encadernados que necessitem de compensao de lombada, de forma a garantir a integridade
fsica dos mesmos, bem como para os documentos fisicamente frgeis, j que no ocorre
nenhuma forma de trao ou presso mecnica sobre os documentos.
Cmeras digitais
O uso de cmeras digitais implica no uso de mesas de reproduo, para a garantia do
paralelismo necessrio uma boa qualidade da imagem digital gerada, alm de sistemas de
iluminao artificial compatveis, necessariamente com baixa intensidade de calor e o mnimo
de tempo de exposio necessrio para no comprometer o estado de conservao dos
documentos arquivsticos originais, em especial os itens coloridos e as fotografias produzidas
com processos fotogrficos no contemporneos, como daguerretipos, albuminados e
ferrtipos14.
Recomenda-se o uso de cmeras de mdio e grande formato com backs digitais15 para
gerao de representantes digitais de alta qualidade, e para a captura digital de documentos
em grandes formatos como mapas e plantas. Sempre que possvel, deve-se privilegiar
sistemas planetrios de captura para evitar riscos de manuseio dos originais a serem
digitalizados, principalmente quando se tratar de documentos frgeis e encadernados.
As cmeras digitais geram um arquivo digital denominado de RAW16, e que um
formato proprietrio (cada fabricante tem o seu prprio formato que o faz dependente de
hardware e software especficos). Entendemos que a utilizao da cmera digital para
13 H modelos de mesa de reproduo disponveis que possuem um sistema de suco que permite a reproduo de
documentos de grandes formatos sem a formao de dobras e mossas na superfcie do documento.
14 Processos fotogrficos: Consultar os Cadernos Tcnicos do CBPA de n 39 - Preservao de fotografias: mtodos
bsicos de salvaguardar suas colees, n 40 - Guia do Image Permanence Institute (IPI) para armazenamento de
filmes de acetato e n 41 - Indicaes para o cuidado e a identificao da base de filmes fotogrficos.
15 o dispositivo de captura digital (sensor - CCD) acoplado a uma cmera fotogrfica dotada de conjunto ptico (lentes )
convencional ou hbrido.
16 RAW. o formato de arquivo diigtal das cameras diigtais e de escaners. So formatos proprietrios. Em geral as imagens
em RAW so convertidas para formatos como o TIF ou JPEG. Em fotografia digital so muitas vezes denominados de
negativos digitais pois so o registro em arquivo digital. Ver nota 17.
9
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
17 A preservao de arquivos digitais em formato RAW tem sido abordada, por exemplo, com a sua converso para o DNG
(Adobe Digital Negative, criado pela @Adobe) ou para uma soluo em desenvolvimento denominada de OpenRaw, a
fim de evitar a manuteno de inmeros e diversos formatos proprietrios RAW. Sobre essa questo ver: Camera Raw
Formats (Group Description) em http://www.digitalpreservation.gov/formats/fdd/fdd000241.shtml e Adobe Digital
Negative (DNG) em http://www.digitalpreservation.gov/formats/fdd/fdd000188.shtml e OpenRaw em
http://www.openraw.org.
18 Escneres multiformato possuem dispositivos adaptadores que permitem o manuseio de formatos de filmes fotogrficos
em tamanhos e tipos variados, como tiras de 16mm, 35mm, cromos, etc.
19 Para microformas, ver o Manual do RLG para microfilmagem de arquivos. Projeto Conservao Preventiva em
Bibliotecas e Arquivos: Arquivo Nacional. 2001. Caderno Tcnico n 53. Rio de Janeiro. Disponvel em:
http://siarq49.siarq.unicamp.br/cpba.
20 Digitization and Preservation of Archival Material Principles and Dogmas. Lajos Krmendy - National Archives of
Hungary. Disponvel em: http://www.liv.ac.uk/researchintelligence/issue20/pdf/ri20.pdf
10
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
21 a) "The unit/partner/contractor shall not use automatic feed devices, drum scanners or other machines that require
archival materials to be fed into rollers or wrapped around rollers, that place excessive pressure on archival materials,
or require the document to be taped to a cylinder. Motorized transport is acceptable when scanning microfilm. In
Technical Guidelines for Digitizing Archival Materials for Electronic Access: Creation of Production Files, Raster
Images For the Following Record Types- Textual, Graphic Illustrations, Artwork, Originals, Maps, Plans, Oversized,
Photographs, Aerial Photographs, and Objects, Artifacts.. Written by Steven Puglia, Jeffrey Reed, and Erin Rhodes.
Maryland, 2004. pag.179. [National Archives and Records Administration] - Disponvel em: <
http://www.archives.gov/preservation/technical/guidelines.html> Acesso: Dez. 2009.
22 Valor intrnseco : Valor que um documento possui em razo de seu contedo, das circunstncias de sua produo,
de suas assinaturas ou selo. Dicionrio Brasileiro de Terminologia Arquivstica. Rio de Janeiro : Arquivo Nacional, 2005. pg.
170.
23 Aqui deve-se distinguir acervo/documento fotogrfico daquelas imagens que so simplesmente impressas em papel ou
material assemelhado.
11
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
SINALTICA24
Em imagem digital as sinalticas bsicas so as seguintes:
Escala de cinza;
Escala de cores;
Escalas e sinalizao de dimenses.
No se deve inserir na imagem digital uma sinaltica to prxima imagem. Deve-se
manter uma pequena margemao redor do documento que permita um recorte posterior para a
produo de formatos de arquivo digital derivados para acesso.
24 Sobre sinalticas em imagens digitais ver: Technical Guidelines for Digitizing Archival Materials for
Electronic Access: Creation of Production Master Files Raster Images For the Following Record Types- Textual,
Graphic Illustrations/Artwork/Originals, Maps, Plans, Oversized, Photographs, Aerial Photographs, and
Objects/Artifacts.- U.S. National Archives and Records Administration (NARA). Disponvel em:
<http://www.archives.gov/preservation/technical/guidelines.html>. Acesso em abril de 2009.
12
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
1) MATRIZ DIGITAL MD
25 Formato de arquivo: Especificao de regras e padres descritos formalmente para interpretao dos bits
constituintes de um arquivo digital. Pode ser: 1. aberto quando as especificaes so pblicas (p. ex.: XML, HTML, ODF e
RTF); 2. fechado quando as especificaes no so divulgadas pelo proprietrio (p. ex.: doc); 3. proprietrio quando as
especificaes so definidas por uma empresa que mantm seus direitos, sendo seu uso gratuito ou no (p. ex.: pdf, [...], doc
e gif); 4. padronizado quando as especificaes so produzidas por um organismo de normalizao, sendo os formatos
abertos e no proprietrios (p. ex.: XML). (I) Format; (F) format; (E) formato. In: Conselho Nacional de Arquivos.
CONARQ. Cmara Tcnica de Documentos Eletrnicos CTDE. Glossrio, 2008 - Disponvel em:
<http://www.documentoseletronicos.arquivonacional.gov.br/media/publicacoes/glossario/2009glossario_v5.0_final.pdf>
Acesso: Dez. 2009.
26 Interpares2 Project (2007) General Study 11 Final Report: Selecting Digital File Formats for Long-Term
Preservation. Ver em: <http://www.interpares.org/display_file.cfm?doc=ip2_file_formats%28complete%29.pdf > Acesso:
Dez. 2009.
27 Para conhecer uma abordagem atualizada sobre formatos de matrizes digitais, recomendamos o estudo da National
Libray of Netherlands: Alternative File Formats for Storing Master Images of Digitisation Projects. Disponvel em:
<http://www.kb.nl/hrd/dd/dd_links_en_publicaties/publicaties/Alternative%20File%20Formats%20for%20Stori
ng%20Masters%202%201.pdf> Acesso: Abr. 2009.
28 Na data de publicao dessa recomendao, a ltima verso desse formato digital de imagem o TIFF 6.0. Para efeito de
atualizao, recomendamos, quando da realizao de projeto de digitalizao. Disponvel em:
<http://partners.adobe.com/public/developer/tiff/index.html>. Acesso em abril de 2009.
29 PNG <http://www.digitalpreservation.gov/formats/fdd/fdd000138.shtml>. Acesso: Dez. 2009
30 JPEG 2000 <http://www.digitalpreservation.gov/formats/fdd/fdd000138.shtml>. Acesso. Dez. 2009
13
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
Os representantes digitais denominados como tal devero ter alta qualidade de captura
(resoluo ptica em dpi e profundidade de bit) e ser armazenados e gerenciados por
profissionais altamente qualificados em Tecnologia da Informao; o acesso dever ser
restrito e sob nenhuma hiptese autorizado a usurios no credenciados. O armazenamento
desta matriz dever ser feito em ambiente altamente protegido e fora dos sistemas e redes de
dados para acesso remoto.
Recomenda-se a adoo de resoluo ptica, profundidades de bit e modo de cor de
acordo com a Tabela 1 para a obteno de um MD com capacidade de reproduzir o original
em escala 1:1.
Maiores valores de resoluo linear em dpi podem ser considerados em razo das
caractersticas do documento original, e da opo em se ter os representantes digitais com
elevado nvel de detalhamento. A adoo de resoluo acima de 300 dpi implicar, portanto,
na criao de matrizes digitais com maior tamanho em bits e necessidade de previso de
maior espao de armazenamento.
Alm da prpria MD, deve-se criar duas cpias de segurana sendo uma a ser
armazenada em um servidor com sistema de espelhamento do tipo RAID31 com acesso restrito
e uma em fitas magnticas do tipo Linear Tape Open.
31 R.A.I.D Acrnimo de Redundant Array of Independent Discs ou Redundant Array of Inexpensive Discs (as vezes pode-
se grafar como Drives ao invs de Discs). A idia bsica por trs do RAID combinar diversos discos pequenos e de
custo baixo em um conjunto, para atingir objetivos de desempenho ou redundncia inatingveis com um disco grande e de
custo alto. Este conjunto de discos aparece para o computador como uma nica unidade ou disco de armazenamento
lgico. [...]. O conceito fundamental do RAID que os dados podem ser distribudos ao longo de cada disco do conjunto
de maneira consistente. Para fazer isso, primeiramente os dados precisam ser quebrados em pedaos de tamanho
consistente [...] Cada pedao ento gravado em um disco rgido no RAID, conforme o nvel do RAID usado. Quando os
dados tiverem que ser acessados, o processo revertido, dando a impresso de que os discos mltiplos so um disco
grande. Disponvel em: <http://web.mit.edu/rhel-doc/3/rhel-sag-pt_br-3/ch-raid-intro.html> Acesso em abril de
2009.
14
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
Essas cpias devem ser armazenadas em locais diferentes. A partir da MDPI que
sero gerados posteriormente os outros formatos de representantes digitais derivadas, e de
acordo com a necessidade dos usurios finais32.
3) FORMATOS DE ACESSO
So os representantes digitais de acesso para visualizao em tela, de navegao
(thumbnails), de impresso e para download e que so gerados a partir das MD para
diferentes usos e, sempre que possvel, de acordo com a demanda dos usurios finais.
DERIVADAS DE ACESSO DA
A partir da Matriz Digital ou da Matriz Digital com Processamento de Imagem (caso
seja utilizada), sero criados um ou mais representantes digitais, que denominamos nessa
recomendao como Derivadas de Acesso, com compresso e menor resoluo linear,
facilitando o seu acesso, disseminao e uso.
Recomenda-se que as derivadas de acesso destinadas aos usurios finais - para
visualizao em tela, impresso, download33 ou cpia por demanda34, sejam disponibilizadas
preferencialmente em formato aberto, e em variados tamanhos de acordo com a banda
utilizada por esse(s) mesmo(s) usurio(s) (conexo discada a 56 kbps, bandas largas de 256
kbps a 12 mbps, ou maiores).
As derivadas de acesso podem receber tratamento de imagem a fim de permitir melhor
visualizao ou impresso. Entretanto, critrios ticos devem pautar esse tipo de interveno
para que elas no se tornem dissociadas e no representem corretamente o documento original
que as gerou. Sempre que possvel, devero ser utilizados preferencialmente formatos abertos
para a gerao dessas derivadas, e recomendamos os formatos JPEG35 e PNG. No entanto,
pode ser necessria a utilizao de outros formatos de arquivo digitais, at mesmo
proprietrios, em virtude de concepo de acesso por parte dos provedores e custodiadores
dos representantes digitais.
32 Para saber mais sobre essa modalidade e utilizao de matriz digital com processamento de imagem: O National
Archives (NARA) sugere a criao de Production File Masters, e a ndia os denominados Clean Master como Masters
intermedirios entre as Matrizes e os formatos de arquivo digital derivadas. Ver no Technical Guidelines for Digitizing
Archival Materials for Electronic Access: Creation of Production Master Files Raster Images For the Following
Record Types- Textual, Graphic Illustrations/Artwork/Originals, Maps, Plans, Oversized, Photographs, Aerial
Photographs, and Objects/Artifacts.- U.S. National Archives and Records Administration (NARA). APPENDIX A:
Digitizing for Preservation vs. Production Masters, p.66: Disponvel em:
<http://www.archives.gov/preservation/technical/guidelines.pdf> Sugerimos tambm consulta ao Guidelines for
Digitization of Manuscripts. National Mission for Manuscripts, 2005. ndia. Output Specification, p.15. Disponvel em:
<http://namami.nic.in/DigiStds.htm>. Acesso em abril de 2009.
33 Download o recurso de disponibilizar arquivos em formato digital por meio da internet ou intranet, permitindo a sua
transferncia para um dispositivos de armazenamento remoto.
34 Cpia por demanda. Essa uma modalidade de reproduo que pode ser realizada a partir de uma gama de formatos de
arquivos digitais oferecidos e formas de entrega por meio de redes de dados, ou em mdias de armazenamento. A partir de
solicitao individual direta a organizao (pedido de servio) ou por meio automatizado, diferenciados formatos de
arquivo digitais podem ser gerados e disponibilizados ao usurio final, como por exemplo de um item ou vrios itens
documentais (variadas imagens) onde esses so convertidos em um nico documento em formato como o PDF.
35 JPEG - Joint Photographic Experts Group. Formato digital de imagem. um formato de arquivo digital com compresso
com perdas (lossy), padronizado pela ISO, International Standard Organization hipte://www.iso.org, de ampla aceitao
e uso, o que o limita como melhor opo para matriz digital. Tem sido avaliado o uso do formato JPEG 2000, para a
produo de matrizes digitais. Disponvel em: <http://www.jpeg.org/> . Acesso em abril de 2009.
15
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
36 PDF - Portable Document Format. - Formato digital desenvolvido pela @Adobe em 1993, e em 2008 adotado como
padro ISO-3200, e que permite capturar e visualizar informaes consistentes - a partir de quase todo aplicativo ou
sistema operacional - e compartilh-las praticamente com qualquer pessoa, em qualquer lugar.... Em 2005, a ISO adotou
o padro PDF/Archive - PDF/A - ISO 19005-1:2005, que assegura o acesso a longo prazo. Disponvel em:
http://www.adobe.com/br/products/acrobat/adobepdf.html
37 Ver em http://djvu.org/. Acesso: Dez. 2009
16
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
TABELA 1
Tipo de Formato de
Tipo de documento Resoluo mnima, modo de cor e observaes
Reproduo arquivo digital
Textos impressos, sem Resoluo mnima de 300 dpi39, escala 1:1, com margem
ilustrao, preto e TIFF38 sem preta de 0,2 cm ao redor do documento, 4 bits, modo
Bitonal (**)
branco. (*) sem compresso bitonal(**)
manchas
Textos impressos, com Resoluo mnima de 300 dpi, escala 1:1, com margem
ilustrao e preto e Tons de cinza TIFF sem preta de 0,2 cm ao redor do documento, 8 bits, modo
branco.(*) com (***) compresso tons de cinza (***)
manchas
Textos impressos, com Resoluo mnima de 300 dpi , escala 1:1, com margem
TIFF sem
ilustrao e cor Cor preta de 0,2 cm ao redor do documento, 24 bits (8 bits
compresso
por canal de cor), modo RGB (****)
Manuscritos sem a Resoluo mnima de 300 dpi, escala 1:1, com margem
TIFF sem
presena de cor Tons de cinza preta de 0,2cm ao redor do documento, 8 bits, modo tons
compresso
de cinza (***)
Manuscritos com a Resoluo mnima de 300 dpi, escala 1:1, com margem
TIFF sem
presena de cor Cor preta de 0,2 cm ao redor do documento, 24 bits (8 bits
compresso
por canal de cor), modo RGB (****)
Fotografias Resoluo mnima de 300 dpi, escala 1:1, com margem
(Preto e Branco e Cor) TIFF sem preta de 0,2 cm ao redor do documento, 24 bits (8 bits
Cor
(**) compresso por canal de cor), modo RGB, com carta de cinza para
ajuste de nveis (preferencialmente)
Negativos fotogrficos TIFF sem Resoluo mnima de 3000 dpi, 24 bits (8 bits por canal
e diapositivos (a) Cor de cor), modo RGB (****)
compresso
Documentos Resoluo mnima de 300 dpi, escala 1:1, com margem
cartogrficos TIFF sem preta de 0,2cm ao redor do documento, 24 bits (8 bits por
Cor
compresso canal de cor), modo RGB, com carta de cinza para ajuste
de nveis (preferencialmente) (****)
Plantas Resoluo mnima de 600 dpi, 8 bits, com possibilidade
Preto e branco TIFF
de modo tons de cinza (****)
Microfilmes e Tons de cinza TIFF sem Resoluo mnima de 300 dpi, 8 bits, modo tons de cinza
microfichas (***) compresso (***)
Gravuras, cartazes e Resoluo mnima de 300 dpi, escala 1:1, com margem
desenhos (Preto e preta de 0,2cm ao redor do documento, 24 bits (8 bits por
TIFF sem
Branco e Cor) Cor canal de cor), modo RGB, com carta de cinza ou cores
compresso
para ajuste de nveis (preferencialmente)
(****)
(*) Sem manchas / com manchas.
(**) Bi-tonal: Captura de imagem onde no h gradao entre o claro e o escuro. Recomenda-se o seu uso somente para
textos impressos e/ou datilografados monocromticos e muito homogneos, sem presena de manchas ou escurecimento do
suporte original.
(***) Tons de Cinza / Escala de cinza: (Greyscale) - Recomenda-se o uso de escala de cinza para evitar que pequenas
manchas interfiram na leitura final do representante digital. Da mesma forma para a digitalizao de microformas, caso
tenham as caractersticas assinaladas acima.
(****) Modo de cor: RGB (Red-Green-Blue). Padro de cores. RGB a abreviatura do sistema de cores aditivas formado
por Vermelho (Red), Verde (Green) e Azul (Blue). Este sistema constitudo por projees de luz como monitores de vdeo
e projetores (data displays), em contraposio ao sistema substrativo, formado por impresses (CMYK). O padro RGB
padro para apresentao de cores na internet e seu uso recomendado para documentos originalmente coloridos ou com
informaes relevantes em cor e fotografias de modo geral.
38 Avaliar de acordo com o documento original a utilizao do formato de arquivo PNG ao invs de TIFF.
39 A resoluo ptica mnima de de 300 dpi a recomendvel quando se deseja utilizar a tecnologia OCR (Optical
Character Recognition).
17
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
METADADOS TCNICOS
40 International Color Consortium - ICC. Especificaes para sistemas de cores em formatos e plataformas abertas.
Disponvel em: <http://www.color.org/index.xalter>. Acesso em abril de 2009.
41 Hashing, hash . Algoritmo que mapeia uma sequencia de bits (de um arquivo em formato digital), com a finalidade de
realizar a sua verificao de integridade (cheksum).
18
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
seja nico
seja consistentemente estruturado
seja considerado o mximo de itens a serem escaneados
ao utilizar um esquema numrico, use zeros esquerda para facilitar a composio do
identificador
seja concebido de forma pouco complexa e no muito longo de modo a evitar erros humanos
use minsculas e extenses de arquivo (ex. TIFF, JPEG)
uso de nmeros e/ou letras, mas no se recomenda o uso de caracteres de smbolos e espaos
que possam dificultar a interoperabilidade
metadados dos documentos inseridos nos nomes dos arquivos (como data da captura, nmero
de pgina) tambm devem ser replicados em local prprio, para prover segurana e facilidades
quando da movimentao da imagem para outros sistemas ou na necessidade de ser
renomeado/identificado
sequenciamento de informaes e divises estruturais importantes de imagens multi-partidas
devem ser explicitamente registradas nos metadados estruturais e no apenas embutidos nos
nomes dos arquivos
embora no seja recomendado incorporar informao em demasia no nome do arquivo, uma
certa quantidade de informao pode servir como metadado descritivo mnima para o
documento/arquivo/imagem, e uma alternativa econmica para o fornecimento de dados mais
detalhados em outra parte
na eventualidade de se utilizar um nome temporrio, recomenda-se a utilizao de um esquema
numrico simples, associando-o intelectualmente a um nome mais complexo por meio de um
banco de dados
42 Baseado e adaptado de: Technical Guidelines for Digitizing Archival Materials for Electronic Access: Creation of
Production Files Raster Images For the Following Record Types- Textual, Graphic
Illustrations/Artwork/Originals, Maps, Plans, Oversized, Photographs, Aerial Photographs, and Objects/Artifacts.
p. 60. VI. STORAGE : File Naming. Disponvel em:
<http://www.archives.gov/preservation/technical/guidelines.pdf> Acesso em abril de 2009.
19
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
Por impresso
Exame pelo olho humano, de cpias impressas para avaliar a qualidade da captura
digital comparando com o documento original.
Calibrao de Monitores
Recomenda-se o uso de espectrofotmetros para calibragem dos monitores e a criao
de perfis de cor para que sejam equivalentes s visualizaes no monitor e na impresso.
Existem uma gama de softwares e equipamentos especficos para essa tarefa.
Validao e Conformidade
43 Criao de Perfil ICC - International Color Consortium - Especificaes para sistemas de cores em formatos e
plataformas abertas. Disponvel em: <http://www.color.org/index.xalter>. Acesso em abril de 2009.
44 Criao de Perfil ICC V. nota 43.
20
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
9. ACESSO
45 SGBD Sistema de Gerenciamento de Bases de dados - um software ou conjunto deles, responsvel pelo
gerenciamento de uma base de dados. O seu objetivo de servir a aplicao cliente, e gerenciar o acesso, manipulao e
organizao dos dados. O SGBD disponibiliza uma interface para que os seus clientes possam incluir, alterar ou consultar
dados. Em bancos de dados relacionais a interface constituda pelas APIs ou drivers do SGBD, que executam comandos
na linguagem SQL.
21
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
ARMAZENAMENTO
Para o armazenamento de representantes digitais de acervos de grandes dimenses e
que envolvam grande quantidade de dados e portanto maiores dimenses de volume em bytes
recomenda-se preferencialmente a utilizao de memrias de memrias secundrias e
tercirias. O mercado apresenta solues de hardware especficos para armazenamento de
massa (data storage / mass storage).
MATRIZES DIGITAIS
Discos rgidos HD - (hard disks), preferencialmente em configurao RAID48 que
incrementam a segurana.
Fitas magnticas do tipo LTO (Linear Tape-Open), e similares, que permitem o
armazenamento off-line de grandes volumes de documentos digitais com custo mais
baixo que os Hds.
DERIVADAS DE ACESSO
Os representantes digitais para acesso pelo usurio final (internos ou externos),
devero estar disponveis por meio de unidades de HD ou mesmo em juke-box de
CDs/DVDs, concebidas especificamente para esse fim.
Quando se pretender disponibilizar os representantes digitais em sistemas de acesso
externo (stios da internet), esses devem estar armazenados em dispositivos prprios,
como os citados acima, mas no interligados (on-line) ao sistema de armazenamento e
segurana das Matrizes Digitais.
CPIAS DE SEGURANA
Devem ser criadas ao menos duas matrizes digitais de segurana, e uma matriz com
processamento de imagem (se for gerada). Essas cpias devem estar armazenadas fora de
linha (off-line), ou seja sem conexo fsica na rede de dados e recomenda-se que uma
cpia esteja em armazenamento off-site (armazenada em condies adequadas em
instalao diversa e afastada da organizao detentora do acervo).
Recomenda-se a gerao e manuteno tambm de cpias de segurana dos
representantes digitais (derivadas) para acesso.
Cada tipo de cpia, matriz ou derivada deve ser armazenada em dispositivo especfico.
Devem ser criadas cpias de segurana das planilhas dos metadados tcnicos que
estejam em banco de dados, bem como dos demais metadados estruturais, descritivos e
administrativos.
49 Cf. U.S. NATIONAL ARCHIVES AND RECORDS ADMINISTRATION. Preservation Guidelines for Vendors
Handling Records and Historical Materials. Disponvel em:
<http://www.archives.gov/preservation/technical/vendor-training.html>. Acesso em abril de 2009.
23
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
50 Mdia de armazenamento. A mdia de armazenamento do formato digital para efeito de entrega pela contratada a
contratante, em geral diverso daquela utilizada para o armazenamento definitivo. Por exemplo, os representantes
digitais podem ser entregues em mdia mvel (discos pticos) e que sero transferidos para Hard Disks de alta
capacidade. Essa forma de operao tcnica tambm necessria para incrementar a segurana, uma vez que recomenda-
se uma quarentena e anlise para a verificao de falhas, corrupo de dados e de riscos como vrus informticos..
24
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
ANEXO I
Essa lista de verificao para se obter um indicativo de qualidade da captura digital e da criao dos
51
representantes digitais matrizes digital e dos derivados.
51 Adaptado de: Guidelines for Digitization of Manuscripts. National Mission for Manuscripts, 2005. ndia. Disponvel em:
<http://namami.nic.in/DigiStds.htm>. Acesso em abril de 2009.
25
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
52 Padro Moir: um padro de interferncia em captura digital de imagem, quando surgem contrastes (conhecidos como
tramas ou grades), que no existem na imagem original, devido a superposio de linhas em ngulos diferenciados, ou
porque elas tem tamanhos diferentes. Para evit-lo, pode-se alterar o ngulo do objeto original no instante da captura, ou
por processos em softwares de imagem.
53 Histograma da imagem digital a representao grfica das medies da luminosidade da imagem no momento da
captura, numa escala de 256 tons de cinza.
26
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
ANEXO II
REFERENCIAS
27
CONSELHO NACIONAL DE ARQUIVOS - CONARQ
Recomendaes para Digitalizao de Documentos Arquivsticos Permanentes - 2010
28