You are on page 1of 38

Fundamentos para la digitalización y gestión de largo plazo

de colecciones digitalizadas
CICAC - Comisión Nacional de Energía Atómica – octubre 2010

Segunda reunión

Lic. Fernando Boro


FFyL – UBA/CONICET
Lic. Fernando Boro Fundamentos para la digitalización... 1
Fundamentos para proyectos de digitalización
Cadena de decisiones

Originales Tecnología


Selección originales, criterios

Dispositivos de captura = original manda


Evaluación de estado y formato

Tipos y formatos de imágenes digitales


Instrumentos descriptivos

Masters y copias de acceso


Copyright

Resolución (ppi), criterios

Profundidad de bits, criterios
Proyecto

Esquemas de nombramiento de archivos

Objetivos y público de referencia

Textos, OCR

Productos: imagen, texto, ambos

Sistema de acceso (web; otros medios)

Escala del proyecto

Hardware y software

En casa o por terceros

Requerimientos preservación digital

Ciclo de vida esperado

Lic. Fernando Boro Fundamentos para la digitalización... 2


Fundamentos para proyectos de digitalización
Evaluación de estado y formato

Evaluar el estado de conservación de los originales


¿Se puede digitalizar directamente? ¿Requiere tratamiento previo? ¿Qué tipo
de escaner o cámara digital necesito para preservar los originales? Establecer
normas de manejo seguro (traslado, escaneo, máxima exposición a la luz y el
calor, etc.). Disponer de un lugar adecuado

Consultar con especialistas en conservación, curadores, etc.

Evaluar tamaño y formato


Pueden ser hojas sueltas manuscritas, periódicos, material encuadernado
impreso o manuscrito, fotografías, negativos, mapas, etc. Si revisten valor
histórico o integran “colecciones especiales”:


Encuadernados:
Encuadernados Procesar con cámara digital o escaner “planetario”
Evitar escaner de cama plana (arriesga la integridad del original)


Sueltos: se pueden capturar con escáneres comunes de cama plana, hasta
formato DIN A3 (límite de los escáneres de cama plana). Si son de gran
formato, se usan cámaras de alta resolución o escaneres especiales

Lic. Fernando Boro Fundamentos para la digitalización... 3


Fundamentos para proyectos de digitalización
Instrumentos descriptivos

¿Existen instrumentos descriptivos para la nueva colección digital?



Si existen, revisar su adecuación a estándares en uso en una comunidad
determinada (bibliotecas, archivos, museos, o bien por grandes áreas del
conocimiento). La preservación digital de largo plazo se verá facilitada con la
adhesión a estándares reconocidos de descripción. De lo contrario, habrá que
crearlos al efecto.


Determinar el alcance de los instrumentos de descripción: a diferencia del
acceso analógico (físico), el acceso electrónico plantea exigencias mayores
para el descubrimiento y uso de los recursos de información.

Ejemplo

Un usuario por Internet esperará encontrar no sólo el texto o las imágenes


de un libro digitalizado, sino acceso directo (hipervínculos) a sus partes
componentes (índice, tabla de contenidos, capítulos, índice de ilustraciones,
etc.), así como la posibilidad de navegar las páginas en forma secuencial

Lic. Fernando Boro Fundamentos para la digitalización... 4


Fundamentos para proyectos de digitalización
Definición del proyecto


Determinación de la escala del proyecto
Disponibilidad actual y futura de recursos humanos y financieros
Arquitectura de hardware y software necesaria
“Familiaridad institucional” con las nuevas tecnologías


Como regla general
Involucrar a los profesionales de la informática, y alcanzar un
lenguaje en común con ellos: CRUCIAL
Empezar en pequeña escala (realizar experiencia de aprendizaje
tecnológico)
Se cometerán errores: si escala pequeña, recuperación sencilla
Aprender de los errores
Documentar la experiencia


Analizar las etapas del workflow: ¿qué se puede automatizar?
Fundamental para poder pasar del “proyecto piloto” a un régimen de
producción regular ----> compromiso institucional permanente

Lic. Fernando Boro Fundamentos para la digitalización... 5


Fundamentos para proyectos de digitalización
Tecnología

Dispositivos de captura
Dispositivo Originales / características

Escaner Flatbed A4 Sueltos, hasta tamaño DIN A4. No apto encuadernados delicados.
(de escritorio)

Escaner Flatbed A3 Idem, hasta DIN A3. No apto encuadernados delicados.


DSLR (cámara Encuadernados y todo lo “fotografiable”. Requiere iluminación
digital “35mm”) controlada. Resolución depende tamaño del sensor y del original.
Preferible de 10 MP en adelante. Variedad de lentes.

Idem anterior + obras arte museos + originales gran formato. Usan


Cámara fotográfica respaldos digitales de alta resolución (de 16 MP a 60 MP). Iluminación
formato medio
controlada. Excelente reprod. color. Sistema experto.
Encuadernados + cualquier material de 2 dimensiones que quepa en la
Escaner planetario platina (mat. sueltos, fotografías, etc.). Hasta formato A0. Los mejores
(overhead) para usan cunas compensadoras para proteger libros, iluminación especial,
bibliotecas autofoco y software de alta productividad.

Lic. Fernando Boro Fundamentos para la digitalización... 6


Fundamentos para proyectos de digitalización
Tecnología

Dispositivos de captura (cont.)

Escaner de Muy alta resolución, industria gráfica y publicidad. No apto para


tambor materiales frágiles: mecanismos de tracción fuerte ---> No suele
usarse en bibliotecas, archivos, etc.

Mecanismos de tracción, debería usarse sólo después de consultar


Escaner de con especialistas en conservación y evaluar el riesgo. Se deberían
planos (plotter) utilizar los nuevos escáneres planetarios para mapas, sin tracción
de ningún tipo (son mucho más caros)

Bibliotecas. Distintos modelos con distintas resoluciones, algunos


con funciones automáticas. Fabricantes suelen expresar la
Escaner de
resolución (dpi) calculada sobre tamaño del original papel.
papel Analizar
microfilms
tasas de reducción en distintas colecciones microfilmadas, para
conocer la resolución real alcanzable en cada caso

Procesan film de 35mm y formato 120, con resoluciones entre 2500


Escaner de dpi y 4000 dpi. Buen rango dinámico, muy superiores a los
negativos y escáneres de escritorio A4 y A3 con adaptadores para diapositivas y
diapositivas negativos de 35mm

Lic. Fernando Boro Fundamentos para la digitalización... 7


Fundamentos para proyectos de digitalización
Tecnología
Dispositivos de captura (cont.)

Escaner planetario
para mapas, sin
Escaner A3 tracción (A0)

Escaner de
microfilm

Cámara DSLR
digital “35mm” Escaner de
mapas con
tracción

Escaner Escaner de
Cámaras de formato
planetario negativos
medio con respaldo
digital para libros
(A1)

Lic. Fernando Boro Fundamentos para la digitalización... 8


Fundamentos para proyectos de digitalización
Tecnología
Dispositivos de captura (cont.)
Basados en cámaras digitales
Automático para libros
Para mapas y planos

Lic. Fernando Boro Fundamentos para la digitalización... 9


Fundamentos para proyectos de digitalización
Tecnología

Algunos dispositivos de captura (cont.)

Alimentadores automáticos

Es común que los escáneres de escritorio (A4) y los de formato A3 presenten


una bandeja para la alimentación automática del papel. Sólo se recomienda
usarla con materiales nuevos y en buen estado.

El alimentador tiene un mecanismo de tracción, con rodillos de goma o plástico,


que podría dañar a un original delicado.

Es muy útil para escanear rápidamente impresos no encuadernados, o que


podemos desencuadernar sin riesgo (porque tenemos muchos ejemplares y el
copyright es de nuestra institución, por ejemplo).

No intentar con originales antiguos o valiosos (manuscritos históricos, etc.).

Lic. Fernando Boro Fundamentos para la digitalización... 10


Fundamentos para proyectos de digitalización
Tecnología

Imágenes digitales
Las computadoras sólo procesan código binario; si queremos
tener versiones digitales de imágenes físicas (páginas de libros,
fotografías, documentos, etc.) necesitamos convertir esas
imágenes analógicas a un código binario procesable por
computadora.
A ese proceso se lo conoce como digitalización,
digitalización mediando algún
dispositivo de captura,
captura típicamente escáneres y cámaras
digitales.
Los datos binarios (ceros y unos = bits)
bits creados por el escaner
son enviados a la computadora, donde el usuario define un
modo o formato de disponer esos datos para poder guardarlos,
recuperarlos, editarlos, etc.
Hay muchísimos “arreglos” de datos, conocidos como formatos
gráficos, o formatos de imagen digital.
digital Los más comunes son
TIFF, JPG, GIF y PNG. Cada uno de ellos tiene su forma
particular de disponer los datos binarios para guardar la imagen TIF JPG
digital.

Lic. Fernando Boro Fundamentos para la digitalización... 11


Fundamentos para proyectos de digitalización
Tecnología

Las imágenes digitales generadas por un escaner, conocidas como imágenes de


mapa de bits (o imágenes raster),
raster están formadas por miles o millones de
minúsculos cuadraditos llamados píxeles.
píxeles

Pixel = del inglés “picture element”, elemento de imagen. Unidad de medida


de las imágenes digitales de mapa de bits.
De allí que 1 Megapixel = 1 millón de píxeles (cámaras digitales)

Hay dos variables importantes a tener en cuenta para poder definir imágenes
de mapa de bits, ambas asociadas a las decisiones a tomar en un proyecto de
digitalización:
Profundidad de bits:
bits cuántas tonalidades o colores del original se registran
Es el resultado de la elección del modo de escaneo (color, grises, etc.)

Resolución espacial:
espacial las medidas en píxeles de la imagen, alto por ancho.
Es el resultado de la elección de ppi o dpi que hacemos al momento de
escanear.
PPI
Píxeles por pulgada lineal. Tasa de muestreo del escaner. También expresado
como dpi. Define la resolución de captura con que se escanea una imagen

Lic. Fernando Boro Fundamentos para la digitalización... 12


Fundamentos para proyectos de digitalización
Tecnología
Profundidad de bits Uso sugerido (evaluar original)

Bitonales = imágenes de 1 bit. Blanco y Impresos simples, sin


negro puro, como un fax o una fotocopia. ilustraciones, sin trazos
Son las más “livianas” para guardar. manuscritos ni color intencional
(autor)

Tonos de grises = imágenes de 8 bits (256 Manuscritos históricos, impresos


tonos de grises). Comparables a una con ilustraciones complejas,
fotografía en blanco y negro pancromático. mapas (todo sin color).
8 veces más “pesadas” que las bitonales, a Cuando bitonal no alcanza, pero
igual resolución espacial. color es innecesario

Color = imágenes de 24 bits. Comparables Todo original con presencia


a fotos en color. “Pesan” el triple que las significativa de color (autor), o
anteriores, a la misma resolución espacial. color se juzga imprescindible para
Requiere calibrar espacio de color en el comprender la información. Fotos
sistema en B/N

}
1 bit = 21 = 0 y 1, ON/OFF, Blanco y Negro, etc.
Sistema binario,
8 bits = 28 = 256 tonos (grises, color) basado en
24 bits = 224 = 16,7 millones de colores
potencias de 2

Lic. Fernando Boro Fundamentos para la digitalización... 13


Fundamentos para proyectos de digitalización
Tecnología

Resolución espacial
Tamaño de la imagen expresado en píxeles, ancho por alto. Esto se decide al
momento de escanear (ppi), previa evaluación de lo que necesita el original
según los objetivos del proyecto.

Si se quiere una imagen con calidad de master de preservación, se usará la


resolución suficiente (ppi) como para registrar fielmente los más mínimos trazos
(o letras, u otra entidad) significativos presentes en el original. Esto puede
conducir al empleo de resoluciones altas, con archivos muy grandes en bytes.

Ejemplo:

Resolución espacial: 246 x 177 píxeles


Profundidad de bits: 8 bits (escala de 256 tonos de grises)
PPI: 300 píxeles por pulgada en la imagen original
Iglesia Catedral de Santiago del Estero, 1678 – 43 x 31 cm.
Fuente: Proyecto Patrimonio Histórico – IR – FFyL - UBA
http://www.ravignani.filo.uba.ar/ravigna/libros/biblio/lanzas/lan-
000.html?h=23

Lic. Fernando Boro Fundamentos para la digitalización... 14


Fundamentos para proyectos de digitalización
Tecnología
Profundidad de bits - Ejemplos

24 bits – 16 M color 8 bits – 256 grises 1 bit – B y N


1296 x 2184 píxeles 1296 x 2184 píxeles 1296 x 2184 píxeles

Observar que la resolución espacial (tamaño en píxeles) siempre es la misma. Lo que cambia es la
“densidad” de tonos o colores registrados = profundidad de bits

Lic. Fernando Boro Fundamentos para la digitalización... 15


Fundamentos para proyectos de digitalización
Tecnología
Resolución espacial - Ejemplos
Observar que la profundidad de
bits siempre es la misma (24 bits).
Lo que cambia es el tamaño de la
imagen en píxeles = resolución
espacial

24 bits – 16,7 M color 24 bits – 16,7 M color 24 bits – 16,7 M color


1296 x 2184 píxeles 1110 x 1891 píxeles 648 x 1092 píxeles

Más DPI Menos DPI


Lic. Fernando Boro Fundamentos para la digitalización... 16
Fundamentos para proyectos de digitalización
Tecnología
Más ejemplos

Billete argentino de 5 pesos con sello


“Caja de Conversión - FALSO” original
en color, con anotaciones manuscritas,
año 1901.

¿Qué es más apropiado: color, escala de


grises o blanco y negro estricto?

Lic. Fernando Boro Fundamentos para la digitalización... 17


Fundamentos para proyectos de digitalización
Tecnología
Más ejemplos

1 bit – bitonal B/N 8 bits – 256 grises 24 bits – 16 M color

Lic. Fernando Boro Fundamentos para la digitalización... 18


Fundamentos para proyectos de digitalización
Tecnología

Más ejemplos
Decisiones...
¿Digitalizamos en
tonos de grises (8 bits) o en
bitonal (1 bit)?

¿Qué requiere el original,


según los objetivos del
proyecto?

¿Sólo el contenido textual o


también el aspecto físico
actual?

Un acabado conocimiento de
las colecciones originales
ayuda a decidir cuánta
“densidad” de tonos es
adecuada para representar
cada ítem.

Lic. Fernando Boro Fundamentos para la digitalización... 19


Fundamentos para proyectos de digitalización
Tecnología

Formatos gráficos
A las imágenes que produce el dispositivo de captura hay que guardarlas en cierto tipo de
archivos electrónicos, conocidos como formatos gráficos.
gráficos Hay muchísimos, pero sólo
veremos los más utilizados en proyectos de digitalización y preservación digital. Además,
existen técnicas de compresión,
compresión que permiten reducir el tamaño de archivo (bytes)
bytes de las
imágenes digitales. Veremos cuáles son, y cuándo se sugiere su utilización.

TIFF (Tagged Image File Format) nombre-archivo.tif

*JPEG (Joint Photographic Expert Group) nombre-archivo.jpg

*GIF (Graphic Interchange Format) nombre-archivo.gif

*PNG (Portable Network Graphic) nombre-archivo.png

* Soporte nativo en los browsers de Internet (IE, FireFox, Netscape, Opera, etc.): se pueden
ver directamente en Internet, sin plugins ni herramientas especiales

Lic. Fernando Boro Fundamentos para la digitalización... 20


Fundamentos para proyectos de digitalización
Tecnología

Formatos gráficos (cont.)

TIF puede manejar imágenes de 1, 8 y 24 bits (todas las que ya vimos), con y sin
compresión. Es el estándar internacional de facto para las imágenes master de
alta calidad.

JPG fue optimizado para manejar imágenes fotográficas color de 24 bits, aunque
también se defiende con las de 256 tonos de grises. Es pésimo para las bitonales
(mejor usar GIF). Usado ampliamente para las imágenes de consulta por Internet
o en redes internas. No para los masters.

GIF sólo maneja 256 colores o grises. No para los masters. Protegido por patente,
por eso se creó PNG, formato de uso libre (incluso más eficaz en manejo de
colores), que no logró todavía una amplia aceptación en las páginas de Internet.
GIF es una opción a considerar cuando se deben presentar imágenes bitonales por
Internet.

Lic. Fernando Boro Fundamentos para la digitalización... 21


Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos
Compresión
Una sola hoja de texto A4, digitalizada a 300 dpi, puede pesar 8 ó 24 Megabytes
(grises o color). Compresión es un proceso de software que usa cálculos
matemáticos (algoritmos) para “comprimir” o “compactar” la cadena de bits con
los datos visuales de la imagen digital.

¿Para qué se usa?


Para reducir el “peso” de los archivos de imágenes, bajando el costo de los
sistemas de almacenamiento, el tiempo de transmisión por redes, etc.

¿Cómo funciona?
Supongamos que el código de bits de un archivo de imagen empezara así:
A A A A C C C D D D D D (12 caracteres)

el algoritmo podría comprimir los caracteres con la siguiente fórmula:


4A 3C 5D (6 caracteres)

Lo que antes pesaba 12, ahora pesa 6, con una reducción del 50 % en la cadena
de caracteres del archivo digital. Esto es una metáfora didáctica, pero brinda una
idea del proceso.

Lic. Fernando Boro Fundamentos para la digitalización... 22


Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos
Compresión
Existen dos grandes grupos de algoritmos de compresión

No destructivos, o “sin pérdida” (lossless)


El proceso de compresión conserva todos los pixeles (bits) originales procedentes
del escaner o de la cámara digital

Ejemplos clásicos: TIF Grupo IV, para imágenes bitonales


TIF LZW, imágenes grises 8 bits o color de 24 bits

Destructivos, o “con pérdida” (lossy)


El proceso de compresión pierde cierto porcentaje variable de los pixeles
originales

Ejemplo típico: JPG (siempre pierde una parte de los datos originales de la
imagen. Cuanto más compresión se aplica, más pérdida se produce).
La pérdida puede ser de dos tipos: no visible,
visible o visible a simple vista
(degradación, mala calidad de imagen)

Lic. Fernando Boro Fundamentos para la digitalización... 23


Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos – Compresión sin pérdida
TIFF Grupo IV (se aplica, no tiene opciones)
Texto impreso escaneado a 400 dpi, 256 grises (8bits): 1.450 KB
Convertido a bitonal (1bit): 200 KB
Comprimido con Grupo IV: 15 KB

Lic. Fernando Boro Fundamentos para la digitalización... 24


Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos – Compresión sin pérdida
LZW (se aplica, no tiene opciones)

TIFF 24 bits, sin


compresión
1.200 KB

Observar:
No altera el
original, pero es
poco eficiente:

Reduce sólo un
21%

TIFF 24 bits, LZW


980 KB

Lic. Fernando Boro Fundamentos para la digitalización... 25


Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos – Compresión con pérdida
JPG con pérdida no visible
TIFF 24 bits, sin
compresión
1.200 KB

Observar:
Destruye bits del
original, pero es
muy eficiente:

Reduce un 95%

JPG 24 bits, 22:1


(75)
53 KB
Pérdida no visible
Lic. Fernando Boro Fundamentos para la digitalización... 26
Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos – Compresión con pérdida
JPG con pérdida visible
JPG 24 bits, 63:1
(25)
19 KB
Pérdida visible

Observar:
Altas tasas de
compresión,
degradan imagen:

Reducen + 99%

JPG 24 bits, 124:1


(10)
9,5 KB
Pérdida MUY visible

Lic. Fernando Boro Fundamentos para la digitalización... 27


Fundamentos para proyectos de digitalización
Tecnología
Formatos gráficos – Compresión con pérdida
JPG (tasa de compresión: a elección del usuario)
Ejemplos JPG en ilustraciones impresas
1) Sin pérdida visible
2) Con pérdida visible (artefactos de compresión)
3) Con pérdida MUY notable, degradación inaceptable

1) Tasa 3:1 (154 KB) 2) Tasa 45:1 (3,47 KB) 3) Tasa 100:1 (1,54 KB)

Lic. Fernando Boro Fundamentos para la digitalización... 28


Fundamentos para proyectos de digitalización
Tecnología
Imágenes master y copias de acceso
Estrategia habitual: imágenes master (reproducción fiel del original, dpi suficientes,
valor de archivo) y copias derivadas,
derivadas adaptadas para la consulta por pantalla

Masters
Para mantener intacta la riqueza de información visual registrada por el dispositivo de
captura, se generan archivos relativamente grandes en bytes, que suelen guardarse
en TIF sin uso de compresión

Copias derivadas (acceso)


Se suele usar JPG o GIF, obtenidos a partir del master TIF por medio de la conversión
de formato (software para edición de imágenes). El original se escanea una sola vez.

JPG para imágenes de consulta en 256 tonos de gris o color 24 bits.


GIF para copias de consulta derivadas de masters TIF Grupo IV (bitonales), ya que
JPG no puede manejar las imágenes bitonales.

Acceso:
Acceso Tamaño de píxeles según resolución monitor promedio
¿800 x 600?, ¿1024 x 768? ---> EVALUAR

Derivación estática o dinámica (servidor, en el momento de la demanda)

Lic. Fernando Boro Fundamentos para la digitalización... 29


Fundamentos para proyectos de digitalización
Tecnología
Imágenes master y copias de acceso
Ejemplo
Montoneros del Chacho Peñaloza, prisioneros.
Caucete, Prov. de San Juan, 1863. Fotografía
tomada por orden de D. F. Sarmiento,
gobernador de San Juan y Director de
Operaciones de Guerra. AGN, Archivo Gráfico.

Imagen master en pantalla


TIFF 24 bits, 1:1, sin comprimir
Resolución espacial: 4633 x 2856 píxeles

Copia de acceso en pantalla


JPG 24 bits, 1:1, compresión moderada
Resolución espacial: 800 x 493 píxeles

Lic. Fernando Boro Fundamentos para la digitalización... 30


Fundamentos para proyectos de digitalización
Tecnología

Esquemas de nombramiento de archivos de imagen

Digitalización:
Digitalización rápidamente cientos o miles de imágenes (masters + copias
de resguardo, + derivadas + otras versiones + las del servidor Web --->
discos llenos, CDs, DVDs, etc.)

Necesidad de identificarlas: gestión, control, preservación, acceso, etc.

Establecer convenciones de identificación de los archivos digitales, y llevar


un registro

Estrategias básicas:
Incluir metadatos en el nombre
Sólo secuencias numéricas: secuencia paginación libro
O ambas, adecuando según estructura del original

Lic. Fernando Boro Fundamentos para la digitalización... 31


Fundamentos para proyectos de digitalización
Tecnología
Esquemas de nombramiento de archivos de imagen
P0000101.TIF (master)
Ejemplo: Proyecto Patrimonio Histórico
P0000101.JPG (acceso web)
http://www.ravignani.filo.uba.ar/ravigna/Pavon/P0000101.HTM
P0000101.HTM (página web)
Batalla de Pavón (1861)
Documento 1, Imagen 1,
Alfanumérico, esquema 8.3

Lic. Fernando Boro Fundamentos para la digitalización... 32


Fundamentos para proyectos de digitalización
Tecnología
Esquemas de nombramiento de archivos de imagen
Primera página del “libro”
Ejemplo: Proyecto Patrimonio Histórico
Imágenes páginas de los libros: Masters
TIFs, numerados en forma secuencial,
subdirectorio nombrado con referencia
unívoca al libro en cuestión.
Ej.: 00000001.tif y así sucesivamente.

Como la paginación física difiere de la


paginación lógica (números romanos y
arábigos, páginas en blanco), en la
“cocina” usamos rutinas de software para
detectar las incongruencias y corregirlas.
Proceso semiautomático, requiere
operador atendiendo.

Terminada la depuración de la estructura


de paginación, se arman páginas HTML
con funciones para “Ir a página n”, “página
siguiente”, etc.

http://www.ravignani.filo.uba.ar/ravigna/libros/biblio/t_cambios/tc000000.html?t=1&h=1
(pg. 1 “libro”)
Lic. Fernando Boro Fundamentos para la digitalización... 33
Fundamentos para proyectos de digitalización
Tecnología
Esquemas de nombramiento de archivos de imagen
Ejemplo: Revista Claridad – Hemeroteca – Biblioteca Nacional Argentina
arbabn-heme-xxxxxxxx-claridad-m-v001-n001-p0001.tif

Así, el volumen 12, número 651, página 17 (página simple) será:


arbabn-heme-xxxxxxxx-claridad-m-v012-n651-p0017.tif

Lic. Fernando Boro Fundamentos para la digitalización... 34


Fundamentos para proyectos de digitalización
Tecnología
Descripción del esquema de nombres, Revista Claridad

Significado Valor
Entidad

arbabn identifica Argentina, Buenos Aires, Biblioteca Nacional Fijo

heme identifica el sector donde se conserva la colección original, en Fijo


este caso Hemeroteca

xxxxxxx refiere a un número único que la Biblioteca atribuye a esta Fijo


colección en particular, el que será indicado oportunamente

claridad identifica el título de la publicación Fijo

m identificador de imagen master de preservación Fijo

identifica el volumen físico (v), debiendo usarse tres dígitos Variable


v001 numéricos para el valor correspondiente (001 hasta
014)

n001 identifica al número de la revista (n), debiendo usarse tres Variable


dígitos numéricos para el valor correspondiente

p0001* identifica la página digitalizada (p), debiendo usarse cuatro Variable


dígitos numéricos para el valor correspondiente

.tif identifica el formato de archivo digital (en este caso, TIFF) Fijo

Lic. Fernando Boro Fundamentos para la digitalización... 35


Fundamentos para proyectos de digitalización
Tecnología
Metadatos básicos de preservación
Para cada lote de imágenes que corresponda a una unidad intelectual
(publicación, informe, libro, etc.), se puede crear un archivo de texto plano (.txt) o
en planilla de cálculo, que indique:
1) Nombre o título del ítem
2) Referencia de catálogo o inventario de la obra
3) Cantidad de imágenes de que se compone la versión digitalizada
4) Esquema de nombramiento utilizado
5) Formato gráfico de las imágenes master
6) Resolución utilizada (dpi)
7) Profundidad de bits
8) Marca del escaner
9) Modelo del escaner
10) Nombre y versión del software usado con el escaner
11) Fecha de producción: aaaa-mm-dd
12) Observaciones: se usará para casos especiales, tales como ítems originales
en muy mal estado, páginas faltantes, etc.

Esto no es obligatorio, pero ayudará a la gestión de largo plazo de las colecciones

Lic. Fernando Boro Fundamentos para la digitalización... 36


Fundamentos para proyectos de digitalización
Tecnología

Hardware y software
Más allá de los debates entre los defensores del software libre, los que prefieren a Linux
antes que a MS Windows, y las diversas opciones de hardware (PC, Mac, medios de
almacenamiento, etc.), lo importante para la preservación digital no es si usamos Windows o
Linux, MS Office ú OpenOffice, sino el modo en que los usamos:
usamos


Mantener sistemas con arquitecturas abiertas, que faciliten futuras migraciones. Evitar
usos “propietarios” que pueden llevarnos a una vía muerta cuando desaparece el
fabricante del hardware o el software.


Mantenerse con productos de hardware y software (libre o comercial) utilizados
ampliamente en todo el mundo, ya que tienen mayores probabilidades de seguir
existiendo, actualizándose y brindando soporte.


Evaluar con prudencia las “novedades espectaculares” en software y hardware antes de
adoptarlas: pueden morir muy rápido.

La tecnología y sus productos no son sólo un asunto “tecnológico”:


Las causas que determinarán su aceptación y difusión en el mercado están enraizadas en
procesos sociales y económicos difíciles de predecir con alguna certeza.
Ej.: OS2 de IBM = excelente SO, fracaso de mercado, desapareció

Lic. Fernando Boro Fundamentos para la digitalización... 37


Bibliografía y otros recursos

Ver la lista de recursos publicada en el grupo de Yahoo:


Yahoo
http://espanol.groups.yahoo.com/group/PRESERVACION-DIGITAL-BIBLIOTECA-LELOIR-FCEYN-UBA/

Calculadora de digitalización
Planilla de Excel que permite calcular los tamaños en pixeles y pesos en bytes de
las imágenes digitales a producirse, conociendo sus medidas físicas.

calculadora

Lic. Fernando Boro Fundamentos para la digitalización... 38

You might also like