You are on page 1of 13

TIPOS DE

ARCHIVOS DE
INFORMACIN

logos Conocimiento, S.L. Madrid 2009. Todos los derechos de Propiedad Intelectual e Industrial de esta obra pertenecen a logos Conocimiento, S.L.
NDICE
TIPOS DE ARCHIVOS DE INFORMACIN

1. FICHEROS Y BASES DE DATOS Y OPERACIONES TPICAS DE ENTRADA/SALIDA . . . . . . . . . . . . . . . .3


2. CONCEPTO DE ORGANIZACIN DE FICHEROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
3. CONCEPTO DE METODO DE ACCESO A LA INFORMACION DE LOS FICHEROS . . . . . . . . . . . . . . . . .7
4. OPERACIONES TIPICAS QUE SE HACEN CON LOS FICHEROS . . . . . . . . . . . . . . . . . . . . . . . . . . .10
5. LAS BASES DE DATOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12
TIPOS DE ARCHIVOS DE
INFORMACIN
1. Ficheros y Bases de Datos y operaciones tpicas de Entrada/salida.

Todas las aplicaciones necesitan almacenar y recuperar informacin. En una computadora, cuando se ejecuta
una aplicacin (un proceso) la informacin se almacena en la memoria principal electrnica del computador;
este es un tipo de memoria voltil, de forma que cuando la aplicacin termina la informacin se pierde. Esto
es inaceptable para muchas aplicaciones, que pueden requerir que la informacin permanezca disponible
durante largos periodos de tiempo.
Con respecto a la memoria principal de las computadoras, se trata de un tipo de memoria electrnicas cuyas
principales caractersticas son:

- La memoria principal tiene poca capacidad de almacenamiento. No se pueden manipular grandes


cantidades de datos, ya que puede haber casos en los que no quepan en la memoria principal.

- La memoria principal es voltil.

- Acceso rpido a la informacin.

Otro problema es que varios procesos pueden necesitar acceder a una misma informacin de forma
concurrente.

Como los espacios de memoria de los procesos son privados, un proceso no puede acceder a los datos en el
espacio de memoria de otro. La solucin es hacer que la informacin sea independiente de los procesos.

Por tanto, hay tres requisitos esenciales para almacenar informacin durante un tiempo indefinido:

- Debe ser posible almacenar una gran cantidad de informacin.

- La informacin debe mantenerse (persistir) tras la terminacin de los procesos que la usan.

- Varios procesos deben de ser capaces de acceder a la informacin de forma concurrente.

La solucin a estos problemas consiste en almacenar la informacin en discos magnticos u otros dispositivos
en unas unidades llamadas ficheros o archivos.

Podemos definir un fichero como la abstraccin de un mecanismo que permite almacenar informacin
en un dispositivo y leerla posteriormente. De igual forma podemos definir un fichero como una
coleccin de informacin que tiene un nombre.

3
TIPOS DE ARCHIVOS DE
INFORMACIN
Los fichero pueden ser ledos y escritos por cualquier proceso. Son una forma de almacenamiento
denominada memoria secundaria. Sus principales cualidades son:

- Capacidad de almacenamiento slo limitada por el soporte fsico de que se disponga.

- La informacin est almacenada permanentemente.

- Acceso lento a la informacin, ya que tiene que ser transportada desde el dispositivo externo hasta
la memoria principal para su tratamiento. Existe un rea de memoria principal destinada a recibir
esta informacin procedente del dispositivo secundario. Esta rea se denomina Buffer.

De la definicin vista de fichero, se deduce que existen diferentes tipos de ficheros en funcin de:

- El tipo de informacin que contienen.

- El mtodo de organizacin de la informacin.

En funcin del tipo de informacin que contienen los ficheros y segn el mtodo usado para guardarla
codificarla dentro de estos podemos diferenciar entre :

- Ficheros de texto: Se guarda la informacin en caracteres, tal y como se mostrara en pantalla.

- Ficheros binarios: Se guarda la informacin en binario, tal y como est en memoria

4
TIPOS DE ARCHIVOS DE
INFORMACIN
2. CONCEPTO DE ORGANIZACIN DE FICHEROS

La organizacin hace referencia a la forma en que los registros lgicos estn almacenados, o se van a
almacenar, dentro del dispositivo de memoria auxiliar para ese fichero.

La eleccin de la organizacin de un fichero determina un mayor o menor uso de recursos del sistema, o una
mayor o menor velocidad de procesamiento as como el tipo de acceso a la hora de procesar los registros.

La organizacin es decidida por el analista en funcin del tamao del fichero y de la volatilidad y actividad
de los registros lgicos.

Para soportar las distintas organizaciones, los sistemas operativos contienen un conjunto de rutinas
especializadas llamadas mtodos de acceso (secuencial, aleatorio o los dos).

ORGANIZACIONES STANDARD DE FICHEROS (ANSI)

Son tres las organizaciones que suelen estar implementadas en todos los compiladores. (ANSI = AMERICAN
NATIONAL STANDARD INSTITUTE).

- Organizacin Secuencial
- Organizacin Indexada
- Organizacin Relativa

ORGANIZACION SECUENCIAL (SEQUENTIAL)

Los registros lgicos son almacenados unos detrs de otros, por orden de llegada.

Slo se pueden procesar en forma secuencial.

Se pueden colocar en cualquier tipo de almacenamiento auxiliar.

El archivo slo contiene registros lgicos (ninguna informacin secundaria).

ORGANIZACION INDEXADA (INDEXED)

Los registros son almacenados en orden ascendente de acuerdo con el contenido de un CAMPO CLAVE
predefinido, que identifica a cada registro lgico.

5
TIPOS DE ARCHIVOS DE
INFORMACIN
Se pueden procesar tanto secuencialmente como aleatoriamente y slo son posible en dispositivos de acceso
directo.

Tambin se conoce a esta organizacin como SECUENCIAL-INDEXADA.

Los ficheros indexados estn compuestos de un rea de datos y un rea de ndices en la cual se guarda la
clave de registro y la direccin de su posicin en el rea de datos. Esto permite el acceso directo a l.

ORGANIZACION DIRECTA O ALEATORIA O RELATIVA (RELATIVE)

Se basa en la divisin del espacio fsico de que disponga el fichero, en celdas destinadas a contener un slo
registro. Estas celdas estn numeradas por el nmero de posicin relativa en el fichero, y podrn o no
contener registro.

El usar archivos con organizacin relativa requiere que el programador desarrolle un algoritmo de
direccionamiento que asocie la clave de los registros lgicos con el nmero de posicin del registro en el
fichero.

Es posible el proceso secuencial (en el orden del nmero de registro); tambin es posible el acceso directo
a un registro, ya que, el sistema operativo es capaz de calcular la direccin en el disco a partir del nmero
de registro.

Es imprescindible dispositivo de almacenamiento de acceso directo. Esta organizacin tambin recibe el


nombre de aleatoria.

6
TIPOS DE ARCHIVOS DE
INFORMACIN
3. CONCEPTO DE METODO DE ACCESO A LA INFORMACION DE
LOS FICHEROS.
Los mtodos de acceso a ficheros son el conjunto de tcnicas que tienen por objeto facilitar la bsqueda
de informacin dentro de la organizacin fsica de los ficheros.

Esta funcin la realizan el Subsistema de Gestin de Ficheros integrado en el Sistema Operativo, que acta
como intermediario entre la organizacin fsica y la organizacin lgica (lo cual, es transparente al
usuario).

Los principales mtodos son: ACCESO SECUENCIAL, ACCESO DIRECTO y ACCESO DINAMICO. El acceso Dinmico,
se usa, para procesar un mismo fichero empleando los dos mtodos de acceso anteriores a la vez.

ACCESO SECUENCIAL (SEQUENTIAL)

Permite procesar registros secuencialmente, es decir, se leen o actualizan en el mismo orden en el que se
encuentren. Para acceder a un determinado registro es imprescindible, recorrer todos los anteriores hasta
llegar a l.

Es el tipo de acceso que se asume por defecto.

ACCESO DIRECTO (RANDOM)

Permite acceder directa y aleatoriamente a cualquier registro del fichero.

Es posible el acceso directo con ficheros Indexados (ISAM, y VSAM-KSDS) y tambin en ficheros Relativos (y
VSAM-RRDS).

SECUENCIAL Y DIRECTO A LA VEZ (DYNAMIC)

Este tipo de acceso en realidad es una mezcla de los dos anteriores.

Nos permite acceder directamente a un determinado registro lgico y despus secuencialmente, todos los
que estn grabados a continuacin de l, hasta el final del fichero.

7
TIPOS DE ARCHIVOS DE
INFORMACIN
CONCEPTOS BSICOS SOBRE FICHEROS

La informacin almacenada en ficheros debe ser persistente, es decir, no debe verse afectada por la creacin
y finalizacin de los procesos. La gestin de ficheros es tarea del sistema operativo, y la parte del mismo que
realiza dicha gestin se conoce como sistema de ficheros.

Desde el punto de vista de los usuarios, el aspecto ms importante de un sistema de ficheros es cmo ste
se presenta a ellos. Es decir, qu es un fichero, cmo se nombra, qu operaciones se permiten, etc. En
definitiva, al usuario le interesa saber qu es lo que puede hacer. Desde el punto de vista de los diseadores
de sistemas, lo interesante es saber cmo est implantado el sistema de ficheros.

Veamos ahora una serie de conceptos bsicos:

- Registro lgico: Un registro es una coleccin de informacin relativa a una entidad particular. Por
tanto, el registro va a contener a todos aquellos campos lgicamente relacionados, referentes a una
determinada entidad, y que pueden ser tratados globalmente por un programa. Por ejemplo la
informacin de un determinado alumno, que contiene los campos DNI, nombre, apellidos, fecha de
nacimiento, etc.

- Clave de un registro lgico: Una clave es un campo o conjunto de campos de datos que identifica
al registro lgico y lo diferencia del resto de registros lgicos del fichero. Por tanto, esta clave debe
ser distinta para cada registro.

- Registro activo: El registro lgico que va a procesarse en la siguiente operacin del fichero.

- Apuntador: Marca interna que siempre apunta al registro lgico activo. Se incrementa
automticamente cada vez que se procesa un registro (se lee o se escribe).

- Marca de fin de fichero: Una marca situada al final de cada fichero, para no acceder mas all del
ltimo registro lgico existente, ya que el tamao del fichero no est limitado y no se conoce a
priori. Existe una funcin lgica, eof (end of file), que toma el valor verdadero cuando llegamos al
final del fichero y falso en caso contrario.

8
TIPOS DE ARCHIVOS DE
INFORMACIN
- Registro fsico o bloque: Un registro fsico o bloque es la cantidad ms pequea de datos que pueden
transferirse en una operacin de entrada/salida entre la memoria principal del ordenador y los
dispositivos perifricos o viceversa. El tamao del bloque o registro fsico depender de las
caractersticas del ordenador. En la mayora de los casos el tamao del bloque suele ser mayor que
el del registro lgico. La adaptacin consiste en empaquetar en cada bloque tantos registros lgicos
como se pueda. El empaquetamiento puede ser de tipo fuerte o dbil, segn que se permita o no
aprovechar el sobrante de un bloque, situando registros a caballo entre dos bloques contiguos.

- Factor de bloqueo: Factor de bloqueo es el n de registros lgicos que puede contener un registro
fsico.

9
TIPOS DE ARCHIVOS DE
INFORMACIN
4. OPERACIONES TIPICAS QUE SE HACEN CON LOS FICHEROS

Una vez visto lo que es un fichero y los principales conceptos al hablar de ellos, pasemos ahora a estudiarlos
desde un punto de vista operativo. Bsicamente se trata de responder: qu operaciones se pueden realizar
sobre un fichero?. La respuesta es:

- Creacin: Para poder realizar cualquier operacin sobre un fichero es necesario que haya sido creado
previamente, almacenando sobre el soporte seleccionado la informacin requerida para su posterior
tratamiento, como por ejemplo el nombre del dispositivo, el nombre del fichero, etc. Con
anterioridad a la creacin de un archivo se requiere disear la estructura del mismo mediante los
campos del registro, longitud y tipo de los mismos.

- Apertura: Para poder trabajar con la informacin almacenada en un fichero, ste debe estar abierto,
permitiendo as el acceso a los datos, dando la posibilidad de realizar sobre ellos las operaciones de
lectura y escritura necesarias.

- Cierre: Una vez finalizadas las operaciones efectuadas sobre el fichero, ste debe permanecer
cerrado para limitar el acceso a los datos y evitar as un posible deterioro o prdida de informacin.
Para cerrar un fichero previamente debe estar abierto.

- Actualizacin: Esta operacin permite la puesta al da de los datos del fichero mediante la escritura
de nuevos registros (alta) y la eliminacin (baja) o modificacin de los ya existentes. La actualizacin
puede afectar a parte o la totalidad de los registros del fichero. Cuando se escribe un nuevo registro
en el fichero se debe comprobar que no existe previamente. La baja de un registro puede ser lgica
o fsica. Una baja lgica supone el no borrado del registro en el archivo. Esta baja lgica se manifiesta
en un determinado campo del registro con una bandera, indicador o flag, o bien con la escritura
o rellenado de espacios en blanco en el registro especfico. Una baja fsica implica el borrado y
desaparicin del registro, de modo que se crea un nuevo archivo que no incluye al registro dado de
baja.

- Consulta: Tiene como fin visualizar la informacin contenida en el fichero, bien de un modo
completo, bien de modo parcial.

- Borrado o destruccin: Es la operacin inversa a la creacin de un fichero. Consiste en la supresin


de un fichero del soporte o dispositivo de almacenamiento. El espacio utilizado por el archivo borrado
puede ser utilizado por otros archivos. Para borrar un fichero tiene que estar cerrado.

10
TIPOS DE ARCHIVOS DE
INFORMACIN
- Ordenacin o clasificacin: Consiste en lograr una nueva disposicin sobre el soporte de los registros
de un archivo, con una secuencia de ubicacin determinada por el valor de uno o varios campos.

- Compactacin o empaquetamiento: Esta operacin permite la reorganizacin de los registros de un


fichero eliminando los huecos libres intermedios existentes entre ellos normalmente ocasionados por
la eliminacin de registros.

11
TIPOS DE ARCHIVOS DE
INFORMACIN
5. LAS BASES DE DATOS.

Una base de datos o banco de datos es un conjunto de datos pertenecientes a un mismo contexto y
almacenados sistemticamente para su posterior uso. En este sentido, una biblioteca puede considerarse una
base de datos compuesta en su mayora por documentos y textos impresos en papel e indexados para su
consulta. En la actualidad, y debido al desarrollo tecnolgico de campos como la informtica y la electrnica,
la mayora de las bases de datos estn en formato digital (electrnico), que ofrece un amplio rango de
soluciones al problema de almacenar datos.

Existen unos programas denominados sistemas gestores de bases de datos, abreviado SGBD, que permiten
almacenar y posteriormente acceder a los datos de forma rpida y estructurada. Las propiedades de estos
SGBD, as como su utilizacin y administracin, se estudian dentro del mbito de la informtica.

Tipos de bases de datos.


Las bases de datos pueden clasificarse de varias maneras, de acuerdo al criterio elegido para su clasificacin:

Segn la variabilidad de los datos almacenados:

Bases de datos estticas: stas son bases de datos de slo lectura, utilizadas primordialmente para
almacenar datos histricos que posteriormente se pueden utilizar para estudiar el comportamiento de un
conjunto de datos a travs del tiempo, realizar proyecciones y tomar decisiones.

Bases de datos dinmicas: stas son bases de datos donde la informacin almacenada se modifica con el
tiempo, permitiendo operaciones como actualizacin y adicin de datos, adems de las operaciones
fundamentales de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de
informacin de una tienda de abarrotes, una farmacia, un videoclub, etc.

Segn el contenido:

Bases de datos bibliogrficas: Solo contienen un surrogante (representante) de la fuente primaria, que
permite localizarla. Un registro tpico de una base de datos bibliogrfica contiene informacin sobre el autor,
fecha de publicacin, editorial, ttulo, edicin, de una determinada publicacin, etc. Puede contener un
resumen o extracto de la publicacin original, pero nunca el texto completo, porque sino estaramos en
presencia de una base de datos a texto completo (o de fuentes primariasver ms abajo). Como su nombre
lo indica, el contenido son cifras o nmeros. Por ejemplo, una coleccin de resultados de anlisis de
laboratorio, entre otras.

12
TIPOS DE ARCHIVOS DE
INFORMACIN
Bases de datos de texto completo: Almacenan las fuentes primarias, como por ejemplo, todo el contenido
de todas las ediciones de una coleccin de revistas cientficas.

Modelos de bases de datos:

Adems de la clasificacin por la funcin de las bases de datos, stas tambin se pueden clasificar de acuerdo
a su modelo de administracin de datos.

Un modelo de datos es bsicamente una descripcin de algo conocido como contenedor de datos (algo en
donde se guarda la informacin), as como de los mtodos para almacenar y recuperar informacin de esos
contenedores. Los modelos de datos no son cosas fsicas: son abstracciones que permiten la implementacin
de un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y conceptos matemticos.

Algunos modelos con frecuencia utilizados en las bases de datos:

- Base de datos relacional


- Bases de datos orientadas a objetos
- Gestin de bases de datos distribuida
- Bases de datos jerrquicas
- Base de datos de red
- Bases de datos documentales
- Bases de datos documentales
- Bases de datos multidimensionales

13

You might also like