Professional Documents
Culture Documents
Los archivos secuenciales son un tipo de archivo en los que la informacin puede leerse y escribirse
empezando desde el principio del archivo.
El archivo secuencial es la forma ms comn de estructura de archivo. En este tipo de archivo, un
formato fijo es usado para los registros. Todos los registros tienen el mismo tamao, constan del
mismo nmero de campos de tamao fijo en un orden particular. Como se conocen la longitud y la
posicin de cada campo, solamente los valores de los campos se necesitan almacenarse; el nombre
del campo y longitud de cada campo son atributos de la estructura de archivos.
Un campo particular, generalmente el primero de cada registro se conoce como el campo clave. El
campo clave identifica unvocamente al registro. As, los valores de la clave para registros diferentes
son siempre diferentes.
Los archivos secuenciales son tpicamente utilizados en aplicaciones de proceso de lotes Y son
ptimos para dichas aplicaciones si se procesan todos los registros. La organizacin secuencias de
archivos es la nica que es fcil de usar tanto en disco como en cinta.
Las caractersticas que deben tener los archivos secuenciales son:
1. La escritura de nuevos datos siempre se hace al final del archivo.
2. Para leer una zona concreta del archivo hay que avanzar siempre, si la zona est antes de la zona
actual de lectura, ser necesario "rebobinar" el archivo.
3. Los ficheros slo se pueden abrir para lectura o para escritura, nunca de los dos modos a la vez.
Organizacin Directa o Aleatoria: Un archivo esta organizado en modo directo cuando el orden
fsico no se corresponde con el orden lgico. Los datos se sitan en el archivo y se accede a ellos
directa, aleatoriamente, mediante su posicin, es decir, el lugar relativo que ocupan.
Esta organizacin tiene la ventaja de que se pueden leer y escribir registros en cualquier orden y
posicin. Son muy rpidos de acceso a la informacin que contienen.
La organizacin directa tiene el inconveniente de que se necesita programarla relacin existente entre
el contenido de un registro y la posicin que ocupa. El acceso a los registros en modo directo implica
la posible existencia de huecos libres dentro del soporte y por consecuencia pueden existir huecos
libres entre los registros.
Las condiciones para que un archivo sea de organizacin directa son:
* Almacenado en soporte direccionable.
* Los registros deben contener un campo especifico denominado clave que identifica cada
registro de modo nico; es decir, dos registros distintos no pueden tener un mismo valor de clave.
* Existencia de una correspondencia entre los posibles valores de la clave y
las
direcciones disponibles sobre el soporte.
Un soporte direccionables, normalmente, un disco o paquete de discos. Cada posicin se localiza por
su direccin absoluta, que en el caso del disco suele venir definida por dos parmetros, numero de
pista y numero de sector, o bien por tres parmetros, pista, sector y numero de cilindro; un cilindro i
es el conjunto de pistas de numero i de cada superficie de almacenamiento de la pila.
En la prctica el programador no gestiona directamente direcciones absolutas, sino direcciones
relativas respecto al principio del archivo. La manipulacin de direcciones relativas permite disear
el programa con independencia de la posicin absoluta del archivo en el soporte.
El programador crea una relacin perfectamente definida entre la clave indicativa de cada registro y
su posicin fsica dentro del dispositivo de almacenamiento.
Archivos Indexados
Los archivos secuenciales indexados retienen la limitacin del archivo secuencial: la eficacia en el
procesamiento se limita al basado en un nico campo del archivo. Cuando es necesario buscar un
registro basndose en algn otro atributo distinto del campo clave ambas formas de archivo
secuencial no son adecuadas. En algunas aplicaciones esta flexibilidad es deseable.
Para alcanzar esta flexibilidad, se necesita una estructura que utilice mltiples ndices, uno para cada
tipo
de
campo
que
pueda
ser
objeto
de
la
bsqueda.
Se suelen utilizar dos tipos de ndices. Uno ndice exhaustivo contiene una entrada par cada registro
del archivo principal. Otro ndice parcial contendr entradas a los registros donde este el campo de
inters. Con registros de longitud variable, algunos registros no contendrn todos los campos.
Los archivos indexados son muy utilizados en aplicaciones donde es critica la oportunidad de la
informacin y donde los datos son rara vez procesados de forma exhaustiva.
Consulta: Es la operacin que permite al usuario acceder al archivo de datos para conocer el
contenido de uno, varios o todos los requisitos.
Actualizacin: Es la operacin que permite tener actualizado (puesto al da) el archivo, de tal modo
que sea posible realizar las siguientes operaciones con sus registros:
*Consulta del contenido de un registro.
*Insercin de un registro nuevo en el archivo.
*Supresin de un registro existente.
*Modificacin de un registro.
Clasificacin: Una operacin muy importante en un archivo es la clasificacin u ordenacin (sort,
en ingles). Esta clasificacin se realizara de acuerdo con el valor de un campo especifico, pudiendo
ser ascendente (creciente) o descendente (decreciente): Alfabticamente o numrica.
Reorganizacin de un archivo: Las operaciones sobre archivos modifican la estructura inicial
o la optima de un archivo. Los ndices, enlaces (punteros), zonas de sinnimos, zonas de
desbordamiento, etc., se modifican con el paso del tiempo, lo que hace a la operacin de acceso
al registro cada vez ms lenta.
La reorganizacin suele consistir en la copia de un nuevo archivo a partir del archivo
modificado, a fin de obtener una nueva estructura lo mas optima posible.
Borra: Es la operacin inversa de un archivo (kill, en ingles). Cuando se destruye (anula o
borra) un archivo, este ya no se puede utilizar y por consiguiente no se podr acceder a ninguno de
sus registros.
Fusin de un archivo: Reunin. Esta operacin permite obtener un archivo a partir de otros
varios.
Rotura: Es la operacin de obtener varios archivos a partir de un mismo archivo inicial.
rboles B y rboles B+
Los rboles B y los rboles B+ son casos especiales de rboles de bsqueda. Un rbol de bsqueda
es un tipo de rbol que sirve para guiar la bsqueda de un registro, dado el valor de uno de sus
campos.
1
2
3
4
DRM
R1
R2
R3
R4
R5
R6
R7
R8
K
10
25
5
18
13
20
26
30
K2
25
8
20
30
PH1
2
*
*
*
PH2
3
*
*
*
PH3
4
*
*
*
PK1
R1
R3
R5
R7
PK2
R2
R4
R6
R8
B1
B2
B3
B4
Acceso
aleatorio
INDICE
ARBOL B+
Acceso
secuencial
REGISTROS
ARCHIVO INVERTIDO
Aunque un registro del archivo maestro puede ser recuperado directamente por su nmero de MFN,
a travs del archivo de referencias cruzadas, se necesitan formas de acceso adicionales. Por ejemplo,
en la recuperacin de registros bibliogrficos, es necesario tener acceso a los registros por autor, por
materia o por cualquier otro dato que ocurra en el registro. El sistema CDS/ISIS permite tener
virtualmente un nmero ilimitado de puntos de acceso a cada registro con la creacin de un archivo
especial denominado archivo invertido.
El archivo invertido contiene todos los trminos que pueden usarse como puntos de acceso durante
la recuperacin de registros en una base de datos, y para cada trmino, la lista de referencias a los
registros del archivo maestro de donde se extrajo el trmino. Al conjunto de todos los puntos de
acceso para una base de datos determinada se le denomina diccionario. Se puede considerar el
archivo invertido como un ndice del contenido del archivo maestro.
MONOGRAFIA:
INTEGRANTES:
GOMEZ, GUSTAVO FEDERICO
M U 0847
M U 0822
AO:
2008