You are on page 1of 7

Conceptos Generales de Base de Datos

Universidad Nacional de La Matanza


Profesora: Ichazo, Vernica
Desventajas de los sistemas de procesamiento de archivos
Considrese parte de una empresa de cajas de ahorro, que mantiene informacin acerca de todos
los clientes y cuentas de ahorro. Una manera de mantener la informacin es en archivos del
sistema operativo. Para permitir a los usuarios manipular la informacin, el sistema tiene un
numero de programas de aplicacin que manipula los archivos, incluyendo:
* Un programa para efectuar cargos o abonos en una cuenta.
* Un programa para aadir una cuenta nueva.
* Un programa para calcular el saldo de una cuenta.
* Un programa para generar las operaciones mensuales.
Estos programas de aplicacin han sido escritos por programadores en respuesta a las
necesidades de la organizacin bancaria.
Si las necesidades se incrementan, se aaden nuevos programas de aplicacin al sistema. Por
ejemplo supngase que las regularizaciones de un nuevo gobierno permiten a las cajas de ahorro
ofrecer cuentas corriente. Como resultado se crean nuevos archivos que contengan informacin
acerca de todas las cuentas corrientes mantenidas por el banco, y puede ser necesario escribir
nuevos programas de aplicacin para tratar situaciones que no existen en las cuentas de ahorro,
tales como manejar descubiertos. As, sobre la marcha, se aaden mas archivos y programas de
aplicacin al sistema.
Este sistema de procesamiento de archivos tpico que se acaba de describir se mantiene mediante
un sistema operativo convencional. Los registros permanentes son almacenados en varios archivos
y se escriben diferentes programas de aplicacin para extraer registros y para aadir registros a los
archivos adecuados. Antes de la llegada de los sistemas de gestin de bases de datos (SGBDs),
las organizaciones normalmente han almacenado la informacin usando tales sistemas.
Mantener informacin de la organizacin en un sistema de procesamiento de archivos tiene una
serie de inconvenientes.
Redundancia e inconsistencia de datos. Debido a que los archivos y programa de aplicacin
son creados por diferentes programadores en un largo periodo de tiempo, los diversos archivos
tienen probablemente diferentes formatos y los programas pueden estar escritos en diferentes
lenguajes. Mas an, la misma informacin puede estar duplicada en diferentes lugares
(archivos).Por ejemplo, la direccin y nmero telefnico de un cliente particular puede aparecer en
un archivo que contenga registros de una cuenta de ahorros y en un archivo que contenga
registros de una cuenta corriente. Esta redundancia conduce a un mayor costo de almacenamiento
y acceso. Adems puede conducir a inconsistencia de datos; es decir, las diversas copias de los
mismos datos pueden no coincidir. Por ejemplo, un cambio en la direccin del cliente puede estar
reflejado en los registros de la cuenta de ahorros pero no en el resto del sistema.
Dificultad en el acceso a datos. Supngase que uno de los empleados del banco necesita
averiguar los nombres de todos los clientes que viven en la localidad con cdigo postal 1754 de la
cuidad. El empleado pide al departamento de sistemas que genere dicha lista. Debido a que esta
peticin no fue prevista cuando el sistema original fue diseado, no hay un programa de aplicacin
para satisfacerla. Hay, sin embargo un programa de aplicacin que genera la lista de todos los
clientes. El empleado del banco tiene ahora dos opciones: bien obtener la lista de todos los clientes
y obtener la informacin que necesita manualmente, o bien pedir al departamento de sistemas que
escriba el programa de aplicacin necesario. Ambas alternativas son obviamente insatisfactorias.

1/7

Conceptos Generales de Base de Datos


Universidad Nacional de La Matanza
Profesora: Ichazo, Vernica
La cuestin aqu es que el sistema de archivos convencional no permite que los datos necesarios
sean obtenidos de una forma practica y eficiente. Se deben desarrollar sistemas de recuperacin
de datos ms interesantes para su uso general.
Aislamiento de datos. Debido a que los datos estn dispersos en varios archivos, y los archivos
pueden estar en diferentes formatos, es difcil escribir nuevos programas de aplicacin para
recuperar los datos apropiados.
Problemas de integridad. Los valores almacenados en la base de datos deben satisfacer ciertos
tipos de restricciones de consistencia. Por ejemplo, el saldo de una cuenta bancaria no puede ser
nunca mas bajo de una cantidad predeterminada. Los desarrolladores hacen cumplir esas
restricciones en el sistema aadiendo el cdigo apropiado en los diversos programas de aplicacin.
Sin embargo, cuando se aaden nuevas restricciones, es difcil cambiar los programas para hacer
que se cumplan. El problema es complicado cuando las restricciones implican diferentes elementos
de datos de diferentes archivos.
Problemas de atomicidad. Un sistema esta sujeto a fallas. En muchas ocasiones es critico
asegurar que, una vez que un fallo a ocurrido y se ha detectado, los datos se restauraran al estado
de consistencia que exista antes del fallo. Consideremos un programa para transferir $50 desde la
cuenta A a la B. Si ocurre un fallo del sistema durante la ejecucin del programa, es posible que los
$50 sean descontados de la cuenta A, pero no sumados a la cuenta B, dejando a la base de datos
en un estado inconsistente. Claramente es esencial para la consistencia de la base de datos que
ambas operaciones se lleven a cabo o que ninguna se realice. Es decir, la transferencia de fondos
debe ser atmica: esta debe ocurrir por completo o no ocurrir en absoluto. Es difcil asegurar esta
propiedad en un sistema de procesamiento de archivos convencional.
Anomalas en el acceso concurrente. Conforme se ha ido mejorando el conjunto de ejecucin
de los sistemas y ha sido posible una respuesta en menor tiempo, muchos sistemas han ido
tendiendo a que mltiples usuarios actualicen simultneamente los datos. En tales sistemas un
entorno de interaccin de actualizaciones concurrentes puede dar lugar a datos inconsistentes.
Considrese una cuenta bancaria A que contiene $500. Si dos clientes retiran fondos( por ejemplo
$50 y $100 respectivamente) de la cuenta A en aproximadamente el mismo tiempo, el resultado de
las ejecuciones concurrentes puede dejar la cuenta en un estado incorrecto. Supongamos que los
programas se ejecutan cada vez que se retira y despus que escribe el resultado. Si los dos
programas funcionan concurrentemente. Pueden leer ambos el valor $500 y escribir despus $450
y $400, respectivamente. Dependiendo de quien escriba el ltimo valor la cuenta puede contener
bien $450 euros o bien $400, en lugar del valor correcto, $350. Para protegerse contra esta
posibilidad, el sistema debe mantener alguna especie de supervisin. Sin embargo, ya que se
puede acceder a los datos desde muchos programas de aplicacin diferentes que no han sido
previamente coordinados, la supervisin es difcil de proporcionar.
Problemas de seguridad. No todos los usuarios de un sistema de base de datos deberan poder
acceder a todos los datos. Por ejemplo, en un sistema bancario, el personal de nominas necesita
ver solo esa parte de la base de datos que tiene la informacin acerca de varios empleados del
banco. No necesitan acceder a la informacin acerca de las cuentas del cliente. Como los
programas de aplicacin se aaden al sistema de una forma add doc, es difcil garantizar tales
restricciones de seguridad.
Estas dificultades, entre otras, han motivado al desarrollo de sistemas de base de datos.
Concepto de Base de Datos:

Es un sistema que almacena datos que estn relacionados.

Es un repositorio en donde guardamos informacin integrada que podemos almacenar y


recuperar.

2/7

Conceptos Generales de Base de Datos


Universidad Nacional de La Matanza
Profesora: Ichazo, Vernica

Un conjunto de informacin almacenada en memoria auxiliar que permite acceso directo y un


conjunto de programas que manipulan esos datos

Una base de datos es una coleccin de datos organizados y estructurados segn un


determinado modelo de informacin que refleja no slo los datos en s mismos, sino tambin
las relaciones que existen entre ellos. Una base de datos se disea con un propsito especifico
y debe ser organizada con una lgica coherente. Los datos podrn ser compartidos por
distintos usuarios y aplicaciones, pero deben conservar su integridad y seguridad al margen de
las interacciones de ambos. La definicin y descripcin de los datos han de ser nicas para
minimizar la redundancia y maximizar la independencia en su utilizacin.

Coleccin de datos interrelacionados almacenados en conjunto sin redundancias perjudiciales


o innecesarias; su finalidad es servir a una aplicacin o ms, de la mejor manera posible; los
datos se almacenan de modo que resulten independientes de los programas que los usan; se
emplean mtodos bien determinados para incluir nuevos datos y para modificar o extraer los
datos almacenados, (Martn, 1975).
Coleccin o depsito de datos, donde los datos estn lgicamente relacionados entre s,
tienen una definicin y descripcin comunes y estn estructurados de una forma particular. Una
base de datos es tambin un modelo del mundo real, como tal, debe poder servir para toda
una gama de usos y aplicaciones, (Conference des Statisticiens Europens, 1977)
Conjunto de datos de la empresa memorizado en un ordenador, que es utilizado por
numerosas personas y cuya organizacin est regida por un modelo de datos, (Flory, 1982)
Conjunto estructurado de datos registrados sobre soportes accesibles por ordenador para
satisfacer simultneamente a varios usuarios de forma selectiva y en tiempo oportuno,
(Delobel, 1982)
Coleccin no redundante de datos que son compartidos por diferentes sistemas de
aplicacin, (Howe, 1983)
Coleccin integrada y generalizada de datos, estructurada atendiendo a las relaciones
naturales de modo que suministre todos los caminos de acceso necesarios a cada unidad de
datos con objeto de poder atender todas las necesidades de los diferentes usuarios, (Deen,
1985)
Conjunto de ficheros maestros, organizados y administrados de una manera flexible de modo
que los ficheros puedan ser fcilmente adaptados a nuevas tareas imprevisibles, (Frank,
1988)
Coleccin de datos interrelacionados, (Elsmari y navathe, 1989)
Coleccin o depsito de datos integrados, almacenados en soporte secundario (no voltil) y
con redundancia controlada. Los datos, que han de ser compartidos por diferentes usuarios y
aplicaciones, deben mantenerse independientes de ellos, y su definicin (estructura de la base
de datos) nica y almacenada junto con los datos, se ha de apoyar en un modelo de datos, el
cual ha de permitir captar las interrelaciones y restricciones existentes en el mundo real. Los
procedimientos de actualizacin y recuperacin, comunes y bien determinados, facilitarn la
seguridad del conjunto de los datos, de Miguel y Piattini (1999)

Sistema de Base de Datos


Un Sistema de Gestin de Bases de Datos, tambin llamado DBMS (Data Base Management
System) no es ms que un paquete de software, que se ejecuta en un servidor que es quien
centraliza los accesos a los datos y acta de interfaz entre los datos fsicos y los usuarios. Este
sistema es capaz de llevar a cabo funciones como la creacin y gestin de la base de datos
misma, el control de accesos y la manipulacin de datos de acuerdo a las necesidades de cada
usuario.
As pues, las bases de datos pueden ser creadas, mantenidas y gestionadas por una serie de
aplicaciones denominadas Sistemas de Gestin de Bases de Datos (SGBD)

3/7

Conceptos Generales de Base de Datos


Universidad Nacional de La Matanza
Profesora: Ichazo, Vernica
Componentes de una Base de Datos:
Hardware: constituido por dispositivo de almacenamiento como discos, tambores, cintas,
etc.
Software: que es el DBMS o Sistema Administrador de Base de Datos.
Datos: los cuales estn almacenados de acuerdo a la estructura externa y van a ser
procesados para convertirse en informacin.

Tipos de Usuarios en Base de Datos


Usuario Final: es la persona que utiliza los datos, esta persona ve datos convertidos en
informacin:
Desarrollador de Aplicaciones: es la persona que desarrolla los sistemas que interactan
con la Base de Datos.
DBA: es la persona que asegura integridad, consistencia, redundancia, seguridad este es
el Administrador de Base de Datos quien se encarga de realizar el mantenimiento diario o
peridico de los datos.
Las personas tienen acceso DBMS se clasifican de la siguiente manera:
USUARIOS INGENUOS. Son aquellos que interactan con el sistema por medio de aplicaciones
permanentes.
USUARIOS SOFISTICADOS.- son aquellos con la capacidad de acceder a la informacin por
medios de lenguajes de consulta.
PROGRAMADORES DE APLICACIN.- son aquellos con un amplio dominio del DML capaces de
generar nuevos mdulos o utileras capaces de manejar nuevos datos en el sistema.
USUARIOS ESPECIALIZADOS.- son aquellos que desarrollan mdulos que no se refieren
precisamente al manejo de los datos, sino a aplicaciones avanzadas como sistemas expertos,
reconocimientos de imgenes, procesamiento de audio y dems .
Arquitectura de los sistemas de bases de datos
Hay tres caractersticas importantes inherentes a los sistemas de bases de datos: la separacin
entre los programas de aplicacin y los datos, el manejo de mltiples vistas por parte de los
usuarios y el uso de un catlogo para almacenar el esquema de la base de datos. En 1975, el
comit ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements
Committee) propuso una arquitectura de tres niveles para los sistemas de bases de datos, que
resulta muy til a la hora de conseguir estas tres caractersticas.

4/7

Conceptos Generales de Base de Datos


Universidad Nacional de La Matanza
Profesora: Ichazo, Vernica
El objetivo de la arquitectura de tres niveles es el de separar los programas de aplicacin de la
base de datos fsica. En esta arquitectura, el esquema de una base de datos se define en tres
niveles de abstraccin distintos:
1. En el nivel interno se describe la estructura fsica de la base de datos mediante un
esquema interno. Este esquema se especifica mediante un modelo fsico y describe todos
los detalles para el almacenamiento de la base de datos, as como los mtodos de acceso.
2. En el nivel conceptual se describe la estructura de toda la base de datos para una
comunidad de usuarios (todos los de una empresa u organizacin), mediante un esquema
conceptual. Este esquema oculta los detalles de las estructuras de almacenamiento y se
concentra en describir entidades, atributos, relaciones, operaciones de los usuarios y
restricciones. En este nivel se puede utilizar un modelo conceptual o un modelo lgico para
especificar el esquema.
3. En el nivel externo se describen varios esquemas externos o vistas de usuario. Cada
esquema externo describe la parte de la base de datos que interesa a un grupo de
usuarios determinado y oculta a ese grupo el resto de la base de datos. En este nivel se
puede utilizar un modelo conceptual o un modelo lgico para especificar los esquemas.
La mayora de los SGBD no distinguen del todo los tres niveles. Algunos incluyen detalles del nivel
fsico en el esquema conceptual. En casi todos los SGBD que se manejan vistas de usuario, los
esquemas externos se especifican con el mismo modelo de datos que describe la informacin a
nivel conceptual, aunque en algunos se pueden utilizar diferentes modelos de datos en los niveles
conceptual y externo.
Hay que destacar que los tres esquemas no son ms que descripciones de los mismos datos pero
con distintos niveles de abstraccin. Los nicos datos que existen realmente estn a nivel fsico,
almacenados en un dispositivo como puede ser un disco. En un SGBD basado en la arquitectura
de tres niveles, cada grupo de usuarios hace referencia exclusivamente a su propio esquema
externo. Por lo tanto, el SGBD debe transformar cualquier peticin expresada en trminos de un
esquema externo a una peticin expresada en trminos del esquema conceptual, y luego, a una
peticin en el esquema interno, que se procesar sobre la base de datos almacenada. Si la
peticin es de una obtencin (consulta) de datos, ser preciso modificar el formato de la
informacin extrada de la base de datos almacenada, para que coincida con la vista externa del
usuario. El proceso de transformar peticiones y resultados de un nivel a otro se denomina
correspondencia o transformacin. Estas correspondencias pueden requerir bastante tiempo, por lo
que algunos SGBD no cuentan con vistas externas.
La arquitectura de tres niveles es til para explicar el concepto de independencia de datos que
podemos definir como la capacidad para modificar el esquema en un nivel del sistema sin tener
que modificar el esquema del nivel inmediato superior. Se pueden definir dos tipos de
independencia de datos:
La independencia lgica es la capacidad de modificar el esquema conceptual sin tener que
alterar los esquemas externos ni los programas de aplicacin. Se puede modificar el
esquema conceptual para ampliar la base de datos o para reducirla. Si, por ejemplo, se
reduce la base de datos eliminando una entidad, los esquemas externos que no se refieran
a ella no debern verse afectados.
La independencia fsica es la capacidad de modificar el esquema interno sin tener que
alterar el esquema conceptual (o los externos) Por ejemplo, puede ser necesario
reorganizar ciertos ficheros fsicos con el fin de mejorar el rendimiento de las operaciones
de consulta o de actualizacin de datos. Dado que la independencia fsica se refiere slo a
la separacin entre las aplicaciones y las estructuras fsicas de almacenamiento, es ms
fcil de conseguir que la independencia lgica.
En los SGBD que tienen la arquitectura de varios niveles es necesario ampliar el catlogo o
diccionario, de modo que incluya informacin sobre cmo establecer la correspondencia entre las
peticiones de los usuarios y los datos, entre los diversos niveles. El SGBD utiliza una serie de
procedimientos adicionales para realizar estas correspondencias haciendo referencia a la
informacin de correspondencia que se encuentra en el catlogo. La independencia de datos se

5/7

Conceptos Generales de Base de Datos


Universidad Nacional de La Matanza
Profesora: Ichazo, Vernica
consigue porque al modificarse el esquema en algn nivel, el esquema del nivel inmediato superior
permanece sin cambios, slo se modifica la correspondencia entre los dos niveles. No es preciso
modificar los programas de aplicacin que hacen referencia al esquema del nivel superior.
Por lo tanto, la arquitectura de tres niveles puede facilitar la obtencin de la verdadera
independencia de datos, tanto fsica como lgica. Sin embargo, los dos niveles de correspondencia
implican un gasto extra durante la ejecucin de una consulta o de un programa, lo cual reduce la
eficiencia del SGBD. Por esto muy pocos SGBD han implementado esta arquitectura completa.

Objetivos DBMS

Definir la Base de Datos mediante el Lenguaje de Definicin de Datos, el cual permite


especificar la estructura, tipo de datos y las restricciones sobre los datos, almacenndolo
todo en la base de datos.

Separar la descripcin y manipulacin de los datos, permitiendo un mayor entendimiento


de los objetos, adems de flexibilidad de consulta y actualizacin de los datos.

Permitir la insercin, eliminacin, actualizacin, consulta de los datos mediante un


Lenguaje de Manipulacin de Datos, lo que permite resolver el problema que presentan los
sistemas de archivos, donde hay que trabajar con un conjunto fijo de consultas o la
necesidad de tener muchos programas de aplicaciones. Existen dos tipos de programas de
Manipulacin de Datos, los cuales se diferencian por la forma en que acceden a los datos.
Lenguajes procedurales: manipulan la base de datos registro a registro y se deben
especificar las operaciones a realizar para obtener los datos resultado.
Lenguajes no procedurales: manipulan la base de datos en conjuntos de registros y
se especifican qu datos deben obtenerse como resultado sin plantear las forma de
hacerlo. El lenguaje no procedural ms utilizado es SQL (Structure Query Languaje)
que se ha convertido en un estndar y el lenguaje por defecto de los SGBD
relacionales.

Proporcionar acceso controlado a la base de datos.


Seguridad: los usuarios no autorizados no pueden acceder a la base de datos.
Integridad: mantiene la integridad y consistencia de la base de datos.
Control de Recurrencia: permite el acceso compartido a la base de datos.
Control de Recuperacin: restablece la base de datos despus de producirse un fallo
de software o hardware.
Diccionario de datos o Catlogo: contiene la descripcin de los datos de la base de
datos y es accesible por el usuario.

Gestionar la estructura fsica de los datos y su almacenamiento, proporcionando eficiencia


en las operaciones de la base de datos y el acceso al medio de almacenamiento.

6/7

Conceptos Generales de Base de Datos


Universidad Nacional de La Matanza
Profesora: Ichazo, Vernica

Proporcionar un mecanismo de vistas, que permita a cada usuario tener su propia vista o
visin de la base de datos. El lenguaje de definicin nos permite definir las vistas como
subconjuntos de la base de datos, permitiendo:
Proporcionar un nivel de seguridad excluyendo datos para que no sean vistos por
determinados usuarios.
Permiten que los usuarios vean los datos en el formato deseado.
Una vista representa una imagen consistente y permanente de la base de datos,
an cuando a la base de datos se le hagan cambios en su estructura.

Eliminar la redundancia de datos, establecer una mnima duplicidad en los datos y


minimizar el espacio en disco utilizado.

Proveer interfaces procedimentales y no procedimentales, permitiendo la manipulacin


por usuarios interactivos y programadores.

Independizar la estructura de la organizacin lgica de los datos (Independencia fsica)

Independizar la descripcin lgica de la Base de datos y las descripciones particulares de


los diferentes puntos de vistas de los usuarios.

Permitir una fcil administracin de los datos.

7/7

You might also like