You are on page 1of 10

Normalizacin 1FN, 2FN, 3FN, 4FN

Datos Normalizados en primera forma normal (1FN) y el universo de datos no normalizados


Antes del anlisis y la comparacin de los datos normalizados y los no normalizados, conozcamos que es la Normalizacin de datos: Qu es normalizacin?
Normalizacin es un proceso que clasifica relaciones, objetos, formas de relacin y dems elementos en grupos, en base a las caractersticas que cada uno posee. Si se identifican ciertas reglas, se aplica una categora; si se definen otras reglas, se aplicar otra categora. Estamos interesados en particular en la clasificacin de las relaciones BDR. La forma de efectuar esto es a travs de los tipos de dependencias que podemos determinar dentro de la relacin. Cuando las reglas de clasificacin sean ms y ms restrictivas, diremos que la relacin est en una forma normal ms elevada. La relacin que est en la forma normal ms elevada posible es que mejor se adapta a nuestras necesidades debido a que optimiza las condiciones que son de importancia para nosotros: La cantidad de espacio requerido para almacenar los datos es la menor posible; La facilidad para actualizar la relacin es la mayor posible; La explicacin de la base de datos es la ms sencilla posible Se dice que una relacin est en una determinada forma normal si satisface un cierto conjunto de restricciones. El proceso de normalizacin es reversible y no se pierde informacin. Etapas de la Normalizacin

-La diferencia que existe entre los datos Normalizados en primera forma normal (1FN) y el universo de datos no normalizado: El universo de datos no normalizado se refiere al conjunto de datos que estn reunidos bajo un criterio en comn, estos datos son una gran cantidad de informacin desorganizada y, en algunos casos, compleja para su anlisis u otros usos, ya que tiene un albedrio de informacin, y en ello encontraremos muchas inconsistencias o defectos, como las siguientes: La REDUNDANCIA de datos ERRORES DE ACTUALIZACION de datos. FALTA DE INTEGRIDAD E INCONSISTENCIA en los datos. En relacin a tablas no normalizadas (cuando almacenamos informacin no normalizada): Repeticin de nombres de cada tabla. Presencia de dos filas iguales. Los datos de una misma columna de un mismo tipo. De insercin: imposibilidad de adicionar datos en la BD por la ausencia de otros. De borrado: prdida no intencionada de datos debido a la eliminacin de otros. En cambio, cuando tenemos los datos organizados bajo ciertos criterios, como la Primera Forma Normal (1FN), se debe cumplir con lo siguiente: Una relacin R se encuentra en 1FN si y solo s por cada rengln columna contiene valores atmicos. Las celdas de las tablas poseen valores simples y no se permiten grupos ni arreglos repetidos como valores, es decir, contienen un solo valor por cada celda. Todos los ingresos en cualquier columna (atributo) deben ser del mismo tipo. Cada columna debe tener un nombre nico, el orden de las columnas en la tabla no es importante. Dos filas o renglones de una misma tabla no deben ser idnticas, aunque el orden de las filas no es importante.

EJEMPLOS DE LA 1FN:

Ejemplo 1: En esta Gua de Pedido, la PK es el Nro_GI (nmero de gua) quin determina a los dems atributos de la tabla.

Ejemplo 2: En este caso de la biblioteca, la PK es el CodLibro, quin determina a los dems atributos de la tabla.

Ejemplo 3: En esta Informe de Notas, la PK esta conformada por el ID-Estudiante y el IDClave, quienes determinan a los dems atributos de la tabla.

Ejemplo 4: En esta Boleta de Ventas, la PK es el Num_bol (nmero de boleta) quin determina a los dems atributos de la tabla.

- Explique detalladamente que resuelve la segunda forma normal (2FN) presente 4

ejemplos. Tambin muestre mediante ejemplos las fallas que presenta la 2FN.

Dependencia Funcional. Una relacin est en 2FN si est en 1FN y si los atributos que no forman parte de ninguna clave dependen de forma completa de la clave principal. Es decir que no existen dependencias parciales. (Todos los atributos que no son clave principal deben depender nicamente de la clave principal). En otras palabras podramos decir que la segunda forma normal est basada en el concepto de dependencia completamente funcional. Una dependencia funcional es completamente funcional si al eliminar los atributos A de X significa que la dependencia no es mantenida, esto es que . Una dependencia funcional es una dependencia parcial si hay algunos atributos que pueden ser eliminados de X y la dependencia todava se mantiene, esto es .

Por ejemplo {DNI, ID_PROYECTO} HORAS_TRABAJO (con el DNI de un empleado y el ID de un proyecto sabemos cuntas horas de trabajo por semana trabaja un empleado en dicho proyecto) es completamente dependiente dado que ni DNI HORAS_TRABAJO ni ID_PROYECTO HORAS_TRABAJO mantienen la dependencia. Sin embargo {DNI, ID_PROYECTO} NOMBRE_EMPLEADO es parcialmente dependiente dado que DNI NOMBRE_EMPLEADO mantiene la dependencia. Ejemplos:

Considere una tabla describiendo las habilidades de los empleados:


Habilidades de los empleados

Empleado

Habilidad

Lugar actual de trabajo

Jones

Mecanografa

114 Main Street

Jones

Taquigrafa

114 Main Street

Jones

Tallado

114 Main Street

Bravo

Limpieza ligera 73 Industrial Way

Ellis

Alquimia

73 Industrial Way

Ellis

Malabarismo

73 Industrial Way

Harrison

Limpieza ligera 73 Industrial Way

La nica clave candidata de la tabla es {Empleado, Habilidad}. El atributo restante, Lugar actual de trabajo, es dependiente solo en parte de la clave candidata, llamada Empleado. Por lo tanto la tabla no est en 2NF. Observe la redundancia de la manera en que son representadas los Lugares actuales de trabajo: nos dicen tres veces que Jones trabaja en la 114 Main Street, y dos veces que Ellis trabaja en 73 Industrial Way. Esta redundancia hace a la tabla vulnerable a anomalas de actualizacin: por ejemplo, es posible actualizar el lugar del trabajo de Jones en sus registros "Mecanografa" y "Taquigrafa" y no actualizar su registro "Tallado". Los datos resultantes implicaran respuestas contradictorias a la pregunta "Cul es el lugar actual de trabajo de Jones?". Un alternativa 2NF a este diseo representara la misma informacin en dos tablas:
Empleados

Empleado Lugar actual de trabajo

Jones

114 Main Street

Bravo

73 Industrial Way

Ellis

73 Industrial Way

Harrison

73 Industrial Way

Habilidades de los empleados

Empleado

Habilidad

Jones

Mecanografa

Jones

Taquigrafa

Jones

Tallado

Bravo

Limpieza ligera

Ellis

Alquimia

Ellis

Malabarismo

Harrison

Limpieza ligera

Las anomalas de actualizacin no pueden ocurrir en estas tablas, las cuales estn en 2NF. Sin embargo, no todas las tablas 2NF estn libres de anomalas de actualizacin. Un ejemplo de una tabla 2NF que sufre de anomalas de actualizacin es:
Ganadores del torneo

Torneo

Ao

Ganador

Fecha de nacimiento del ganador

Des Moines Masters 1998 Chip Masterson 14 de marzo de 1977

Indiana Invitational 1998 Al Fredrickson 21 de julio de 1975

Cleveland Open

1999 Bob Albertson 28 de septiembre de 1968

Des Moines Masters 1999 Al Fredrickson 21 de julio de 1975

Indiana Invitational 1999 Chip Masterson 14 de marzo de 1977

Aunque el Ganador y la Fecha de nacimiento del ganador estn determinadas por una clave completa {Torneo, Ao} y no son partes de ella, particularmente las combinaciones Ganador/ Fecha de nacimiento del ganador son mostradas redundantemente en mltiples registros. Este problema es tratado por la tercera forma normal (3NF).
- Explique detalladamente que resuelve la tercera forma normal (3FN) presente 4 ejemplos. Tambin muestre mediante ejemplos las fallas que presenta la 3FN.

La tabla se encuentra en 3FN si es 2FN y si no existe ninguna dependencia funcional transitiva entre los atributos que no son clave. Un ejemplo de este concepto sera que, una dependencia funcional X->Y en un esquema de relacin R es una dependencia transitiva si hay un conjunto de atributos Z que no es un subconjunto de alguna clave de R, donde se mantiene X->Z y Z->Y. Por ejemplo, la dependencia SSN->DMGRSSN es una dependencia transitiva en EMP_DEPT de la siguiente figura. Decimos que la dependencia de DMGRSSN el atributo clave SSN es transitiva va DNUMBER porque las dependencias SSNDNUMBER y DNUMBERDMGRSSN son mantenidas, y DNUMBER no es un subconjunto de la clave de EMP_DEPT. Intuitivamente, podemos ver que la dependencia de DMGRSSN sobre DNUMBER es indeseable en EMP_DEPT dado que DNUMBER no es una clave de EMP_DEPT. Formalmente, un esquema de relacion para toda dependencia funcional condiciones: 1. 2. es superllave o clave. es atributo primo de ; esto es, si es miembro de alguna clave en . est en 3 Forma Normal Elmasri-Navathe, si , se cumple al menos una de las siguientes
2

Adems el esquema debe cumplir necesariamente, con las condiciones de segunda forma normal.

Un ejemplo de una tabla 2NF que falla en satisfacer los requerimientos de la 3NF es:
Ganadores del torneo

Torneo

Ao

Ganador

Fecha de nacimiento del ganador

Indiana Invitational 1998 Al Fredrickson 21 de julio de 1975

Cleveland Open

1999 Bob Albertson 28 de septiembre de 1968

Des Moines Masters 1999 Al Fredrickson 21 de julio de 1975

Indiana Invitational 1999 Chip Masterson 14 de marzo de 1977

La nica clave candidata es {Torneo, Ao}. La violacin de la 3NF ocurre porque el atributo no primario Fecha de nacimiento del ganador es dependiente transitivamente de {Torneo, Ao} va el atributo no primario Ganador. El hecho de que la Fecha de nacimiento del ganador es funcionalmente dependiente en el Ganador hace la tabla vulnerable a

inconsistencias lgicas, pues no hay nada que impida a la misma persona ser mostrada con diferentes fechas de nacimiento en diversos registros. Ejemplos: Para expresar los mismos hechos sin violar la 3NF, es necesario dividir la tabla en dos:
Ganadores del torneo

Torneo

Ao

Ganador

Indiana Invitational 1998 Al Fredrickson

Cleveland Open

1999 Bob Albertson

Des Moines Masters 1999 Al Fredrickson

Indiana Invitational 1999 Chip Masterson

Fecha de nacimiento del jugador

Jugador

Fecha de nacimiento

Chip Masterson 14 de marzo de 1977

Al Fredrickson 21 de julio de 1975

Bob Albertson 28 de septiembre de 1968

Las anomalas de actualizacin no pueden ocurrir en estas tablas, las cuales estn en 3NF.
- Explique detalladamente que resuelve la cuarta forma normal (4FN) presente 4 ejemplos. Tambin muestre mediante ejemplos las fallas que presenta la 4FN.

Una tabla se encuentra en 4FN si, y slo si, para cada una de sus dependencias mltiples no funcionales X->->Y, siendo X una super-clave que, X es o una clave candidata o un conjunto de claves primarias.

Ejemplo:

Considere el siguiente ejemplo:

Permutaciones de envos de pizzas

Restaurante

Variedad de Pizza rea de envo

Vincenzo's Pizza Corteza gruesa

Springfield

Vincenzo's Pizza Corteza gruesa

Shelbyville

Vincenzo's Pizza Corteza fina

Springfield

Vincenzo's Pizza Corteza fina

Shelbyville

Elite Pizza

Corteza fina

Capital City

Elite Pizza

Corteza rellena

Capital City

A1 Pizza

Corteza gruesa

Springfield

A1 Pizza

Corteza gruesa

Shelbyville

A1 Pizza

Corteza gruesa

Capital City

A1 Pizza

Corteza rellena

Springfield

A1 Pizza

Corteza rellena

Shelbyville

A1 Pizza

Corteza rellena

Capital City

Cada fila indica que un restaurante dado puede entregar una variedad dada de pizza a un rea dada. Note que debido a que la tabla tiene una clave nica y ningn atributo no-clave, no viola ninguna forma normal hasta el BCNF. Pero debido a que las variedades de pizza que un restaurante ofrece son independientes de las reas a las cuales el restaurante enva, hay redundancia en la tabla: por ejemplo, nos dicen tres veces que A1 Pizza ofrece la Corteza rellena, y si A1 Pizza comienza a producir pizzas de Corteza de queso entonces necesitaremos agregar mltiples registros, uno para cada una de las reas de envo de A1 Pizza. En trminos formales, esto se describe como que Variedad de pizza est teniendo una dependencia multivalor en Restaurante. Para satisfacer la 4NF, debemos poner los hechos sobre las variedades de pizza ofrecidas en una tabla diferente de los hechos sobre reas de envo:

Variedades por restaurante

reas de envo por restaurante

Restaurante

Variedad de pizza

Restaurante

rea de envo

Vincenzo's Pizza Corteza gruesa

Vincenzo's Pizza Springfield

Vincenzo's Pizza Corteza fina

Vincenzo's Pizza Shelbyville

Elite Pizza

Corteza fina

Elite Pizza

Capital City

Elite Pizza

Corteza rellena

A1 Pizza

Springfield

A1 Pizza

Corteza gruesa

A1 Pizza

Shelbyville

A1 Pizza

Corteza rellena

A1 Pizza

Capital City

En contraste, si las variedades de pizza ofrecidas por un restaurante a veces variaran de un rea de envo a otra, la tabla original de la tres columnas satisfara la 4NF. Ronald Fagin demostr que es siempre posible alcanzar la 4NF (pero no siempre deseable). El teorema de Rissanen es tambin aplicable en dependencias multivalor.

You might also like