Bases de Datos Difusas

BASES DE DATOS DIFUSAS
Originalmente el trmino fuzzy procede de fuzz. La traduccin de esta palabra al

castellano es difuso o borroso, aunque fuzzy, en los mbitos acadmicos y tecnolgicos,
est aceptado tal cual, de forma similar a como los es bit.
Una de las caractersticas del lenguaje natural, que hace difcil su utilizacin en sistemas
computacionales es su imprecisin. Por ejemplo conceptos como pequeo o grande,
tienen significados diferentes de acuerdo al contexto en el que se estn utilizando, e
incluso dentro del mismo contexto, pueden significar cosas diferentes para diferentes
individuos.
La teora de los conjuntos difusos desarrollada por Zadeh, provee una poderosa
herramienta para la representacin y manejo de la imprecisin por lo que actualmente
est siendo utilizada en varios campos para el diseo de sistemas basados en reglas
difusas. La teora de conjuntos difusos, extiende la teora clsica de conjuntos al permitir
que el grado de pertenencia de un objeto a un conjunto sea representada como un
nmero real entre 0 y 1 en vez del concepto clsico en el que solo se tiene la posibilidad
de pertenecer a un conjunto o no pertenecer al mismo; en otras palabras, el grado de
pertenencia a un conjunto en la teora clsica tiene solo dos valores posibles: 0 y 1. Dado
que ni el clculo ni el lgebra relacional, que establecen el resultado de cualquier consulta
como una nueva relacin, tienen la capacidad de permitir consultas de una manera difusa.
En los ltimos aos, algunos investigadores han lidiado con el problema de relajar el
modelo relacional para permitirle admitir algunas imprecisiones; esto conduce a sistemas
de bases de datos que encajan en el campo de la Inteligencia Artificial, ya que permiten el
manejo de informacin con una terminologa que es muy similar a la del lenguaje natural.
Esta lgica es una lgica multievaluada, sus caractersticas principales, presentadas por
Zadeh en la referencia antes mencionada son:
En la lgica difusa, el razonamiento exacto es considerado como un caso

particular del razonamiento aproximado.
Cualquier sistema lgico puede ser trasladado a trminos de lgica difusa.
MARTINEZ SERRA ERNESTO
3CM1
En lgica difusa, el conocimiento es interpretado como un conjunto de

restricciones flexibles, es decir, difusas, sobre un conjunto de variables.
La inferencia es considerada como un proceso de propagacin de dichas

restricciones.
Modelos de implementacin.
El problema de la implementacin de los sistemas gestores de bases de datos difusas ha
sido tratado en dos vertientes principales:
Iniciar con un sistema gestor de bases de datos relacionales (SGBDR) con informacin
precisa y desarrollar una sintaxis que permita formular consultas imprecisas, lo cual da
origen a extensiones SQL, como Fuzzy SQL, con capacidades de manejar la imprecisin.
Construir un gestor de bases de datos relacionales difusas (SGBDRD) prototipo que
implemente un modelo concreto de base de datos relacional difusa en el que la
informacin imprecisa pueda ser almacenada. Dentro de esta vertiente existen dos
grandes ramas: Los modelos a travs de unificacin por relaciones de similitud y los
modelos relacionales basados en distribuciones de probabilidades. Particularmente me
enfocar a los trabajos desarrollados en la Universidad de Granada, Espaa por un grupo
de investigadores que se encuentran trabajando en esta rama actualmente.
Manejo
Se utiliza el lenguaje Fuzzy SQL (FSQL) que es un lenguaje que deriva de SQL,
incorporando algunas novedades.
Etiquetas Lingsticas: Las etiquetas van precedidas del smbolo $.
Comparadores Difusos: Permiten comparar dos atributos o un atributo con una

constante.
Conectivas Lgicas: Pueden usarse NOT, AND y OR, para enlazar condiciones
difusas simples.
Umbral de Cumplimiento (threshold): Tras cada condicin simple puede

imponerse un umbral de cumplimiento mnimo (por defecto es 1), con el siguiente
formato: <condicin_simple>THOLD.
Constantes Difusas: Pueden usarse en el SELECT todas las constantes difusas

ya definidas: UNKNOWN, UNDEFINED y NULL, $[a,b,c,d] (Distrib. de posibilidad
Trapezoidal), $label (Etiquetas), [n,m] (Intervalo) y #n (valores aproximados).
Funcin CDEG (<atributo>): Usada en la lista de seleccin, la funcin CDEG

calcula, para cada tupla, el grado de cumplimiento del atributo del argumento en la
condicin de la clusula WHERE.
3CM1
Funcin CDEG(*): Calcula el grado de cumplimiento de cada tupla en la condicin

de forma global, para todos sus atributos y no slo para uno de ellos en particular.
Carcter Comodn %: Similar al carcter comodn * de SQL, pero este incluye

adems la funcin CDEG aplicada a todos los atributos de la condicin.
Condicin con IS: Tambin admite condiciones del tipo:<atributo_difuso> IS

[NOT] {UNKNOWN |UNDEFINED | NULL}.
Cuantificadores Difusos:
o
Se aplican como condicin en la clusula HAVING que sigue a una

clusula GROUP BY.
$Cuantificador FUZZY[r] (condicin_difusa) THOLD.
Atributos difusos: Para representar atributos difusos consideraremos datos con dominio
de referencial ordenado y no ordenado. Tambin son considerados en ambos tipos de
dominio los valores Unknown (valor desconocido), Undefined (valor no definido o sin
sentido) y Null (ignorancia total, no se sabe si es Unknown o Undefined) Los atributos
difusos pueden ser de 4 tipos:
Tipo 1: Estos son atributos con datos precisos, clsicos o crisp (tradicionales, sin
imprecisin), que pueden tener etiquetas lingsticas definidas sobre sus dominios
Tipo 2: Son atributos que pueden recoger datos imprecisos sobre referencial
ordenado. Estos atributos admiten tanto datos crisp como difusos, en forma de
distribuciones de posibilidad sobre un dominio subyacente ordenado. Los valores de este
tipo de atributos difusos pueden ser las propias etiquetas lingsticas (definidas
previamente), distribuciones de posibilidad trapezoidales (otras distintas de las etiquetas),
valores aproximados (, etc..
Tipo 3: Son atributos sobre datos de domino discreto no ordenado con analoga. En
estos atributos se definen algunas etiquetas (rubio, pelirrojo, castao...), que son
escalares con una relacin de similitud (o proximidad) definida sobre ellas, de forma que
esta relacin indique en qu medida se parecen entre s cada par de etiquetas.
Tipo 4: Son atributos sobre datos de domino discreto no ordenado sin analoga.
Bsicamente, este tipo es igual que el anterior pero, en este caso, estamos ante un
dominio cuyos escalares o etiquetas no disponen de una relacin de similitud por la que
puedan ser comparados.
Ejemplo.
1.Supongamos una clase Persona en la cual se pueden definir atributos tales como, edad
que puede tomar valores de infantil, joven y adulto, por otro lado, se puede definir el
atributo color del pelo que puede tomar valores de Rubio, Castao y Pelirrojo.
En una base de datos clsica, cada instancia slo puede tomar uno de estos tres valores,
tanto para la edad, como para el color del pelo. Pero es usual que los requerimientos del
usuario van ms all de stas consideraciones, constantemente nos enfrentamos al
hecho de que, una persona describe su edad como entre joven y adulto o que su color
3CM1
del pelo es entre rubio y castao, consideramos que el modelado de datos en UML, no
es capaz de representar este tipo de requerimientos. Nuestro trabajo se centra en la
representacin de este tipo de requerimientos usuales, ms an, se puede identificar que
el dominio edad y color del pelo son distintos. Nos hemos propuesto el siguiente
modelado en UML para este tipo de atributo que contiene la clase
Persona, aplicando el Patrn de Atributos Difuso definidos en el prrafo anterior.
2.Dame todas las personas cuya edad es aproximadamente 20 aos: (con grado mnimo
0.6):
SELECT * FROM Personas WHERE Edad FEQ #20 THOLD 0.6;
3.Dame todas las personas ms o menos Rubias (con grado mnimo 0.5) cuya edad es
posiblemente superior a Joven (con grado mnimo 0.8):
SELECT * FROM Personas WHERE Pelo FEQ $Rubio THOLD 0.5 AND Edad FGT
$Joven THOLD 0.8;
4.Equipos que tienen muchos ms de 3 (con grado mnimo 0.5) jugadores Altos (con
grado mnimo 0.75):
SELECT Equipo, CDEG(*) FROM Personas
$Muchos_Mas_Que[3] (Altura FEQ $Alto 0.75) 0.5;
3CM1
GROUP
BY
Equipo
HAVING

Bases de Datos Difusas

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bases de Datos Difusas

Uploaded by

Copyright:

Available Formats

BASES DE DATOS DIFUSAS

Originalmente el trmino fuzzy procede de fuzz. La traduccin de esta palabra al

En la lgica difusa, el razonamiento exacto es considerado como un caso

Cualquier sistema lgico puede ser trasladado a trminos de lgica difusa.

MARTINEZ SERRA ERNESTO

En lgica difusa, el conocimiento es interpretado como un conjunto de

La inferencia es considerada como un proceso de propagacin de dichas

Etiquetas Lingsticas: Las etiquetas van precedidas del smbolo $.

Comparadores Difusos: Permiten comparar dos atributos o un atributo con una

Umbral de Cumplimiento (threshold): Tras cada condicin simple puede

Constantes Difusas: Pueden usarse en el SELECT todas las constantes difusas

Funcin CDEG (<atributo>): Usada en la lista de seleccin, la funcin CDEG

MARTINEZ SERRA ERNESTO

Funcin CDEG(*): Calcula el grado de cumplimiento de cada tupla en la condicin

Carcter Comodn %: Similar al carcter comodn * de SQL, pero este incluye

Condicin con IS: Tambin admite condiciones del tipo:<atributo_difuso> IS

Se aplican como condicin en la clusula HAVING que sigue a una

$Cuantificador FUZZY[r] (condicin_difusa) THOLD.

MARTINEZ SERRA ERNESTO

You might also like