Professional Documents
Culture Documents
Versin 12
Dr. Arno Formella
Universidade de Vigo
Escola Superior de Enxeara Informtica
Departamento de Informtica
rea de Linguaxes e Sistemas Informticos
E-32004 Ourense
http://trevinca.ei.uvigo.es/%7Eformella
formella@uvigo.es
Junio 2014
ndice
1. Sobre este documento
1.1. Versiones y lista de correcciones . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Introduccin
2.1. Reglas de sustitucin para formar secuencias
2.2. Autmatas que aceptan secuencias . . . . . .
2.3. Lenguajes y autmatas . . . . . . . . . . . .
2.4. Mquinas de Turing universales . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
.
.
.
.
8
9
10
11
11
3. Conceptos bsicos
3.1. Alfabetos . . . . . . . . . . . . . . .
3.2. Palabras . . . . . . . . . . . . . . . .
3.3. Lenguajes . . . . . . . . . . . . . . .
3.4. Producciones y Derivaciones . . . . .
3.5. Relaciones de equivalencia . . . . . .
3.6. Relacin de equivalencia de lenguajes
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
16
18
19
21
4. Gramticas generativas
4.1. Ejemplos . . . . . . . . .
4.2. Abreviacin de Backus . .
4.3. rbol de derivacin . . . .
4.4. Jerarquia de Chomsky . . .
4.5. Equivalencia y ambigedad
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
23
25
26
26
28
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Autmatas finitos
5.1. Autmatas finitos deterministas (AFD) . . . . . . . .
5.2. Autmatas finitos no-deterministas (AFND) . . . . .
5.3. Equivalencia entre AFD y AFND . . . . . . . . . . .
5.4. Autmatas finitos no-deterministas con transiciones
(AFND-) . . . . . . . . . . . . . . . . . . . . . . .
5.5. Equivalencia entre AFND y AFND- . . . . . . . . .
5.6. Existencia de autmatas finitos mnimos . . . . . . .
5.7. Ejemplos de uso del teorema de Myhill y Nerode . .
5.8. Algoritmo de minimizacin . . . . . . . . . . . . . .
30
. . . . . . . . . . . . . . . 30
. . . . . . . . . . . . . . . 33
. . . . . . . . . . . . . . . 34
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6. Expresiones regulares
6.1. Sintaxis y semntica . . . . . . . . . . . . . . . . . . . . .
6.2. Equivalencia entre autmatas finitos y expresiones regulares
6.3. Abreviaciones para el uso de expresiones regulares . . . . .
6.4. Smbolos y meta-smbolos . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
39
42
44
46
47
.
.
.
.
50
50
52
55
56
7. Lenguajes regulares
57
7.1. Equivalencia entre gramticas lineales por la derecha y autmatas finitos . . . . . 57
7.2. Equivalencia entre gramticas lineales por la derecha y lineales por la izquierda . 59
7.3. Lema de bombeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
8. Propiedades, algoritmos de decisin,
y aplicaciones para lenguajes regulares
8.1. Propiedades de lenguajes regulares . . . . . . . . . . . . . . . . . . . . . . . . .
8.2. Algoritmos de decisin de lenguages regulares . . . . . . . . . . . . . . . . . . .
8.3. Aplicaciones para lenguajes regulares . . . . . . . . . . . . . . . . . . . . . . .
65
65
67
68
81
82
83
87
89
91
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
95
95
96
97
99
100
102
103
105
107
110
112
113
115
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
116
117
118
119
120
121
122
125
13. Bibliografa
127
13.1. Bibliografa bsica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
13.2. Bibliografa, enlaces en la red . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
13.3. Bibliografa usada para la preparacin de las clases . . . . . . . . . . . . . . . . 127
1.
1.1.
2.
Introduccin
Por qu es importante la teora de lenguajes formales y autmatas?
Bueno, aclaramos primero un poco las palabras usadas.
Qu es un lenguaje formal?
Conocemos lenguajes naturales.
espaol, alemn, ingls, chino, rabe...
cuando nacemos no sabemos ningn lenguaje
se puede aprender cualquier lenguaje natural (por lo menos si se ha nacido en un entorno
adecuado, y no hay obstculos orgnicos)
el lenguaje es una secuencia de fonemas o smbolos
que forman slabas, palabras, frases, prrafos, captulos, novelas, libros, bibliotecas
etc.
que tiene una sintaxis (fontica o ortografa)
que tiene una gramtica (reglas de concatenacin y construccin de palabras para
formar frases)
(que tiene un estilo (forma de unir frases para generar textos))
Hoy en da aparecen cada vez ms smbolos (llamados iconos) con el propsito de simplificar
sobre todo las interfaces al usuario, es decir, se quiere transmitir una semntica a partir de un
smbolo. Como ejercicio para reflexionar y criticar el uso excesivo de tal moda, se pide: intenta
averiguar el significado de los siguientes smbolos (relacionados semnticamente entre si) que
estn en uso desde hace cientos de aos por una gran parte de la humanidad:
2.1.
favoritas
Con este diagrama podemos formar unas reglas para sustituir smbolos:
$ AB
C son
G
J
A esas
D EF
H IJ
F en informatica
A
B CD
E GH G mis
I clases J favoritas
F
10
AB
esasB
esasCD
esas sonD
esas sonEF
esas sonGHF
esas sonHF
esas sonH
esas sonIJ
esas son clasesJ
esas son clases
donde siempre hemos usado una regla adecuada para sustituir smbolos hasta llegar a tal punto
que ya no se puede aplicar ninguna regla ms.
Y con pequeos arreglos podemos traducirlo al alemn:
$ AB
C sind
G
J
A dies
B CD
D EF
E GH
G meine
H JI
I Vorlesungen J liebsten
F in Informatik F
2.2.
Construimos un autmata que acepta una palabra del tipo mencionado anteriormente. Entendemos por aceptar que el autmata llega a un estado final. Consumimos para cada transicin de
estado una letra de la palabra. Podemos dibujar un autmata:
11
automata
donde el estado inicial (o de comienzo) est marcado con una flecha, el estado final est marcado
con un doble crculo. Las transiciones estn visualizadas con flechas entre los estados que a su
vez estn marcados con sus smbolos correspondientes. Si empezamos en el estado inicial, y si
leemos la palabra por aceptar desde la izquierda hacia la derecha, podemos saltar de estado a
estado siguiendo los arcos adecuados.
Observamos que llegamos solamente al estado final si la palabra por aceptar es una palabra vlida
del lenguaje.
2.3.
Lenguajes y autmatas
Vemos y veremos
que las gramticas sirven para generar palabras (y con eso lenguajes) y
que los autmatas sirven para aceptar palabras (y con eso lenguajes).
Hacia el final del curso tendremos algunos conocimientos sobre una jerarqua de lenguajes y las
equivalencias entre:
Lenguajes Tipo 3, Gramticas Regulares y Autmatas Finitos,
Lenguajes Tipo 2, Gramticas Libres de Contexto y Autmatas Finitos con Pila,
Lenguajes Tipo 1, Gramticas Sensitivos al Contexto y Autmatas Linealmente Acotados,
Lenguajes Tipo 0, Gramticas Generales y Mquinas de Turing.
Dicha clasificacn es algo gruesa considerando avances modernas en la teora de lenguajes formales: los lenguajes tipo 2 se dividen en dos: deterministas y no-deterministas que se aceptan
con autmatas de pila deterministas y no-deterministas respectivamente. Luego, los lenguages
Tipo 1 ya se dividen en tres subclases que se aceptan con autmatas con cierto tipo de multi-pila.
2.4.
12
3.
13
Conceptos bsicos
3.1.
Alfabetos
1
2
3
4
5
6
=
=
=
=
=
=
{0, 1}
{a, b}
{na, pa, bra, la}
{<HTML>, </HTML>, <BODY>, </BODY>, . . .}
{|}
{a, ab, aab}
Usamos meta-smbolos (tal como {, }, =, y la coma) para escribir sobre lo que hablamos.
Desde el contexto siempre ser claro, si se trata de un smbolo del alfabeto o si se trata de
un meta-smbolo.
Usamos subndices para distinguir diferentes alfabetos.
Usamos normalmente las minsculas como alfabeto = {a, . . . , z}, en los ejemplos normalmente letras desde el principio del alfabeto.
Cardinalidad del alfabeto (nmero de elementos del alfabeto): || > 0, || <
3.2.
Palabras
Una secuencia finita de smbolos de un alfabeto es una palabra sobre dicho alfabeto.
1
2
3
6
:
:
:
:
Escribimos la palabra vaca, es decir, la palabra que no contiene ningn smbolo, como .
14
Usamos normalmente letras minsculas para anotar palabras, preferiblemente desde el final del alfabeto.
El smbolo no pertenece a ningn alfabeto,
/
La longitud de una palabra sobre un alfabeto es el nmero de smbolos que contiene.
1
2
3
6
:
:
:
:
w
w
w
w
Dependiendo del alfabeto puede resultar difcil dividir una palabra en sus smbolos.
Si se puede dividir todas las palabras sobre un alfabeto solamente de una manera en sus
smbolos, se llama tal alfabeto libre.
Solemos usar solamente alfabetos libres.
|| = 0
El conjunto de todas las palabras que se pueden formar sobre un alfabeto ms la palabra vaca
se llama el universo del alfabeto W ().
W () = {} {w | w es palabra sobre }
W ()
es palabra de cualquier universo, W ().
La cardinalidad del universo es infinito (pero contable o enumerable, vemos ms adelante
lo que significa).
Si el alfabeto es libre (o mejor decir, un generador libre), escribimos por W ().
Podemos concatenar palabras, entonces sean w, v y u palabras en .
w.v = wv, es decir, usamos el . como smbolo de concatenacin, pero muchas veces
obviamos de l (igual como se suele hacer con el de la multiplicacin).
w = w = w, es decir, se comporta como el elemento neutro (o elemento de intentidad)
respecto a la concatenacin.
15
v = dec
wv = abcdec 6= decabc = vw
www = w3 ,
w
. . w} = wi , i IN = {0, 1, 2, }
| .{z
i-veces
w1 = w,
w0 =
|wi | = i |w|
|w0 | = || = 0 = 0 |w| = |w0 |
wm+n = wm .wn
|wm+n | = (m + n) |w| = m |w| + n |w| = |wm | + |wn |
La reflexin de una palabra w (o la palabra reversa) anotamos como wR .
|w| = |wR |
= R
3.3.
16
Lenguajes
Un lenguaje es cualquier subconjunto del universo sobre algn alfabeto, es decir, L W (), o
tambin L .
Ejemplo:
Lenguajes triviales
L = es el lenguaje vacio (que no contiene ninguna palabra), |L| = 0
L = {} es el lenguaje que solamente contiene la palabra vacio, |L| = 1
son independientes del alfabeto y por eso son lenguajes sobre cualquier alfabeto.
sea = {a, b}
L1 = {, a, b}
Lab = {an bn | n IN} es decir, el lenguaje que contiene todas las palabras con un
nmero de as seguidos por el mismo nmero de bs.
Lpal = {wwR | w } es decir, palndromos
2
L1 L2 = L2 L1
(L1 L2 ) L3 = L1 (L2 L3 )
LL=L
L=L=L
L = = L
Interseccin:
L1 L2 = {w | w L1 y w L2 }
Propiedades (unos ejemplos):
Conmutatividad:
Asociatividad:
Idempotencia:
Operacin con :
Operacin con :
L1 L2 = L2 L1
(L1 L2 ) L3 = L1 (L2 L3 )
LL=L
L = = L1
L = L = L
17
Complemento:
L = {w | w y w
/ L}
Propiedades (unos ejemplos):
Reglas de DeMorgan: L1 L2 = L1 L2
L1 L2 = L1 L2
Con estas tres operaciones la estructura ( , , , ) forma un lgebra booleana.
Diferencia:
L1 L2 = {w | w L1 pero w
/ L2 }
Propiedades (unos ejemplos):
L1 = L1
L1 L2 = L1 L2
Concatenacin:
L1 .L2 = {w | w = w1 .w2 y w1 L1 y w2 L2 }
Propiedades (unos ejemplos):
No-Conmutatividad: L1 .L2 6= L2 .L1 (en general)
Operacin con :
L1 . = = .L1
Operacin con {}: L1 .{} = L1 = {}.L1
Potencia:
Li = L
. . L}
| .{z
i-veces
i IN
L =
Li = L1 L2 L3 . . .
i=1
L =
[
i=0
Li = L0 L1 L2 . . .
18
Reflexin (o inverso):
L = {w | wR L}
Homomorfismo: Sean , dos alfabetos. Sea : una funcin que asigna a cada
smbolo de una palabra sobre . Podemos ampliar la funcin a un homomorfismo
: , es decir, una funcin que asigna a cada palabra sobre una palabra sobre
, con
() =
(w) = (w)()
Ejemplo:
= {a, b, c, d}
= {0, 1}
(a) = 00
(abcd) = 0010110
(b) = 1 (c) =
(d) = 0110
3.4.
Producciones y Derivaciones
Definimos algunas notaciones para describir reglas de sustitucin, es decir, como derivar una
palabra con las producciones de la gramtica:
Una produccin p es una dupla (pareja) de un conjunto cartesiano sobre dos universos (que
pueden ser el mismo), es decir, p = (A, B) 1 2 .
Sea (A, B) una produccin, en vez de duplas tambin escribimos: A B.
Un conjunto de producciones se llama sistema de producciones (o sistema de reglas). A este
nivel todava no decimos mucho sobre los alfabetos involucrados, ms adelante concretaremos.
19
Una derivacin directa v w es una conversin de una palabra en otra aplicando una produccin, es decir, sea por ejemplo v = aAb una palabra, y sea A B una produccin, entonces
se puede derivar la palabra w = aBb directamente desde v sustituyendo la subpalabra A por la
palabra B como indica la produccin.
Ejemplo: Sean 000 010 y 10 01 dos producciones. Desde v = 1000 se puede derivar
w1 = 1010 aplicando la primera produccin, y w2 = 0100 aplicando la segunda.
Una derivacin v w es una secuencia de derivaciones directa aplicando sucesivamente
producciones de un sistema. La longitud de una derivacin es el nmero de producciones aplicadas.
Ejemplo: Sean 000 010 y 10 01 dos producciones. Desde v = 1000 se puede derivar
w1 = 0011, es decir, v w1 aplicando v = 1000 1010 0110 0101 0011 =
w1 , o tambin w2 = 0001 aplicando v = 1000 0100 0010 0001 = w2 . En el primer
caso la longitud de la derivacin es 4, en el segundo caso 3.
Comentario importante: muchas de las comprobaciones en el mbito de la teora de los lenguajes formales se realiza mediante induccin sobre: longitud de la palabra, longitud de la derivacin, (o luego tambin longitud del clculo).
Dado un sistema de producciones, si sustituimos siempre la primera posibilidad a la izquierda de
la palabra de partida, se llama una derivacin ms a la izquierda, e igual, si sustituimos siempre
la primera posibilidad a la derecha de la palabra de partida, se llama una derivacin ms a la
derecha.
3.5.
Relaciones de equivalencia
20
R+ =
Rn
n1
es decir, xR y (o en otra notacin x y, o con palabras: la pareja (x, y) est en la clausura transitiva de la relacin R) si x = y o si existe una secuencia z1 , z2 , . . . , zn con n 1 y
xRz1 , z1 Rz2 , . . . , zn Ry.
Una relacin R es
reflexiva, si x : xRx, es decir, la relacin de identidad R0 es subrelacin de R,
transitiva, si xRy, yRz = xRz, es decir, si los pares (x, y) y (y, z) son elementos de R
entonces (x, z) tambin lo es,
simtrica, si x, y : xRy yRx, es decir, con (x, y) tambin (y, x) es elemento de la
relacin.
Observamos que para R
R es una relacin reflexiva y transitiva, llamada la clausura reflexiva y transitiva de R
(porque es la relacin ms pequea con tal propiedad).
R+ es una relacin transitiva, llamada la clausura transitiva de R (porque es la relacin
ms pequea con tal propiedad).
R+ es tambin reflexiva si R ya lo es.
R y R+ son simtricas si R ya lo es.
Una relacion R es una relacin de equivalencia si R es reflexiva, simtrica, y transitiva.
Sea R una relacin de equivalencia sobre . A cada elemento de podemos asignar el conjunto
de los elementos que son equivalentes a l. Basta con anotar un representente de dicho conjunto
y escribimos
[x]R = {y | yRx} = {y | xRy}
(si desde el contexto ya conocemos R, obviamos del subndice R).
Si xRy entonces [x] = [y] porque ambos caen en la misma clase de equivalencia. Se suele usar
como representante una de las palabras ms cortas de la clase.
Si x, y [z] escribimos tambin x y que significa que xRy e yRx.
Una relacin de equivalencia divide en clases, es decir,
= [x1 ] [x2 ] . . . [xk ] . . .
21
cuyo nmero es finito o infinito. La interseccin de dos clases es vaca, es decir, [xi ] [xj ] =
si i 6= j porque si tuviesen un elemento en comn, ambas clases seran iguales.
Ejemplo: Sea = {1 , . . . , k } un alfabeto (por ejemplo el alfabeto de toda la vida).
La relacin
R = {(x, y) | x comienza con el mismo smbolo que y}
es una relacin de equivalencia y nos divide en
= [1 ] [2 ] . . . [k ] []
es decir, en todas las clases de palabras que empiezan con la misma letra ms la clase para la
palabra vaca (que no empieza con ninguna letra).
Entonces hay tantas clases como smbolos en ms una clase.
Llamamos el nmero de clases que produce una relacin de equivalencia el ndice de la relacin
Indice(R).
En el ejemplo tenemos Indice(R) = k + 1 = || + 1, es decir, un ndice finito.
3.6.
4.
22
Gramticas generativas
P .+
N .
es decir, a la derecha existe por lo menos un smbolo no-terminal
P N
es decir, se sustitue solamente smbolos (palabras) no-terminales
P N (N T )
es decir, se sustitue solamente smbolos (palabras) no-terminales, pero por smbolos
(palabras) o bien terminales o bien no-terminales
Repetimos: se exige que |P | < , es decir, el conjunto de reglas es finito.
Ms adelante vemos en detalle qu tipos de sistemas de producciones se suele usar!
$ es el smbolo inicial (o de partida, o de comienzo, o axioma) que pertenece al alfabeto
no-terminal, es decir, $ N .
El lenguaje generado por una gramtica es
L(G) = {w | w T y $ w}
es decir, se puede derivar la palabra w T desde el smbolo inicial aplicando las reglas del
sistema de producciones. Dichas palabras derivables que consisten solamente de smbolos terminales se llaman sentencias.
4.1.
23
Ejemplos
L1 = {, a, b}
G1 = ({$}, {a, b}, {$ , $ a, $ b}, $)
obviamente L(G1 ) = L1
para lenguajes finitos es fcil generar una gramtica, basta con derivar directamente cada
palabra desde el smbolo inicial (aunque se puede usar un sistema de producciones ms
sofisticado)
Una gramtica recursiva sobre la palabra v es una gramtica donde se puede derivar
desde v una palabra que contiene v de nuevo, es decir, existe la posibilidad de una derivacin:
v uvw (con |v| < |uvw|).
El lenguaje generado por una gramtica es infinito, si la gramtica es recursiva sobre una palabra
v y que a su vez es derivable desde el smbolo inicial.
24
P = {
$
$
Xb
Yb
Yc
bZ
aZ
X
}
,
aXbc,
bY,
bY,
Zcc,
Zb,
aaXb,
N = {$, X, Y, Z}
25
Se puede comprobar formalmente con induccin sobre k que la gramtica dada genera
exactamente el lenguaje deseado, es decir L(Gabc ) = Labc .
La comprobacin sigue la construccin y se observa que no hay ambigedad en el momento de elegir una produccin.
Existe tambin una gramtica que usa un smbolo no-terminal menos y tambin una produccin menos:
P = {
$
$
Xb
Xc
bY
aY
aY
}
,
aXbc,
bX,
Y bcc,
Y b,
aaX,
aa
N = {$, X, Y }
Se observa:
tenemos ambigedad en elegir producciones para sustituir y dnde aplicarlas
aqu hemos decidido aadir a la derecha una b y una c
generalmente se nota que hay muchas gramticas que generan el mismo lenguaje
4.2.
Abreviacin de Backus
Para abreviar la notacin de las producciones usamos la forma normal de Backus (BNF). Agrupamos las producciones cuyas partes izquierdas coincidan, escribiendo las partes derechas separadas por |, por ejemplo:
P = {
$
Xb
Xc
bY
aY
}
| aXbc,
bX,
Y bcc,
Y b,
aaX | aa,
26
Definimos una gramtica que genere lo que se usa en programas, por ejemplo:
((a + b) (c + d)) (e + f )
T = {(, ), +, , a, . . . , z}
P = $ E, E E E | (E E) | (E + E) | a | . . . | z
Gexpr = ({$, E}, T , P, $)
se puede ampliar la gramtica que incluye tambin y /
se puede ampliar la gramtica que genere tambin expresiones con variables de ms de una
letra, por ejemplo: ancho altura
ms tarde veremos como se define las expresiones de tal estilo un poco ms completo
4.3.
rbol de derivacin
Para las gramticas podemos visualizar la aplicacin de las producciones que derivan desde el
smbolo inicial una palabra como un rbol, el rbol de derivacin:
arbol
El lugar con el smbolo inicial se llama raz del rbol (aunque se suele dibujarlo arriba de todo).
Como se ve, cada smbolo es la raz de un subrbol.
La palabra que se puede leer desde la izquierda hacia la derecha en las hojas del rbol y solamente
consiste de smbolos terminales ser una sentencia.
4.4.
Jerarquia de Chomsky
Segn Chomsky se clasifica las gramticas en cuatro tipos (cuales son, como vemos ms adelante,
entre si verdaderamente diferentes).
Entonces sea G = (N , T , P, $) una gramtica (y = N T ). Las gramticas se destinguen
solamente en el sistema de producciones que siempre ser un conjunto finito y que se clasifica
en los siguientes tipos:
27
4.5.
28
Equivalencia y ambigedad
29
E
T
F
V
E+T |T
T F |F
(E) | V
a | b | ... | z
5.
30
Autmatas finitos
Describimos autmatas finitos con unas definiciones matemticas. Nos limitamos al principio a
autmatas solamente con entrada.
5.1.
31
entonces
M = ({0, 1}, {q0 , q1 , q2 , q3 }, , q0 , {q0 })
Cmo describimos cmodamente ?
Observamos: |Q| < y || < , entonces podemos hacer una tabla con los estados como filas
y con los smbolos como columnas:
(q0 , 0) = q3 , (q0 , 1) = q1 , (q1 , 0) = . . .
o ms breve una tabla:
= ?q0
q1
q2
q3
0
q3
q2
q1
q0
1
q1
q0
q3
q2
Determinista significa que no tenemos opcin ninguna para eligir, es una funcin.
Si es una funcin total llamamos el autmata completo, es decir, existe para cada estado
y cada smbolo una transicin.
Abreviamos los dibujos para reducir el nmero de aristas:
aristas
es decir, permitimos escribir ms de un smbolo por arista, pero el cambio de estado se
realiza con leer solo uno de la lista.
Para definir el lenguaje aceptado por un AFD ampliamos la funcin a una funcin para que
trabaja sobre palabras:
: Q Q
(q, ) = q
(q, w) = ((q, ), w) , w
es decir, refleja el movimiento de la cabeza de lectura del autmata, o en otras palabras,
marca el camino que se est yiendo en el autmata para aceptar la palabra (hilo rojo).
Un autmata finito determinista M = (, Q, , q0 , F ) acepta una palabra w si (q0 , w)
F donde es la ampliacin de la funcion de transicin .
O en otras palabras, M acepta w, si (q0 , w) es un estado final del autmata.
32
El lenguaje aceptado por un autmata finito determinista M es el conjunto de palabras aceptadas por M :
L(M ) = {w | w , M acepta w}
En el grafo podemos observar: si w L(M ) entonces existe un camino en el grafo desde el
estado inicial q0 hasta algn estado final de tal manera que podemos leer la palabra w a lo largo
de las aristas visitadas.
Ejemplo: Un autmata que acepta nmeros reales (en Pascal):
afdreal
Curiosidades de C/C++:
Comprueba con un compilador de C/C++ (o de Java) si a=000; o a=0011.0; son
sentencias correctas, sino lo son, modifica el autmata adecuadamente (Qu pasa con
a=009 o a=007?).
Comprueba con un compilador de C/C++ (o de Java) si a=3E000; es una sentencia correcta, sino no lo es, modifica el autmata adecuadamente.
a=.1+ +1.; es una sentencia correcta en C/C++ (se asigna a a el valor 1.1 siendo la
suma de dos constantes flotantes), pero importante es el espacio entre los dos +
Vemos que estmos confrontados con diferentes problemas:
deberamos saber antemano: Qu es una constante flotante?
deberamos traducir dicho conocimiento en un autmata
deberamos comprobar si dicho autmata de verdad acepta lo que debe aceptar
si implementsemos tal autmata de forma real, deberamos comprobar adicionalmente si
la implementacin refleja la descripcin matemtica
Observamos, cada AFD se puede completar:
aadimos un estado e a Q (pero e
/ F)
aadimos las transiciones que faltan, es decir, (q, ) = e para todos los q Q (incluyendo
e) y
con eso se convierte en una funcin total
Observamos:
si q0 F entonces L(M ) y al revs, si L(M ) entonces q0 F .
puede ocurrir que hay estados no accesibles desde q0 , incluso pueden ser aislados, es decir,
no existe un camino desde q0 hacia tal estado.
5.2.
33
Ampliamos un poco las posibilidades de las transiciones de un autmata finito, es decir, cambiamos la funcin .
Un autmata finito no-determinista (AFND) es una quntupla
M = (, Q, , q0 , F )
donde
es un alfabeto.
Q es un conjunto finito no vaco de estados, es decir, 0 < |Q| < .
es (una de las dos definiciones, que entre si son equivalentes)
una relacin, es decir (Q ) Q
o una funcin, es decir, : Q P(Q) siendo P(Q) el conjunto de las partes
de Q
q0 Q es el estado inicial.
F Q es el conjunto de estados finales.
Ejemplo: un AFND para el lenguaje
Ldos = {w | w {0, 1} , w contiene dos 0s dos 1s}
afnd
Representamos la funcin tambin con una tabla, solo que ahora aparece ms de un estado en
cada celda de la tabla, por eso usamos la notacin de conjuntos:
= q0
q1
q2
q3
q4
0
{q0 , q3 }
{q2 }
{q4 }
{q4 }
1
{q0 , q1 }
{q2 }
{q2 }
{q4 }
34
es decir, coincide con para smbolos del alfabeto y en general enumera los estados alcanzables con la palabra.
Un autmata finito no-determinista M = (, Q, , q0 , F ) acepta una palabra w si (q0 , w)
F 6= donde es la ampliacin de la relacin de transicin .
O en otras palabras, M acepta w, si (q0 , w) contiene un estado final del autmata.
El lenguaje aceptado por un autmata finito no-determinista M es el conjunto de palabras
aceptadas por M :
L(M ) = {w | w , M acepta w}
5.3.
35
afndafd
Para el caso general tenemos:
Sea M = (, Q, , q0 , F ) un AFND, construimos un AFD M 0 = (, Q0 , 0 , q00 , F 0 ) con
Q0 P(Q), es decir, escomo muchoel conjunto de todos los subconjuntos de Q.
q00 = {q0 }, es decir, es el conjunto que contiene el estado inicial del AFND.
0 (Qi , ) = Pj p Pj q Qi con (q, ) = p, (por incluir, escribe texto)
F 0 P(Q) con si f F 0 entonces existe un q f con q F , es decir, el conjunto de
estados finales son todos aquellos estados del AFD que contienen por lo menos un estado
final del AFND.
Se suelen construir los estados necesarios del AFD a lo largo de la construccin en vez de coger
por defecto todos los posibles subconjuntos, para evitaren caso que sea posiblela construccin de muchos estados que finalmente no se alcanzan desde el estado inicial.
Por qu es correcta la construccin?
Tenemos que comprobar formalmente que si M (siendo un AFND) acepta w, entonces M 0 (siendo el AFD construido) tambin lo acepta; y si M 0 acepta w, entonces M tambin lo hace, es
decir, que L(M ) = L(M 0 ).
Pues, sea M un AFND y M 0 el AFD correspondiente.
Sea w = x0 x1 x2 . . . xn L(M ) cualquier palabra aceptada por M .
Comprobamos que w L(M 0 ), es decir, L(M ) L(M 0 ):
Definimos los siguientes diagramas
x
i
q
p
i
P
Q
q1
xn1
xn1
qn
qn+1
q2
n
0
1
2
Q0
Q1
Q2
Qn
Qn+1 F 0
36
donde la construccin va desde la izquierda, es decir, del estado inicial, hacia la derecha, es decir,
a un estado final. Dado que M acepta w, qn+1 es un estado final y siendo miembro de un conjunto
Qn+1 , este ser un estado final de M 0 .
Entonces hemos comprobado que M 0 acepta w, y por eso L(M ) L(M 0 ).
Ahora, sea w = x0 x1 x2 . . . xn L(M 0 ) cualquier palabra aceptada por M 0 .
Comprobamos que w L(M ), es decir, L(M ) L(M 0 ):
Definimos los siguientes diagramas
x
i
P
Q
3
x
i
p
q
xn1
xn1
n
0
1
2
Q0
Q1
Q2
Qn
Qn+1 F 0
q2
qn
q1
3
q0
qn+1
donde la construccin va ahora desde la derecha, es decir, un estado final, hacia la izquierda,
es decir, al estado inicial. Dado que M 0 acepta w, Qn+1 es un estado final y un conjunto no
vaco, entonces existe un miembro qn+1 que tambin es elemento de F y por consecuencia un qn
aplicando el diagrama y asi succesivamente hasta llegar a q0 .
Entonces hemos comprobado que M acepta w, y por eso L(M ) L(M 0 ).
Finalmente tenemos L(M ) L(M 0 ) y L(M ) L(M 0 ) y por eso L(M ) = L(M 0 ).
Como se observa en la construccin puede ser que se usa 2|Q| estados en el autmata determinista
si el autmata no-determinista tena |Q| estados, es decir, el crecimiento del nmero de estados
puede ser exponencial.
Surgen dos preguntas:
1. Existen AFNDs que producen un AFD de tal tamao grande?
2. Son necesarios tantos estados (o existe una mejor forma de realizar la conversin)?
37
38
Idea: En cada uno de los caminos reconociendo w1 siempre tiene que existir una arista con una
a (o una b) donde en la misma posicin para reconocer w2 hay una b (o una a).
Este principio nos lleva a una construccin inductiva:
afdln1
afdln2
afdln3
afdlnn
El nmero de estados entonces es:
|Q| = 1 + 2 + 4 + 6 + . . . + 2n + (2n 2) + . . . + 4 + 2 + 1
n
n1
X
X
= 1+2
i+1+2
i
i=1
i=1
= 1 + n(n + 1) + 1 + (n 1)n
= 2(n2 + 1)
Como vemos, incluso hemos reducido el nmero de estados comparando con el autmata del
libro: el AFND para aceptar L3 tiene solamente 20 estados.
La construccin de un AFD sigue el mismo argumento dado arriba: se necesita construir todas
las posibles palabras w1 en el lado izquierdo y por eso el AFD tiene por lo menos 2n estados
(los 2n 1 para enumerar los w1 y por lo menos un estado final en el lado derecho.
Hasta ahora slo hemos comprobado la explosin del nmero de estados para lenguajes finitos.
Existe tal crecimiento exponencial tambin para lenguajes infinitos?
Otro ejemplo para mostrar las capacidades de un AFND (y el crecemiento exponencial necesario
del AFD equivalente):
Usamos = {0, 1} como alfabeto. Definimos los siguientes lenguajes (que dependen del nmero n IN):
Ln = {w | w , w contiene un 1 en la n-nsima posicin desde la derecha}
Es bastante fcil construir un AFND que acepte Ln :
afndlr
No es tan obvio como construir directamente un AFD. Pero es posible con la construccin (Hazlo!).
Observamos en la construccin:
39
5.4.
40
M = (, Q, , q0 , F )
donde
Q, , q0 , y F estn definidos igual como en el caso de un AFND
es
una relacin, es decir (Q ( {})) Q
o una funcin, es decir, : Q ( {}) P(Q) siendo P(Q) el conjunto de
las partes de Q
Observamos que aadir ms aristas con obviamente no cambia el comportamiento del autmata:
AUTaibjckepstrans
Podemos tratar las transiciones con como una relacin T sobre el conjunto de estados, es decir
T = T1 = {(q, p) | (q, ) = p} Q Q
En el ejemplo tenemos
T1 = {(q0 , q1 ), (q1 , q2 )}
Esta relacin podemos ampliar para que sea reflexiva, es decir, que todas las parejas (q, q) con
q Q formen parte de la relacin, es decir, formamos
T0 = {(q, q) | q Q}
y con eso
T = T0 T1
entonces T por construccin es una relacin reflexiva. En el ejemplo tenemos
T0 = {(q0 , q0 ), (q1 , q1 ), (q2 , q2 )}
y con eso
T = {(q0 , q0 ), (q0 , q1 ), (q1 , q1 ), (q1 , q2 ), (q2 , q2 )}
Podemos ampliar la relacin aun ms considerando el efecto transitivo de las transiciones , es
decir, formamos en un primer paso
T2 = {(q, p) | r Q : (q, r), (r, p) T0 T1 y (q, p)
/ T0 T1 }
41
y con eso
T = T0 T1 T2
en el ejemplo tenemos
T2 = {(q0 , q2 )}
y as sucesivamente
Ti = {(q, p) | r Q : (q, r), (r, p)
i1
[
Tj y (q, p)
/
j=0
Finalmente definimos
T = T0 T1 T2 . . . =
i1
[
Tj }
j=0
Ti
i=0
cl(q0 ) = {q0 , q1 , q2 }
cl(q1 ) = {q1 , q2 }
cl(q2 ) = {q2 }
AUTaibjckafnd
hemos aadido q0 a los estados finales F porque existe un estado final que pertenece a la
clausura- de q0 , es decir, L
hemos marcado las aristas de la clausura- con smbolos del alfabeto
42
Entonces podemos formalizar el lenguaje aceptado por un AFND- (parecido a lo que hicimos
para un AFND).
Primero definimos la ampliacin de para autmatas con transiciones . (q, w) va a ser el
conjunto de estados (igual como en el caso de para AFNDs) que podemos alcanzar desde q
leyendo la palabra. Entonces:
: Q P(Q)
1.
(q, ) = cl(q)
es decir, nos quedamos en la clausura- si hemos alcanzado el final de la palabra
2.
(q, w) = {p | p Q y r (q, w) tal que p cl((r, ))}
[
=
cl((r, ))
r (q,w)
5.5.
Primero observamos que cualquier AFND es obviamente tambin un AFND- (pues uno que,
por casualidad, no tenga transiciones ).
Luego podemos construir a partir de un AFND- un AFND equivalente.
Entonces, sea M = (, Q, , q0 , F ) un AFND-.
Un AFND equivalente es el autmata M 0 = (, Q0 , 0 , q00 , F 0 ) donde
43
Q0 = Q
0 (q, ) =
rcl(q)
q00 = q0
F
si F cl(q0 ) =
0
F =
F q0 si F cl(q0 ) 6=
es decir, aadimos q0 como estado final, si algn estado final del AFND- pertenece a la
clausura- del estado inicial.
Convertimos el ejemplo:
La tabla de transiciones para M con las transiciones de la clausura- es:
q0
q1
q2
a
b
c
{q0 }
{q1 }
{q1 }
{q2 }
{q2 }
cl
{q0 , q1 , q2 }
{q1 , q2 }
{q2 }
{q1 } {q2 }
cl(q2 )
{q2 }
cl
{q0 , q1 , q2 }
{q1 , q2 }
{q2 }
q00
q10
q20
a
{q0 , q1 , q2 }
b
c
{q1 , q2 } {q2 }
{q1 , q2 } {q2 }
{q2 }
44
toda la clausura-, y vice versa, si hay una transicin en el AFND, tiene que haber existido una
transicin en el AFND- o bien con o bien sin una secuencia de transiciones .
Cunto ha crecido esta vez el autmata?
El nmero de estados queda igual, solo se amplia (si hace falta) F por un estado. Pero ha crecido el nmero de aristas (es decir, transisiones). Dicho crecimiento puede llegar como mucho a
|||Q|2 porque como mucho tantas aristas se pueden incorporar entre los nodos del grafo.
Finalmente hemos comprobado la equivalencia entre autmatas no-deterministas y autmatas
no-deterministas con transiciones .
5.6.
Ya vimos que hay varias posibilidades para construir un autmata finito determinista que acepte
un lenguaje (regular), por ejemplo, por construccin directa, o por el paso de un AFND a un
AFD.
Surge la pregunta: existe un autmata finito determinista (AFD) mnimo que acepta tal lenguaje?
Nos referimos al nmero de estados que tiene el AFD, es decir |Q|, dado que el nmero de
transiciones por estado est determinado por el nmero de smbolos en multiplicado por |Q| si
el AFD es completo.
La respuesta es: por supuesto que s!
Con el siguiente argumento: cada subconjunto de los nmeros enteros IN tiene un mnimo, y los
nmeros de estados de todos los posibles AFDs que aceptan L forman tal subconjunto.
Para la construccin del autmata mnimo necesitamos el formalismo de las relaciones de equivalencia.
Ya vimos que para cada lenguaje L podemos construir una relacin de equivalencia sobre
:
xRL y (z : xz L yz L)
es decir, x es equivalente a y, si, aadiendo cualquier sufijo, ambas palabras resultantes o bien
estn en L o bien no estn en L.
Un lenguaje L es regular, si y solo si el ndice de la relacin RL es finito, es decir, la relacin
tiene solamente un nmero finito de clases de equivalencia (Teorema de Myhill y Nerode).
Comprobamos primero la direccin =, es decir, si el lenguaje es regular, entonces el ndice
de la relacin es finito:
L es regular, entonces existe un AFD que acepta L.
45
xRM y
(q0 , xz) F
( (q0 , x), z) F
( (q0 , y), z) F
(q0 , yz) F
yz L
<
Indice(RM )
nmero de estados acesibles desde q0
|Q|
46
5.7.
(q0 , x) F
([], x) F
[x] F
xL
= L
= {a2 b, a3 b2 , a4 b3 , . . .}
...
k
[a b] = {ak+i1 bi | i 1}
verificamos que son clases de equivalencia, porque si ak+j1 bj [ak b] y ak+l1 bl [ak b] entonces o bien ak+j1 bj z, ak+l1 bl z L (si z = bk1 ) o bien ak+j1 bj z, ak+l1 bl z
/ L (si z 6= bk1 ).
Por eso el nmero de clases de RL es infinito, es decir, Indice(RL ) = .
Observa que no hemos clasificado todas las palabras de , sino solamente algunas palabras
posibles:
= L [a2 b] . . . [ak b] . . .
. . . las dems clases
|
{z
} |{z}
ya son un nmero infinito
es decir, para comprobar que un lenguaje no es regular basta con encontrar un nmero infinito de
clases de equivalencia (respecto a la relacin RL ).
Investigamos el lenguaje
L = {w | w {0, 1} y w termina con 00}
47
Pensamos en las posibles clases de equivalencia. Obviamente hay tres, o bien una palabra no
termina en 0, o bien termina en un 0, o bien termina por lo menos en dos 0, es decir:
[] = {w | w no termina en 0}
[0] = {w | w termina en un solo 0}
[00] = {w | w termina en 00}
Con = [] [0] [00] seguimos la construccin de arriba y obtenemos la tabla de transiciones
para el autmata:
0
= [] [0]
[0] [00]
?[00] [00]
1
[]
[]
[]
o como diagrama:
equiafd
5.8.
Algoritmo de minimizacin
La comprobacin del teorema de Myhill y Nerode nos proporciona un hecho muy importante:
el autmata basado en las clases de equivalencia es el autmata mnimo dentro de todos los
posibles autmatas finitos deterministas y completos que aceptan el mismo lenguaje, porque un
tal autmata M 0 definira un refinamiento de RM 0 RL , es decir, Indice(RM 0 ) Indice(RL )
y el AFD de las clases de equivalencia M representa las mismas clases RL = RM , entonces
Indice(RM 0 ) Indice(RL ) = Indice(RM ).
Una pregunta surge: Cmo sabemos si un AFD M ya es mnimo?
Pues, M no es mnimo, si
w p, q Q, p 6= q : (p, w) F (q, w) F
es decir, llegamos con alguna palabra w desde ambos estados siempre o bien a un estado final, o
bien a un estado no-final.
En tal caso, podemos unir los dos estados en un nico estado.
Basta con realizar las pruebas con todas las palabras w con |w| < |Q| porque no hace falta
visitar un estado dos veces.
Con dicho argumento describimos el algoritmo de minimizacin (sin comprobacin) a continuacin.
48
Decimos que dos estados p y q son distinguibles (o no-equivalentes) si existe una palabra w que
nos lleva desde p a un estado final pero no desde q, o al revs, es decir:
p 6 q ( (p, w) F y (q, w)
/ F ) o ( (p, w)
/ F y (q, w) F )
El algoritmo calcular la relacin de distinguibilidad (o no-equivalencia) entre los estados y
contiene 5 pasos.
1. Se elimina todos los estados no acesibles desde el estado inicial.
2. Se forma una tabla de todas las parejas de estados (p, q) con p 6= q.
3. Se marca en la tabla todas las parejas (p, q) con p F, q
/ F op
/ F, q F (porque
dichos estados seguro son distinguibles).
4. Mientras haya cambio en la tabla:
para cada pareja (p, q) no marcada y para cada smbolo
si ((p, ), (q, )) est marcada, tambin se marca (p, q).
5. Las parejas (duplas) no marcadas se une en un slo estado.
Ejemplo: partimos del siguiente AFD completo:
afdc
1. Todos los estados son acesibles desde a, por eso, no hay que eliminar nada.
2. La tabla es:
a
a b c d e -
3. Las marcas iniciales son (en vez de simple marcas, usamos nmeros para visualizar en el
siguiente apartado los cambios en la tabla en cada paso):
a
b
c
d
e
a
-
e
1
1
1
1
-
49
a b
a - 2
b - 4.
c - d - e - -
c
4
-
d
3
5
-
e
1
1
1
1
-
6.
50
Expresiones regulares
Hasta ahora era difcil describir lenguajes aceptados por autmatas. Siempre tenamos que aprovechar de una notacin como
L(M ) = {w | alguna propiedad de w}
Por ejemplo, si queramos desarrollar un autmata que comprobase que una cadena codificase
una direccin de correo electrnico vlida tendramos como propiedades:
1. los smbolos permitidos son: a-z, A-Z, 0-9, @ . - _
2. debe contener exactamente una @
3. por lo menos un . detrs de la @
4. detrs del ltimo . deben venir entre 2 y 4 letras
5. detrs de cada . y de la @ debe venir por lo menos una letra
6. delante de la @ por lo menos una palabra que empieza con una letra,
es decir, L(M ) = {w | w cumple las condiciones de arriba }.
Ejercicio: Intenta construir un autmata!
Sera conveniente tener un meta-lenguaje que nos permitiese describir fcilmente lenguajes (por
lo menos de cierto tipo).
6.1.
Sintaxis y semntica
Sea un alfabeto. Una expresin regular sobre se define con las siguientes reglas (inductivas):
1.
51
Con eso hemos definido una sintaxis de expresiones regulares, pero cul ser su semntica?
Para cada expresin regular definimos un lenguaje correspondiente (basado en las reglas).
El lenguaje L() definido por una expresin regular se define:
1.
a) L() =
b) L() = {}
c) si , entonces L() = {}
6.2.
52
a) =
regexprafnde1
b) =
regexprafnde2
c) = a
regexprafnde3
2.
a) =
regexprafnde4
b) = ( + )
regexprafnde5
3.
a) = ()
regexprafnde6
53
b) = ()
regexprafnde7
Ejemplo: construimos el AFND- para = (((a.b) + a) + b.b)
regexprafndeej
La otra direccin, es decir, comprobando que para cada autmata finito existe una expresin
regular que describe el mismo lenguaje, nos costar un poco ms de trabajo.
Sea M = (, Q, , q0 , F ) un AFD (sabemos que cualquier AFND o AFND- se puede convertir
en un AFD).
Describimos un algoritmo que sucesivamente construye la clausura transitiva del autmata dado y as construye finalmentecomo atributos de las aristas entre q0 y un nuevo estado f la
expresin regular.
Por eso permitimos que se pueden escribir expresiones regulares a las aristas de un autmata, es
decir, para (p, ) = q escribimos (p, , q) (pues, la arista del estado p al estado q con atributo a),
o teniendo expresiones regulares (p, , q) (pues, una arista de p a q con atributo ), o con dibujo:
aristaexpr
1. aadimos un nuevo estado f y conectamos todos los estados en F con transiciones a f ,
es decir, cambiamos M por M 0 = (Q {f }, , 0 , q0 , {f }) donde 0 = para estados en
Q y adems q F : 0 (q, ) = f . As no hemos cambiado el lenguaje aceptado por M .
(Pero siguimos escribiendo abajo simplemente M , , y Q para simplificar la notacin.)
2. para todos los estados q 6= q0 y q 6= f
a) para cada pareja de aristas (p, , q) y (q, , r) y arista reflexiva (q, , q) (nota, puede
ser p = r)
aade arista (p, , r)
b) elimina q con todas sus aristas adyacentes
pqr
c) agrupa las aristas construidas (p, 1 , r), . . . , (p, k , r) escribiendo (p, 1 +. . .+k , r)
3. cuando termina el proceso, es decir, solamente existen aristas entre q0 y f , precisamente
(q0 , , q0 ) y/o (q0 , , f ), la expresin regular final es .
(Observa: si q0 F entonces existe una arista con entre q0 y f , por eso, L(), y entonces
no hay que considerar un caso especial para contemplar lazos reflexivos en q0 porque + =
.)
54
Conmutatividad:
( + ) ( + )
Elementos neutros:
( + )
(.)
( + )
(.)
Eliminacin:
(.) (.)
Distributividad:
.( + ) (. + .)
( + ). (. + .)
55
Simplificacin:
(() ) ()
()
()
Con eso y un poco de mpetu podemos transformar sucesivamente la expresin regular obtenida
para obtener al final la expresin regular que era la base para el autmata finito inicial.
El problema de comprobar en general si dos expresiones regulares son equivalentes no es nada
fcil. Dicho problema cae en la clase de los problemas PSPACE que contiene problemas an ms
complejos que los problemas de la clase NP que (a lo mejor) veremos hacia el final del curso (un
problema NP es el problema del viajante). Aqu nos basta constatar que existen EE.RR. tal que
un algoritmo determinista que resuelve el problema necesita un tiempo que crece por lo menos
exponencial en la longitud de las expresiones regulares.
6.3.
56
nveces
(usando tales ns en varias posiciones y exigiendo que tenga en todos los sitios el mismo
valor se pueden describir lenguajes ya no regulares)
{m,n} por lo menos m veces, pero como mucho n veces .
(igual como arriba, usando tales ns y ms en varias posiciones y exigiendo que tengan en
todos los sitios los mismos valores se pueden describir lenguajes ya no regulares)
6.4.
Smbolos y meta-smbolos
= [a zA Z][a zA Z0 9\ _]
= (\.) @(\.)+ [a zA Z]{2,4}
donde hemos unido adicionalmente varios rangos en uno.
7.
57
Lenguajes regulares
7.1.
Sea M = (, Q, , q0 , F ) un AFD.
Construimos una gramtica lineal por la derecha G con L(G) = L(M ), es decir, genera el mismo
lenguaje que el AFD acepta.
G = (N , T , P, $) = (Q, , P, q0 )
es decir
N = Q, los estados del autmata determinan los smbolos no-terminales de la gramtica
T = , los smbolos del autmata determinan los smbolos terminales de la gramtica
$ = q0 , el estado inicial del autmata determina el smbolo inicial de la gramtica
El sistema de producciones P est dado por:
Si (q, ) = p es una transicin del AFD, con p, q Q y , entonces aadimos a P
la produccin q p.
Si (q, ) = p es una transicin del AFD, con q Q, p F y , entonces aadimos
a P la produccin q .
Si q0 F , entonces aadimos a P la produccin q0 .
Ejemplo:
afdabc
= ?q0
?q1
?q2
a
q0
b
q1
q1
c
q2
q2
q2
58
?f
graafd
b
c
{A}
{B, f }
{A, f } {B, f }
{B, f }
7.2.
59
Como era de esperar, gramticas lineales por la derecha y gramticas lineales por la izquierda
describen el mismo fenmeno, es decir, generan los lenguajes regulares.
Sea G = (N , T , P, $) una gramtica lineal por la derecha, es decir, P N (N .T
T ) {$ }.
Construimos una gramtica G0 = (0N , T , P 0 , $) lineal por la izquierda con el siguiente algoritmo en cuatro pasos:
1. Si el smbolo inicial $ de G aparece a la derecha en una produccin de P , se sustitue $ en
dichas reglas de la siguiente manera:
Se introduce un nuevo smbolo no-terminal $0 , es decir, 0N = N {$0 }.
Por cada regla de forma $ con T .N T se crea una nueva regla
$0 .
Cada regla de forma X $ (X N , T ) se sustitue por X $0 .
Si $ P , se aade para cada regla X $ (X N , T ) la regla
X .
Con esas modificaciones obtenemos un nuevo sistema de producciones P y un alfabeto de
variables o bien 0N = N o bien 0N = N {$0 }.
2. Se crea un grafo dirigido con las siguientes propiedades:
El conjunto de nodos es 0N {}.
Se aade una arista entre los nodes A y B con atributo , si existe una regla A B
en P .
Se aade una arista entre los nodes A y con atributo , si existe una regla A
en P .
Se aade una arista entre los nodes $ y con atributo , si existe la regla $ en
P.
3. Se inverte el grafo, ms preciso:
Se intercambian los nodos $ y .
Se invierte la direccin de todas las aristas.
4. Se transforma el grafo obtenido en el conjunto de reglas P 0 :
Para cada arista entre A y B con atributo se crea una regla A B (A
0N , B 0N {} y T {}).
60
7.3.
Lema de bombeo
Siendo a b una expresin regular, podemos construir un autmata finito que acepta el lenguaje
as definido, tambin podemos construir para cualquier n IN fijo un autmata finito adecuado
(an bn sera una expresin regular extendida que define el lenguaje correspondiente que contiene
una sola palabra).
Pero no podemos construir un autmata finito que acepte el lenguaje:
Lab = {an bn | n IN} = {, ab, aabb, aaabbb, . . .}
donde el parmetro n no es fijo, sino se quiere que haya tantas as como bs.
Por qu no podemos construir tal autmata?
asumimos que tengamos un autmata finito M con k estados que acepta Lab
61
anotamos los estados de M despus de haber ledo las palabras ai para i = 0, . . . , k (son
k + 1 palabras)
pues sern (usando la ampliacin de la funcin ):
(q0 , ), (q0 , a), (q0 , aa), (q0 , aaa), . . . , (q0 , ak )
Entonces, un estado tiene que aparecer por lo menos dos veces (se llama principio de los
cajones (pigeonhole principle): si se quiere poner ms calcetines que hay cajones en los
cajones, por lo menos en un cajn acaban por lo menos dos calcetines)
es decir: (q0 , ai ) = (q0 , aj ) para algunos i 6= j
Entonces:
(q0 , ai bj ) = ( (q0 , ai ), bj )
= ( (q0 , aj ), bj )
= (q0 , aj bj ) F
pues, el autmata tambin acepta ai bj , i 6= j que no debe hacer. Una contradiccin!
Entonces asumimos mal, es decir, no existe un autmata que acepte Lab , o en otras palabras, Lab no es regular.
Observamos el comportamiento del siguiente autmata:
afdcpl
w0
w1
w2
w3
wk
=
=
=
=
...
=
110
110
010
110
010010
110 010010010
x
yk
10
10
10
10
z
Lema (de bombeo para lenguajes regulares): Sea L un lenguaje regular (infinito). Entonces
existe un n IN de tal manera que cada palabra w L con |w| n se puede dividir en tres
partes, w = xyz cumplindose las tres propiedades:
1. y 6=
2. |xy| n
3. para todos los k 0 : xy k z L
62
63
64
<
=
|xyz| porque es w
|xy 2 z| porque y tiene una longitud > 0
|xyz| + |y|
n2 + n porque si |xy| n tambin |y| n
n2 + 2n + 1
(n + 1)2
Eso es una contradiccin porque xy 2 z no puede ser una palabra cuya longitud es un nmero
cuadrado entre dos nmeros cuadrados consecutivos.
Entonces Lquad no puede ser regular.
Dos comentarios ms:
Este lema de bombeo solo garantiza una propiedad para lenguajes regulares, es decir, todos
los lenguajes regulares (infinitos) la tienen, pero pueden existir ms lenguajes que la tengan, o en otras palabras, pueden existir lenguajes L donde encontramos tal n y la divisin
de w en xyz con todas las propiedades, pero L no es regular.
65
8.
La clase de los lenguajes regulares es una clase de alguna manera muy robusta: hay muchas
posibilidades de describir los lenguajes y exhiben un gran nmero de propiedades de clausura,
como vemos ahora.
8.1.
66
Concatencin: L = L1 .L2 es regular, porque podemos construir una expresin regular para L,
teniendo las expresiones regulares para L1 y L2 , ms preciso: con L1 = L() y L2 = L()
tenemos L = L()
Clausura: L = L1 es regular, porque podemos construir una expresin regular para L, teniendo
la expresin regular para L1 , ms preciso: con L1 = L() tenemos L = L(() )
Complemento: L = L1 = L1 es regular, porque podemos construir, dado un AFD completo M1 que acepta L1 , un AFD M que acepta L simplemente invertiendo sus estados finales, es decir, los estados no finales de M1 sern los estados finales de M y los
finales se convierten en los no finales, entonces, si M1 = (, Q, , q0 , F ) construimos
M = (, Q, , q0 , Q F ).
Interseccin: L = L1 L2 es regular, porque con las reglas de DeMorgan obtenemos L =
L1 L2 = L1 L2 . Complemento y unin producen lenguajes regulares, como visto
antes. Dicha construccin es bastante laborosa, abajo vemos una construccin directa y
simple.
Diferencia: L = L1 L2 es regular, porque se puede expresar la diferencia como L = L1 L2 =
L1 L2 = L1 ( L2 ) y las operaciones usadas mantienen la regularidad.
En vez de usar la lgica booleana, es decir, aplicando las reglas de DeMorgan, se puede construir
directamente un autmata que acepta el lenguaje L = L1 L2 .
La idea principal es, simular en paralelo en un solo autmata (digamos autmata de producto)
las transiciones de los dos autmatas (por ejemplo finitos deterministas y completas) para L1 y
L2 .
Entonces sean M1 = (1 , Q1 , 1 , q1 , F1 ) y M2 = (2 , Q2 , 2 , q2 , F2 ) los dos AFDs completos
que aceptan L1 y L2 , es decir, L1 = L(M1 ) y L2 = L(M2 ).
Construimos el AFD completo M que acepta L = L1 L2 = L(M ) como
M = (, Q, , q0 , F )
donde
asumimos que = 1 = 2 , es decir, usamos solamente los smbolos comunes. Es fcil
eliminar en M1 y en M2 todas las dependencias de smbolos superflues antemano en caso
que haya.
Q = Q1 Q2 , es decir, el producto cartesiano de los estados de M1 y M2 .
es la funcin de transicin con
((p, q), ) = (1 (p, ), 2 (q, ))
para p Q1 , q Q2 y .
67
8.2.
68
8.3.
9.
69
Lab
Labc
Lpal
Ldup
=
=
=
=
{an bn | n 0}
{an bn cn | n 0}
{w | w {0, 1} , w = vv R }
{w | w {0, 1} , w = vv}
2
9.1.
70
71
Sea L un lenguaje libre de contexto y G = (N , T , P, $) una gramtica que genere L (es decir
L = L(G)).
La construccin sigue 5 pasos (asumimos que
/ L, eso remediamos al final):
1. eliminamos las variables intiles
2. modificamos las reglas para que no haya mezcla de variables y constantes en las partes
derechas de las producciones y para que todas las reglas con constantes tengan la forma
X
3. sustituimos las reglas cuya longitud de su parte derecha es > 2
4. sustituimos las reglas de tipo X
5. sustituimos las reglas de tipo X Y , las reglas unitarias.
Las gramticas despus de cada paso llamamos G = G0 , G1 , G2 , . . . , G5 = GF N C respectivamente.
Usamos la siguiente gramtica inicial
G0 = ({$, A, B, C, D, E, F }, {a, b, c}, P0 , $)
donde P0 contenga las siguientes producciones:
$
A
B
C
D
E
F
bDD | Ca | bc
B | aCC | baD
cBD | | AC
bD | aBA
CD | a | EF
Eb
a
72
a) para calcular N empezamos con aquellas variables que producen directamente sentencias (incluyendo ) y seguimos el uso de reglas con dichas variables para producir
as sucesivamente sentencias (o en otras palabras: seguimos las reglas desde el lado
derecho hacia el lado izquierdo para obtener as la informacin sobre las variables).
Una forma de realizar dicho recorrido es empezar con N = N y borrar del conjunto
todas aquellas variables que o bien directamente deriven una sentencia o bien lo hacen
indirectamente.
Se observa que solamente E es un smbolo no-generativo, es decir, N = {E}, P10
entonces es:
$
A
B
C
D
F
bDD | Ca | bc
B | aCC | baD
cBD | | AC
bD | aBA
CD | a
a
b) para calcular I empezamos con el smbolo inicial y veremos a cuales de las variables
se puede llegar directamente y seguimos el uso de reglas con dichas variables para
llegar as sucesivamente a nuevas variables (o en otras palabras: seguimos las reglas
para obtener as la informacin sobre las variables accesibles). Dicho algoritmo es
una exploracin de un grafo de dependencia parecido al algoritmo que vimos para
detectar estados no-accesibles en un autmata finito.
Se observa que solamente F es un smbolo inaccesible, es decir, I = {F }, P1 entonces es:
$
A
B
C
D
bDD | Ca | bc
B | aCC | baD
cBD | | AC
bD | aBA
CD | a
73
C
D
Wa
Wb
Wc
Wb D | Wa BA
CD | Wa
a
b
c
Entonces P2 solamente contiene reglas con partes derechas siendo , un smbolo terminal,
o una palabra de variables.
3. Sustituimos cada regla del tipo X Y1 Y1 . . . Yk con k > 2 por las reglas:
X Y1 X1
X1 Y2 X2
..
.
. ..
Xk3 Yk2 Xk2
Xk2 Yk1 Yk
Wb $1 | CWa | Wb Wc
DD
B | Wa A1 | Wb A2
CC
Wa D
Wc B1 | | AC
BD
Wb D | Wa C1
BA
CD | Wa
a
b
c
Entonces P3 solamente contiene reglas con partes derechas siendo , un smbolo terminal,
o una palabra de una o dos variables.
74
4. Eliminamos las reglas que producen , ojo! tenemos que distinguir entre variables que
solamente producen y aquellas que tambin producen .
Entonces, el paso se realiza en 3 partes:
Calculamos los conjuntos de variables
E = {V | V } (las variables que posiblemente producen ) y
E = {V | V y no existe V w con w 6= } E (las variables que solo
producen ).
Se calculan los conjuntos aplicando el mismo algoritmo que usamos en el primer
paso para detectar variables no-generativas.
Aadimos para cada regla del tipo X Y Z
X Y si Y
/ E y Z E
X Z si Y E y Z
/ E .
Eliminamos
todas las reglas de tipo X ,
todas las reglas de tipo X Y con Y E , y
todas las reglas de tipo X Y Z con Y, Z E .
En el ejemplo tenemos: E = {A, B, C1 }, E = , y por eso P4 es:
$
$1
A
A1
A2
B
B1
C
C1
D
Wa
Wb
Wc
Wb $1 | CWa | Wb Wc
DD
B | Wa A1 | Wb A2
CC
Wa D
Wc B1 | AC | C
BD | D
Wb D | Wa C1 | Wa
BA | A | B
CD | Wa
a
b
c
75
[
U=
Ui
i=1
$
$1
A
A1
A2
B
B1
C
C1
D
Wb $1 | CWa | Wb Wc
DD
B | Wa A1 | Wb A2
CC
Wa D
Wc B1 | AC | C
BD | D
Wb D | Wa C1 | Wa
BA | A | B
CD | Wa
76
Wa a
Wb b
Wc c
En el ejemplo tenemos:
U1
U2
U3
U4
=
=
=
=
{(A, B), (B, C), (B1 , D), (C, Wa ), (C1 , A), (C1 , B), (D, Wa )}
{(A, C), (B, Wa ), (B1 , Wa ), (C1 , C)}
{(A, Wa ), (C1 , Wa )}
Wb $1 | CWa | Wb Wc
DD
Wc B1 | AC | Wa A1 | Wb A2 | Wb D | Wa C1 | a
CC
Wa D
Wc B1 | AC | Wb D | Wa C1 | a
BD | CD | a
Wb D | Wa C1 | a
BA | Wa A1 | Wb A2 | Wc B1 | AC | Wb D | Wa C1 | a
CD | a
a
b
c
Observamos en la construccin:
En ningn paso hemos aadido variables intiles.
Si hemos borrado reglas, hemos asegurado que todas las variables siguen siendo tiles.
Despus de cada paso la gramtica resultante genera el mismo lenguaje, es decir, L(G0 ) =
L(G1 ) = . . . = L(G5 ).
Como se observa, la gramtica G5 es en forma normal de Chomsky.
77
9.2.
Veremos otra posible normalizacin de gramticas que nos sirve ms adelante para construir
cierto tipo de autmatas.
Una gramtica es en forma normal de Greibach (FNG) si
G (es decir, su N ) solamente contiene variables tiles
todas las producciones de G (es decir, en su P ) son de la forma X donde T
y N , es decir, todas las reglas tienen como primer smbolo en sus partes derechas un
smbolo terminal que es seguido por una palabra de variables.
(porque as no se podra derivar ) si $ (es decir, el smbolo inicial de G) no aparece al lado
derecho de una produccin, tambin est permitido que $ P
Obviamente cualquier gramtica en forma normal de Greibach es una gramtica libre de contexto
que se verifica directamente analizando la forma de producciones permitidas.
Una interesante propiedad es: para cualquier lenguaje libre de contexto existe una gramtica en
forma normal de Greibach, que genera el lenguaje.
78
La comprobacin de este hecho detallamos con la siguiente construccin, donde a partir de una
gramtica libre de contexto dada elaboramos una nueva gramtica en forma normal de Greibach.
Sea L un lenguaje libre de contexto y G = (N , T , P, $) una gramtica que genere L (es decir
L = L(G)).
La construccin sigue 4 pasos (asumimos que
/ L, eso remediamos al final):
1. construimos una gramtica equivalente en forma normal de Chomsky
2. sustituimos las reglas recursivas a la izquierda, es decir, reglas de tipo X XY ; eso
puede generar reglas con lados derechos mas
largos que dos
3. establecemos un orden en las variables, es decir N = {X1 , X2 , . . . , Xn } de tal manera
que todas las reglas sern de tipo Xi Xj con i < j, +
N
4. sustituimos las reglas que no tengan un smbolo terminal como primer smbolo en su parte
derecha.
Las gramticas despus de cada paso llamamos G = G0 , G1 , G2 , . . . , G4 = GF N G respectivamente.
Usamos la misma gramtica inicial como en el apartado anterior
G0 = ({$, A, B, C, D, E, F }, {a, b, c}, P0 , $)
donde P0 contenga las siguientes producciones:
$
A
B
C
D
E
F
bDD | Ca | bc
B | aCC | baD
cBD | | AC
bD | aBA
CD | a | EF
Eb
a
CWa | Wb $1 | Wb Wc
DD
AC | Wc B1 | Wa A1 | Wb A2 | Wb D | Wa C1 | a
CC
79
A2
B
B1
C
C1
D
Wa
Wb
Wc
Wa D
AC | Wc B1 | Wb D | Wa C1 | a
BD | CD | a
W b D | W a C1 | a
AC | BA | Wa A1 | Wb A2 | Wc B1 | Wb D | Wa C1 | a
CD | a
a
b
c
solo reordenado, para que aparezcan las partes derechas con variables al principio al comienzo de las listas.
2. Para cada produccin recursiva a la izquierda, es decir, regla de tipo X X con
X N y se realiza los siguientes 3 pasos:
se sustitue X X por X Y siendo Y una nueva variable
se aade las reglas Y Y |
para cada regla X se aade X Y si no comienza con X
En P1 hay una regla recursiva a la izquierda: A AC. Entonces, la sustituimos por
A CA3 , aadimos A3 CA3 | C y aadimos las dems reglas para A, y resulta el
conjunto P2 :
$ CWa | Wb $1 | Wb Wc
$1 DD
A CA3 | Wc B1 | Wa A1 | Wb A2 | Wb D | Wa C1 | a |
Wc B1 A3 | Wa A1 A3 | Wb A2 A3 | Wb DA3 | Wa C1 A3 | aA3
A1 CC
A2 Wa D
A3 CA3 | C
B AC | Wc B1 | Wb D | Wa C1 | a
B1 BD | CD | a
C Wb D | Wa C1 | a
C1 AC | BA | Wa A1 | Wb A2 | Wc B1 | Wb D | Wa C1 | a
D CD | a
Wa a
Wb b
80
Wc c
Entonces las reglas en P2 tienen de nuevo diferentes longitudes en sus partes derechas
(incluso puede ser que haya reglas unitarias).
3. (por incluir)
4. (por incluir)
Dado que con una gramtica en forma normal de Greibach se genera con cada produccin exactamente un smbolo terminal, cada palabra derivable con tal gramtica tiene una derivacin igual
a la longitud de la palabra.
Ojo, eso no significa que se puede encontrar una derivacin en tiempo lineal, porque es posible
que en un momento se puede aplicar ms de una regla.
9.3.
Igual como lo hemos visto para lenguajes regulares existe una propiedad que todos los lenguajes
libres de contexto cumplen:
Lema (de bombeo para lenguajes libres de contexto): Sea L un lenguaje libre de contexto
(infinito). Entonces existe un n IN de tal manera que cada palabra z L con |z| n se puede
dividir en cinco partes, z = uvwxy cumplindose las tres propiedades:
1. |vx| 1
2. |vwx| n
3. para todos los k 0 : uv k wxk y L
Idea de la comprobacin:
partimos de la FNC de la gramtica, es decir, las reglas son de las formas X Y Z o
X
el rbol para una palabra (suficientemente larga) ser un rbol binario
si |z| 2k+1 entonces el rbol tiene una altura por lo menos de k+1, es decir, se encuentran
k + 1 variables en un camino desde la raz hacia alguna hoja
entonces, si hay solamente k variables en el alfabeto N , se tiene que repetir una variable,
sea X, en un camino desde la raz hasta una hoja
81
10.
10.1.
82
Motivacin
Ya sabemos Lab = {an bn | n IN} no es regular (comprobamos con el lema de bombeo o con
el teorema de MyhillNerode).
Pero Lab es libre de contexto con la siguiente gramtica:
G = (N , T , P, $)
= ({$}, {a, b}, {$ a$b|}, $)
Otro ejemplo parecido es: expresiones matemticamente correctas de diferentes tipos de parntesis T = {[, ], h, i, (, )}, por ejemplo, ( ( ] ] ) i ) es incorrecto y [ ( [ ] ) h ( ) i ] es correcto.
L() = {w | w T , w es correcto}
es libre de contexto, con el sistema de producciones
P = {$ $$ | ($) | [$] | h$i | }
L() no es regular, porque ya [n ]n no es regular.
Podemos construir un tipo de autmata que acepta una palabra de L() ?
Idea: usamos una pila para memorizar lo que se ha ledo:
Las parntesis que abren ponemos en la pila.
Si vemos una parntesis que cierre la cima de la pila tiene que ser su homloga y la quitamos de la pila.
Al final, la pila tiene que estar vaca.
Eso era bastante fcil, ampliamos las posibilidades algo ms, permitimos
que el autmata pueda tener varios (nmero finito) estados (parecido a los AFD, pero
veremos que basta con un estado);
que el autmata sea no-determinista (veremos que habr una diferencia entre AFPDs y
AFPNDs);
que exista la posibilidad de transiciones ;
que acepte con pila vaca o con estados finales (veremos que ambas formas son equivalentes);
83
10.2.
84
=
=
=
=
=
=
=
{(q0 , ()}
{(q0 , h)}
{(q0 , [)}
{(q0 , )}
{(q0 , )}
{(q0 , )}
{(q1 , )}
Observa
que escribimos en las expresiones arriba el contenido de la pila como los rabes: desde la
derecha hacia la izquierda,
que el autmata no est completo, pero se podra completar aadiendo transiciones adecuados en un estado sin salida que ya no vara la pila.
Tambin podemos dibujar autmatas con pila, por ejemplo de la siguiente manera:
afp
Es decir, dibujamos el grafo parecido como lo hemos hecho para los AFND-: los vrtices del
grafo representan los estados del autmata y las aristas representan las transiciones. Ampliamos
las etiquetas de las aristas con los cambios en la cima de la pila.
Podemos pensar de un autmata con pila como un dispositivo que lee desde una cinta con smbolos, realiza cambios de estados internamente, y maneja una pila de la forma descrita:
autopila
Otro ejemplo; construimos un AFP para el lenguaje
LvvR = {w | w {0, 1} , w = vv R }
es decir, los palndromos con longitud par.
Idea:
Adivinamos (no-determinismo) dnde acaba v.
85
=
=
=
=
=
=
{(q0 , 0)}
{(q0 , 1)}
{(q1 , )}
{(q1 , )}
{(q1 , )}
{(q2 , )}
afpvv
Cmo comprobamos que es correcto?
Dado que el contenido de la pila influye en el comportamiento del autmata necesitamos una
notacin para describir los clculos del autmata.
La configuracin (o descripcin instantnea) C de un AFP M = (, , Q, , q0 , c0 , F ) es la
tripla (q, u, v) donde
q Q es el estado actual
u es lo que queda por leer de la entrada
v es el contenido actual de la pila
La configuracin inicial C0 entonces es (q0 , w, c0 ).
Si el autmata est en configuracin C podemos definir que es una posible siguiente configuracin, es decir, despus de haber realizado un paso en el clculo.
C 0 = (q 0 , u, zv) es configuracin sucesora de C = (q, u, v) (es decir, es el siguiente
smbolo de la entrada y la cima de la pila), si (q 0 , z) (q, , ) y, para las transiciones ,
C 0 = (q 0 , u, zv) es configuracin sucesora de C = (q, u, v) (es decir, no se lee un smbolo de
la entrada y la cima de la pila), si (q 0 , z) (q, , ).
86
(q0 , v R , v R #)
(q1 , v R , v R #)
(q1 , , #)
(q2 , , )
es decir, hemos encontrado un clculo y con eso sabemos que LvvR L(MvvR ).
Luego comprobamos que MvvR solamente acepta palabras en LvvR .
(por incluir)
10.3.
87
Equivalencia entre AFPNDs aceptando con pila vaca y aceptando en estado final
Para cada AFPND M que acepta con pila vaca existe un AFPND M 0 que acepta en estado final.
Idea de la comprobacin:
M 0 simula M
M 0 usa un nuevo smbolo c00 como smbolo inicial de la pila
si despus de la simulacin de M dicho c00 est en la cima de la pila, M 0 sabe que M
hubiese aceptado, es decir, M 0 acepta tambin yiendo a un estado final.
Para el ejemplo de antes
LvvR = {w | w {0, 1} , w = vv R }
con el siguiente autmata que acepta con pila vaca
afpndpv
obtenemos el nuevo autmata que acepta en estado final
afpndefpv
En general:
M = (, , Q, , q0 , c0 , )
M 0 = (, {c00 }, Q {q00 , f }, 0 , q00 , c00 , {f })
con
q00 , f
/ Q, es decir, son nuevos estados
c00
/ , es decir, es un nuevo smbolo inicial
0 (q00 , , c00 ) = {(q0 , c0 c00 )}, es decir, la primera transicin apila el antiguo smbolo inicial y
se va al antiguo estado inicial sin leer nada de la entrada
q Q, , : 0 (q, , ) = (q, , ), 0 (q, , ) = (q, , ), es decir, se simula
M
q Q : 0 (q, , c00 ) = {(f, c00 )}, es decir, si la pila solamente contiene el nuevo smbolo
inicial se va al estado final.
Para cada AFPND M que acepta en estado final existe un AFPND M 0 que acepta con pila vaca.
Idea de la comprobacin:
88
M 0 simula M
M 0 vaca desde cualquier estado final de M su pila
tenemos que tener cuidado si M no termina en estado final, pero su pila est vaca: colocamos antes de la simulacin un nuevo smbolo c00 como smbolo inicial en la pila que no
se toca durante la simulacin de M .
Para el ejemplo
L = {ai bj | j i}
con el siguiente autmata que acepta en estado final
afpndef
(Primero observamos la consecuencia de la definicin de un clculo:
M acepta w (q0 , w, c0 ) p (f, , v)
entonces, si sobran bs la pila estar vaca y no habr transicin ninguna, y por eso no llegamos a
con la entrada.)
Siguiendo la idea, obtenemos el nuevo autmata que acepta con pila vaca
afpndpvef
En general:
M = (, , Q, , q0 , c0 , )
M 0 = (, {c00 }, Q {q00 , q 0 }, 0 , q00 , c00 , )
con
q00 , q 0
/ Q, es decir, son nuevos estados
c00
/ , es decir, es un nuevo smbolo inicial
0 (q00 , , c00 ) = {(q0 , c0 c00 )}, es decir, la primera transicin apila el antiguo smbolo inicial y
se va al antiguo estado inicial sin leer nada de la entrada
{c00 } : 0 (q 0 , , ) = {(q 0 , )}, es decir, una vez en estado q 0 se vaca la pila sin
modificar la entrada
q Q, , : 0 (q, , ) = (q, , ), es decir, pasos normales de la simulacin
q Q F, : 0 (q, , ) = (q, , ), es decir, se simula tambin las transiciones
mientras M no est en estado final
q F, : 0 (q, , ) = (q, , ) {(q 0 , )}, es decir, saltamos al estado que vaca la
pila si ya estamos en estado final
10.4.
89
Para cada gramtica libre de contexto G existe un autmata finito con pila no-determinista M
que acepta el mismo lenguaje, es decir, L(M ) = L(G).
La comprobacin es constructiva.
Sea G = (T , N , P, $) una gramtica libre de contexto.
Podemos convertir la gramtica en su forma normal de Greibach (FNG), es decir todas las producciones son del tipo: A con T y N o la produccin es $ si
L(G).
Construimos un AFPND M = (T , N , {q}, , q, $, ), (es decir, con un slo estado) que acepta
con pila vaca, donde
(q, ) (q, , A)
siempre que A sea una produccin en P y
(q, $) (q, , )
siempre que $ sea una produccin en P .
Entonces, el autmata simula en un clculo la aplicacin de las reglas de la gramtica siempre
siguiendo la derivacin ms a la izquierda para la palabra en cuestin.
Ejemplo:
G = ({a, b}, {$, A, B, C}, P, $)
con
P = {$ aBBC, A aAA|b, B bBAC|b, C b}
que ya est en forma formal de Greibach, entonces el AFPND es:
M = ({a, b}, {$, A, B, C}, {q}, , q, $, )
con
(q, a, $)
(q, a, A)
(q, b, A)
(q, b, B)
(q, b, C)
=
=
=
=
=
{(q, BBC)}
{(q, AA)}
{(q, )}
{(q, BAC), (q, )}
{(q, )}
90
Para cada autmata finito con pila no-determinista M existe una gramtica libre de contexto G
que genera el mismo lenguaje, es decir, L(G) = L(M ).
La comprobacin es constructiva.
Sea M = (, , Q, , q0 , c0 , F ) un AFPND.
Si F 6= podemos convertir el autmata en un AFPND que acepte con pila vaca.
Luego podemos asumir que todas las transiciones del autmata como mucho apilan dos smbolos a la pila, porque podemos introducir estados intermedios que apilan poco a poco todos los
smbolos necesarios sin leer ms de la entrada, en concreto,
sea (q, v) (p, , ) con v = 1 2 . . . k , , y k > 2 una transicin de tal tipo
aadimos los nuevos estados q1 , q2 , . . . , qk2 a Q y sustituimos la transicin por
(p, , )
(q1 , , k1 )
...
(q, 1 2 ) (qk2 , , 2 )
(q1 , k1 k )
(q2 , k2 k1 )
Observa que podemos realizar tal sustitucin igual en caso que el autmata ejecute una
transicin- (es decir, arriba no se lee de la entrada sino ); entonces, para simplificar
escribimos 0 si leemos o bien un smbolo o bien .
Entonces, asumimos que tengamos un AFPND que acepta con pila vaca y que apile en una
transicin como mucho dos smbolos a la vez.
Construimos una gramtica libre de contexto G = (, N , P, $), es decir, con los mismos smbolos de entrada, y donde
N est formado por las triplas [p, A, q] siendo p, q Q y A , y el smbolo $.
P es el conjunto de producciones donde aadimos
para cada estado q Q las reglas $ [q0 , c0 , q]
para cada transicin (q, ) (p, 0 , ) la regla [p, , q] 0
para cada transicin (q, 1 ) (p, 0 , ) y cada estado r Q las reglas [p, , r]
0 [q, 1 , r]
para cada transicin (q, 1 2 ) (p, 0 , ) y cada par de estados r, s Q las reglas
[p, , r] 0 [q, 1 , s][s, 2 , r]
91
10.5.
Los AFPND, como el propio nombre ya dice, no son deterministas, es decir, pueden existir varias posibles configuraciones siguientes, o en otras palabras, (q, , ) o (q, , ) son conjuntos
conposiblementems de un elemento.
Para que un AFPND acepte una palabra de entrada w se ha exigido solamente la existencia de un
clculo que lee toda la palabra w y termina con pila vaca o en un estado final.
Este hecho no es adecuado en la prctica, porque de alguna manera hay que comprobar todos
los posibles clculos para ver si existe uno que acepta. Por eso limitamos los autmatas para que
sean deterministas.
Podemos definir un autmata finito con pila determinista AFPD
M = (, , Q, , q0 , c0 , F )
igual que un AFPND introduciendo las siguientes restricciones
92
11.
11.1.
93
11.2.
94
11.3.
12.
95
12.1.
R1: Quadrado.
P2: Enumera y comenta brevemente 3 situaciones en el contexto de la informtica dnde el uso
de lenguajes formales y sus autmatas correspondientes es til.
R2:
Verificacin de la sintaxis correcta de cadenas de smbolos (p.ej.: direcciones de correo
electrnico, nmeros reales en programas, ficheros HTML o XML).
Desarrollo de algoritmos (p.ej.: algoritmo para la bsqueda de una palabra (con o sin comodines) en un texto)
Especificaciones de entradas/ficheros vlidas.
Comprobacin si un problema es computable o no lo es.
Verificacin de sistemas basados en estados (p.ej.: un semforo en un cruce). Ojo, aqu hay
que trabajar con palabras de longitud posiblemente infinita.
Compilacin de programas.
Diagramas de estados en lenguajes de modelado (por ejemplo UML).
y mucho, mucho ms...
12.2.
96
P1: Dado dos lenguajes L1 y L2 sobre el alfabeto = {a, b, c}. Anotamos con L1 L2 la unin,
con L1 L2 la interseccin, con L1 el complemento, y con L1 L2 la diferencia. Verifica o
contradice:
L1 = L1
L1 L2 = L1 L2
L1 L2 = L1 L2
L1 .L2 = L2 .L1
R1: Si L1 y L2 son lenguajes sobre un alfabeto , entonces L1 y L2 (por definicin).
Adems sabemos por definicin:
L1 L2 = {w | w L1 y w L2 }
L1 L2 = {w | w L1 o w L2 }
L1 = {w | w
/ L1 }
L1 L2 = {w | w L1 y w
/ L2 }
Entonces si usamos la definicin de la diferencia con L1 como y L2 como L1 , tenemos
L1 = {w | w y w
/ L1 } = {w | w
/ L1 } = L1 . Usamos una tabla de pertenencia para
alguna palabra w para comprobar la segunda y tercera equacin (Leyes de De Morgan):
L1
L2
L1
L2
L1 L2
L1 L2
L1 L2
L1 L2
L1 L2
L1 L2
Y vemos que las columnas correspondientes son iguales. Para la ltima construimos un contraejemplo: Sea L1 = {a} y L2 = {b}, entonces L1 .L2 = {ab} y L2 .L1 = {ba} y dichos conjuntos
no son iguales, entonces la equacin es incorrecta.
P2: Construye un autmata finito determinista que acepta el lenguaje L que contiene todas las
palabras (finitas) sobre el alfabeto {0, 1} con un nmero par de 0s y un nmero impar de 1s.
R2: M = ({0, 1}, {a, b, c, d}, , a, {b}) con segn el grafo:
0
a
0
1
1
b 0
1
1
12.3.
97
P1: Calcula, paso a paso, el resultado de la funcin para el autmata de la hoja anterior y la
palabra de entrada w = 0100110, es decir, (a, w).
R1:
(a, 0100110) =
=
=
=
=
=
=
es decir, el AFD acepta la palabra, dado que b es un estado final del AFD.
P2: Escribe la tabla para la funcin de transicin del AFND con el siguiente grafo:
0,1
1
0,1
0,1
c
d
0
Calcula, paso a paso, el resultado de la funcin para este autmata y la palabra de entrada
w = 0100110, es decir, (a, w). Averigua una palabra sobre {0, 1} que el autmata no acepta.
R2:
0
1
= a {a} {a, b}
b {c, d} {c}
c {d}
{d}
?d
(a, 0100110) =
(r, 100110) =
r(a,0)
[
r(a,1)
=
=
r{a}
r{a,b}
(r, 0110)
r(a,0)
r{a}
(r, 00110) =
(r, 0110)
(r, 0110)
r(c,0)
[
r{d}
(r, 0110)
98
r(d,0)
(r, 110)
r{a}
(r, 10) =
(r, 0)
(r, 0)
r(c,1)
(r, 0)
r{a,b}
r{a,b}
r(a,1)
[
r(a,1)
(r, 0)
r{d}
[
r{a}
r(b,0)
(r, )
(r, )
r{c,d}
r(d,0)
(r, )
12.4.
99
P1: Convierte el AFND de la hoja anterior en un autmata finito determinista. Incluye en tu solucin la tabla de conversin tal como lo vimos en clase, la quntupla del AFD obtenido finalmente,
y su grafo.
R1: La tabla del AFND es:
0
1
= a {a} {a, b}
b {c, d} {c}
{d}
c {d}
?d
= a
a, b
? a, c, d
a, b, c
? a, d
? a, b, d
? a, b, c, d
0
a
a, c, d
a, d
a, c, d
a
a, c, d
a, c, d
1
0
a, b
= A A
a, b, c
B C
a, b, d
?C E
y con estados renombrados
a, b, c, d
D C
a, b
?E A
a, b, c
?F C
a, b, c, d
?G C
1
B
D
F
G
B
D
G
La quntupla es MAF D = ({0, 1}, {A, B, C, D, E, F, G}, , A, {C, E, F, G}) con segn la tabla
arriba y el grafo (sin estado inicial marcado, se ha hecho con la herramienta graphviz):
12.5.
100
P1: Convierte el siguiente AFND- en un AFND (incluye todas las tablas, grafos, quntuplas, y
el clculo de la clausura transitiva necesario). El estado inicial es el estado 1.
R1: Quntupla del AFND-: M = ({a, b}, {1, 2, 3, 4, 5, 6}, , 1, {2, 4}), con segn tabla:
= 1
?2
3
?4
5
6
a
{6}
{3}
{4}
{3}
{2}
{2}
{6}
{3, 5}
{5} {4}
Clculo de la clausura-:
T0
T1
T2
T3
=
=
=
=
T? =
{(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}
{(1, 2), (3, 6), (6, 4)}
{(3, 4)}
Ti = {(1, 1), (1, 2), (2, 2), (3, 3), (3, 4), (3, 6), (4, 4), (5, 5), (6, 4), (6, 6)}
i=0
1
2
3
4
5
6
a
{6}
{3}
{4}
{3}
{2}
{2}
{6}
{3, 5}
{5} {4}
cl
{1, 2}
{2}
{3, 4, 6}
{4}
{5}
{4, 6}
a
b
{3, 6} {2}
{3}
{2}
{4} {3, 5}
{3, 5}
{3}
{3, 5}
a
b
{3, 4, 6}
{2}
{3, 4, 6}
{2}
{4}
{3, 4, 5, 6}
{3, 4, 5, 6}
{3, 4, 6}
{3, 4, 5, 6}
Se observa que hay un estado final de M en la clausura- del estado inicial, por eso hay que
aumentar el conjunto de estados finales!
101
Resulta la quntupla del AFND: M 0 = ({a, b}, {1, 2, 3, 4, 5, 6}, , 1, {1, 2, 4}), con segn tabla:
a
b
= ? 1 {3, 4, 6}
{2}
{2}
? 2 {3, 4, 6}
{4}
{3, 4, 5, 6}
3
?4
{3, 4, 5, 6}
5 {3, 4, 6}
6
{3, 4, 5, 6}
y el grafo:
12.6.
102
Como se ve sin grandes dificultades, se puede unir los estados del mismo color en uno (eliminando as muchas de las transiciones ):
12.7.
103
P1: Determina una expresin regular que define el mismo lenguaje aceptado por el autmata de
la Hoja 5, digamos M , es decir, se tiene que cumplir L() = L(M ). Documenta tu construccin
suficientemente (tienes dos lados de una hoja).
R1: Primero tenemos que construir un AFD a partir del AFND (usamos para la contruccin de
la tabla del AFD como nombres de los estados la concatenacin de cifras correspondientes y
renombramos despus convenientemente):
AFND
a
b
= ? 1 {3, 4, 6}
{2}
{2}
? 2 {3, 4, 6}
3
{4}
{3, 4, 5, 6}
{3, 4, 5, 6}
?4
5 {3, 4, 6}
{3, 4, 5, 6}
AFD
a
b
= ? 1 346
2
? 346 4 3456
? 2 346
2
? 4 3456
? 3456 346 3456
AFD (renombrado)
a
b
= ? 0 1
2
4
?1 3
?2 1
2
4
?3 5
?4 1
4
5 5
5
104
Eliminado estado 3, unidas las aristas paralelas, y aadido las aristas para eliminar estado
2, se obtiene:
Eliminado estado 2, unidas las aristas paralelas, y aadidos las aristas para eliminar estado
4, se obtiene:
Eliminado estado 4, unidas las aristas paralelas, y aadido las aristas para eliminar estado 1, se
obtiene:
12.8.
105
=
=
=
=
=
=
=
=
R8
R9
R10
R11
R12
=
=
=
=
=
Rn =
{(a, a), (b, b), (c, c), (d, d), (e, e), (f, f ), (g, g), (h, h)}
{(a, d), (b, e), (c, a), (d, b), (e, c), (f, g), (g, h)}
{(a, b), (b, c), (c, d), (d, e), (e, a), (f, h)}
{(a, e), (b, a), (c, b), (d, c), (e, d)}
{(a, c), (b, d), (c, e), (d, a), (e, b)}
{(a, a), (b, b), (c, c), (d, d), (e, e)}
{(a, d), (b, e), (c, a), (d, b), (e, c)}
{(a, b), (b, c), (c, d), (d, e), (e, a)}
para n > 7
R3
R4
R5
R6
R7
es decir
R(n3) mod 5+3
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
106
(15)
(16)
12.9.
107
R1: Los estados i y d no son alcanzables desde el estado inicial a, se eliminan. Se observa que
el autmata restanto est completo y conexo. La tabla de minimizacin se desarrolla como sigue
con los siguientes comentarios i) los ndices indican en que paso se ha marcado la casilla, ii) en la
segunda tabla se resume el anlisis de las parejas, las parejas en negritas son aquellas que ya han
sido marcados, iii) la columna de marca indica la marca puesta para la pareja correspondiente,
iv) la columna de lista contiene las entradas pendientes cuando en algn caso no se marca nada:
a
b
?c
e
f
g
h
a b
- X1
-
?c
X0
X0
-
e
X7
X4
X0
-
f
X2
X5
X0
X8
-
g
X6
X6
X0
X9
X11
-
h
X3
X7
X0
X10
X12
-
pareja
(a, b)
(a, e)
(a, f )
(a, g)
(a, h)
(b, e)
(b, f )
(b, g)
(b, h)
(e, f )
(e, g)
(e, h)
(f, g)
(f, h)
(g, h)
0
1
(b, g) (f , c)
(b, h) (f, f )
(b, c) (f, g)
(b, g) (f, e)
(b, c) (f, g)
(g, h) (c, f )
(g, c) (c, g)
(g, g) (c, e)
(g, c) (c, g)
(h, c) (f, g)
(h, g) (f , e)
(h, c) (f, g)
(c, g) (g, e)
(c, c) (g, g)
(g, c) (e, g)
marca
X1
X7
X2
X6
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
lista
(a, g)
(a, e)
(a, g)
108
Entonces la pareja (f, h) marca dos estados equivalentes y el AFD mnimo es (con estado inicial
a):
P2: Determina el Indice(RL ) del lenguaje definido por una expresin regular sobre el alfabeto
{a, b, c} que define todas las palabras que tengan por lo menos dos as consecutivas o por lo
menos dos bs consecutivas (mira hoja 6 si quieres).
R2: Para hallar dicho Indice(RL ) construimos un AFD mnimo equivalente a la expresin regular (a + b + c) (aa + bb)(a + b + c) (cual define el lenguaje). Se observa que se pueden construir
fcilmente automtas para las tres partes de la E.R. siendo 0 el estado inicial (la primera es igual
a la tercera):
(a + b + c)
aa + bb
Concatenando los tres autmatas correspondientes y uniendo ya los estados unidos por transiciones tal como visto en la hoja 6, se obtiene un AFND equivalente a la E.R.:
a
b
c
a
= 0 0, 1
0, 2
0
= A B
0
0, 1 0, 1, 3 0, 2
B D
0, 2 0, 1 0, 2, 3 0 y con estados renombrados
C B
? 0, 1, 3 0, 1, 3 0, 3 0, 3
?D D
? 0, 2, 3 0, 3 0, 2, 3 0, 3
?E F
0, 3 0, 3
? 0, 3 0, 3
?F F
b
C
C
E
F
E
F
c
A
A
A
F
F
F
109
A B
- X1
-
pareja
(A, B)
(A, C)
(B, C)
(D, E)
(D, F )
(E, F )
C
X2
X3
-
a
(B, D)
(B, B)
(D, B)
(D, F )
(D, F )
(F, F )
?D
X0
X0
X0
-
?E
X0
X0
X0
?F
X0
X0
X0 con la siguiente anlisis de parejas
b
c
(C, C) (A, A)
(C, E) (A, A)
(C, E) (A, A)
(F, E) (F, F )
(F, F ) (F, F )
(E, F ) (F, F )
marca lista
X1
X2
X3
(D, E)
(D, E)
Se observa que los estados D, E, y F son equivalentes entre si, y el AFD mnimo es:
12.10.
110
P1: Construye una gramtica lineal por la izquierda que genera el mismo lenguaje que define la
expresin regular (a + b + c) (aa + bb)(a + b + c) . (Ayuda: puedes aprovechar de resultados de
la hoja 9).
R1: Usamos el AFD de la hoja 9 (con el estado DEF renombrado y usando un hexgono para
marcar el estado inicial):
G = (N , T , P, $)
= ({A, B, C, D}, {a, b, c}, P, A)
P = {A aB | bC | cA, B aD | a | bC | cA, C aB | bD | b | cA,
D aD | a | bD | b | cD | c}
Observamos que el smbolo inicial A aparece a la derecha de algunas producciones, por eso
aadimos un nuevo smbolo E para sustituirlo:
G = (N , T , P, $)
= ({A, B, C, D, E}, {a, b, c}, P, A)
P = {A aB | bC | cE, B aD | a | bC | cE, C aB | bD | b | cE,
D aD | a | bD | b | cD | c, E aB | bC | cE, }
Construimos a partir de la gramtica el grafo correspondiente:
Invertimos el grafo:
111
12.11.
112
P1: Construye una gramtica libre de contexto G que genera todas las palabras sobre el alfabeto
{a, b} que tienen el mismo nmero de as y bs, es decir,
L(G) = {, ab, ba, aabb, abab, baab, abba, baba, bbaa, aaabbb, aababb, . . .}
R1: Usamos un argumento recursivo para encontrar la gramtica. Si w = , entonces tiene cero
as y cero bs (entonces usamos la produccin $ ). Sea w una palabra con tantas as como
bs y |w| > 0. Entonces podemos subdividir w en cuatro partes: o bien en w = axby o bien en
w = bxay donde tanto x como y son palabras (ms cortas que w) que tienen tantas as como bs.
Nota que x y/o y pueden ser .
Eso nos lleva a la siguiente gramtica:
12.12.
113
P1: Construye un autmata finito de pila no-determinista (AFPND) que acepta las mismas palabras que genera la gramtica de la hoja 11, apartado 2.
R1: Construimos un AFPND que acepta en estado final. La idea principal es: usamos la pila para
contar la diferencia entre el nmero de as y bs. Para distinguir los casos de tener ms as que
bs o, al revs, ms bs que as usamos los estados.
Entonces necesitamos 4 estados que llamamos A, B, 0, y f :
Si estamos en el estado A (contando las as dems):
apilamos cada a en la pila, y
para cada b quitamos una a de la pila, si hay tal a, y
si encontramos una b sin a en la pila, apilamos la b y vamos al estado B (ya que
tenemos una b dems).
Si estamos en el estado B (contando las bs dems):
apilamos cada b en la pila, y
para cada a quitamos una b de la pila, si hay tal b, y
si encontramos una a sin b en la pila, apilamos la a y vamos al estado A (ya que
tenemos una b dems).
Usamos el estado 0 como estado inicial para realizar una transicin a A o a B dependiendo
si el primer smbolo es una a o una b.
Si estamos en A y hay una a en la pila hacemos una transicin al estado final.
Si estamos en B y hay una b en la pila hacemos una transicin al estado final.
Con estos argumentos el AFPND ser:
M = ({a, b}, {#, a, b}, {0, A, B, f }, , 0, #, {f })
(0, a, #) = (A, a#)
(0, b, #) = (B, b#)
(A, a, #) = (A, a#)
(A, a, a) = (A, aa)
(A, b, #) = (B, b#)
114
(A, b, a) = (A, )
(A, , a) = (f, a)
(B, b, #)
(B, b, b)
(B, a, #)
(B, a, b)
(B, , b)
=
=
=
=
=
(B, b#)
(B, bb)
(A, a#)
(B, )
(f, b)
Hemos usado la barra vertical para separar las diferentes transciones posibles entre parejas de
estados. El hexgono marca el estado inicial.
Observa: al final, la pila contiene justamente la diferencia de smbolos, es decir, o bien las as o
bien las bs que sobran.
Este AFPND es una posibilidad, hay muchsimas ms posibilidades incluso transformaciones
algortmicas de gramtica libre de contexto a autmata de pila.
12.13.
115
12.14.
116
12.15.
117
P1: Si un autmata acepta la palabra , entonces el estado inicial es un estado final. Es verdad?
R1: Depende: para los AFD y AFND, vistos hasta ahora en clase, es verdad; si permitimos
transiciones no lo es. Miramos los AFD y los AFND: obviamente si el estado inicial es un
estado final, tal autmata acepta , y al revs, si el estado inicial no es un estado final, entonces
no acepta , dado que (q0 , ) = q0 .
P2: Construye un autmata finito que acepta un texto (que no es nada ms que una palabra larga
sobre algn alfabeto) si en l aparece tu nombre.
R2: Asumimos un alfabeto adecuado, p.ej. los caracteres imprimibles de la tabla del cdigo
ASCII. Un AFND que acepta el nombre Arno sera:
12.16.
118
P1: Construye un autmata finito determinista (AFD) que acepta todas las palabras w sobre el
alfabeto {0, 1, 2} que son divisibles por 5 si se interpreta w como un nmero en la base 3.
R1:
2
1
1
1
0
2
0
2
1
1
0
12.17.
119
P1: Convierte el autmata del examen de TALF de Junio 2008 en su pregunta 1 en un autmata
finito determinista. Incluye en tu solucin las tablas tal como lo vimos en clase.
(Sugerencia: aprovecha de la Semana Santa para realizar ms ejercicios de antiguos exmenes.)
R1:
a b
0 2 - 1
1 4 1 2 - 3 5
3 4,5 - 4 5 - 2
5 - 4 -
cl-
0,1
1
2,5
3
2,4,5
5
a
b
2,4 1
4
1
- 3,4
4,5 5 3,4
4
a
2,4,5
2,4,5
2,4,5
5
-
b
1
1
2,3,4,5
2,3,4,5
2,4,5
Dado que 1 (siendo estado final) est en la clausura- del estado inicial, el estado inicial tambin
se convierte en estado final.
a
0
2,4,5
5
2,4,5
1
2,4,5
5
2,3,4,5 2,4,5
b
1
2,3,4,5
1
2,4,5
2,3,4,5
12.18.
120
P1: Construye un AFD mnimo para la siguiente expresin regular: (a(ba) (a + b) + c(ab) )
que define un lenguaje sobre {a, b, c}.
Hay diferentes formas de contestar:
1. Se construye un AFND- succesivamente segn visto en la comprobacin que EE.RR.
definen lenguajes regulares. Dicho autmata grande se convierte en AFND, luego en AFD,
(luego en AFD completom sino ya est), y se minimiza.
2. Se construye un AFND- succesivamente segn visto en la comprobacin que EE.RR.
definen lenguajes regulares. Antes de la conversin a AFND, se unifica estados que obviamente son equivalentes. As el AFND- se reduce considerablemente.
3. Se observa: (ba) (a + b) (a + b) . Con eso: (a(ba) (a + b) + c(ab) ) (a(a + b) +
c(ab) ). Y luego se puede construir directamente (en este caso fcil) un AFD completo
a,b
b,c
a,c
4
a,b,c
12.19.
121
P1: Transforma la siguiente gramtica lineal por la derecha en una gramtica lineal por la izquierda:
G = ( {$, A, B, C}, {a, b, c},
{$ aA | bB, A a$ | cC | a, B bB | c, C cC | c$ | b}, $
Sustituimos primero $ a la derecha:
G = ( {$, $0 , A, B, C}, {a, b, c},
{$ aA | bB, $0 aA | bB,
A a$0 | cC | a, B bB | c, C cC | c$0 | b}, $
b
a
a
C
b
a
c
$
b
a
a
C
b
a
c
$
Leemos la gramtica:
G = ( {$, $0 , A, B, C}, {a, b, c},
{$ Aa | Bc | Cb, $0 Cc | Aa,
A $0 a | a, B Bb | b | $0 b, C Cc | Ac}, $
12.20.
122
$
A
B
C
D
aAb | bB | DD
a$ | cC | a
bBB | c | A
cC | c$ | b | DDCa
$
A
B
C
D
Wa
Wb
Wc
Wa AWb | Wb B | DD
Wa $ | Wc C | Wa
Wb BB | Wc | A
Wc C | Wc $ | Wb | DDCWa
a
b
c
123
Wa $1 | Wb B | DD
AWb
Wa $ | Wc C | Wa
Wb B1 | Wc | A
BB
Wc C | Wc $ | Wb | C1 C2
DD
CWa
a
b
c
Paso 4: Eliminar producciones nulas: iteramos sobre las variables para detectar aquellas que
posiblemente producen . Las detectamos en el orden reflejado en el conjunto: E = {D, $, C1 }
de las cuales D y C1 solamente generan , entonces E = {D, C1 }. Notamos que $ E, por eso
habr paso 6. Obtenemos P40 :
$
$1
A
B
B1
C
C2
Wa
Wb
Wc
Wa $1 | Wb B
AWb
Wa $ | Wc C | Wa
Wb B1 | Wc | A
BB
Wc C | Wc $ | Wb | Wc | C2
CWa
a
b
c
124
Obtenemos P50 (observa que hay que eliminar la variable C2 que ya no es accesible):
$
$1
A
B
B1
C
Wa
Wb
Wc
Wa $1 | Wb B
AWb
Wa $ | Wc C | a
Wb B1 | c | Wa $ | Wc C | a
BB
Wc C | Wc $ | b | c | CWa
a
b
c
Wa $1 | Wb B |
Wa $1 | Wb B
AWb
Wa $0 | Wc C | a
Wb B1 | c | Wa $0 | Wc C | a
BB
Wc C | Wc $0 | b | c | CWa
a
b
c
$
$0
$1
A
B
B1
C
Wa
Wb
Wc
12.21.
125
126
p
p
p
p
p
p
13.
127
Bibliografa
13.1.
Bibliografa bsica
13.2.
1. http://es.wikipedia.org/wiki/Teor%C3%ADa_de_aut%C3%B3matas
13.3.
1. A. Snchez Lpez. Teora de Autmatas y Lenguajes Formales. Apuntes de clase, comunicacin personal, 2004.
2. R. Fernndez Muoz. Teora de Autmatas y Lenguajes Formales. Proyecto fin de carrera,
INX-380, Biblioteca de la Universidad de Vigo, Campus Ourense, 2003.
3. G. Hotz, K. Estenfeld. Formale Sprachen. B.I. Wissenschaftsverlag, ISBN 3-411-01626,
1981.
4. Th. Schwentick. Theoretische Informatik. Vorlesungsfolien, Internet, comunicacin personal, 2004.
5. Uwe Schnfeld. Theoretische Informatik kurz gefasst. B.I. Wissenschaftsverlag, ISBN 3411-15641-4, 1992.