You are on page 1of 118

Elementos de Teoría de la Medida,

Análisis Funcional y Teoría de


Distribuciones

Thelma: Mr. Dodd, how do you occupy your leisure?


Dodd: Mrs. Cherie, all the excitement, the romance, the adventure that I
want I find in my own way.
Thelma: Your own way?
Dodd: Well, if you must know, in the science of mathematics.
Thelma: Wow, fascinating.
(Stand–in, Tay Garnett, 1937).

La Teoría de la Medida, el Análisis Funcional y la Teoría de Distribu-


ciones proporcionan los cimientos necesarios para diseñar el marco fun-
cional apropiado bajo el que se desarrolla la teoría débil de las ecuaciones
en derivadas parciales. A lo largo de éste y de los siguientes capítulos se-
rán extensamente discutidos los aspectos más relevantes que estas teorías
aportan al estudio de los espacios de Lebesgue y de Sobolev, así como a
la construcción y al sentido matemático de las soluciones de diversos pro-
blemas de valores iniciales y de contorno.

Medibilidad
Comenzamos revisando algunas propiedades básicas relacionadas con la
medibilidad de conjuntos y funciones.

Definición 1. Sea Σ una familia de subconjuntos de un conjunto Ω. Deci-


mos que Σ es una σ–álgebra sobre Ω si satisface las siguientes propiedades:

1
2

(a) Ω ∈ Σ.

(b) Si A ∈ Σ entonces Ac ∈ Σ, donde Ac denota el conjunto complemen-


tario de A en Ω.

(c) Si An ∈ Σ para todo n ∈ N, entonces ∞ n=1 An ∈ Σ; es decir, Σ es


S

cerrada para uniones infinitas numerables.

Las propiedades (a), (b) y (c) conducen inmediatamente al hecho de


que

(d) ∅ = Ωc ∈ Σ

(e) Σ es también cerrada para intersecciones infinitas numerables, es de-


cir: si An ∈ Σ para todo n ∈ N, entonces
∞ ∞
[ c
Acn ∈ Σ.
\
An =
n =1 n =1

Ejemplo 1. Sean Ω un conjunto cualquiera y X un espacio topológico.

(a) El ejemplo más elemental de σ–álgebra sobre Ω es Σ = {∅, Ω}.

(b) Otro ejemplo obvio de σ–álgebra sobre Ω es el conjunto P (Ω) de las


partes de Ω, cuyos elementos son todos los subconjuntos de Ω.

(c) Cualquier familia F de subconjuntos de Ω puede extenderse a una


σ–álgebra (por ejemplo, a P (Ω)). De entre todas estas extensiones
hay una distinguida, a la que denotaremos ΣF , que se construye to-
mando la intersección de todas las σ–álgebras construidas sobre Ω
que contienen a F . ΣF recibe el nombre de σ–álgebra generada por F ,
la cual es de hecho la σ–álgebra sobre Ω más pequeña que contiene
a F.

(d) Un ejemplo relevante de σ–álgebra sobre un conjunto X lo constituye


la llamada σ–álgebra de Borel, a la que denotaremos B X , generada por
las bolas abiertas de X. Sus elementos reciben el nombre de conjuntos
de Borel. En particular,

BRd = ΣF con F = BR ( x ) : x ∈ Rd , R > 0 ,



Medibilidad 3

donde BR ( x ) = {y ∈ Rd : ky − x k < R}. Por supuesto y mientras no


se indique lo contrario, estamos asumiendo que el espacio X = Rd
está dotado de la topología usual.


Definición 2. Sea Σ una σ–álgebra sobre Ω.


(a) El par (Ω, Σ) recibe el nombre de espacio medible (o espacio muestral en
el lenguaje de la Teoría de Probabilidades) y los subconjuntos de Ω
pertenecientes a Σ son los conjuntos medibles de Ω (también llamados
sucesos en el lenguaje de la Teoría de Probabilidades).
(b) Si (Ω, Σ), ( X, Υ) son dos espacios medibles y f : Ω → X una aplica-
ción de Ω en X, decimos que f es una aplicación medible (con respecto
a las σ–álgebras Σ y Υ) si f −1 ( A) ∈ Σ para todo conjunto A ∈ Υ.
Un caso particular que reviste especial interés es aquél en que X es
un espacio topológico y Υ = B X es la σ–álgebra de Borel sobre X.
En estas condiciones f se dice medible si f −1 (O) es un subconjunto
medible de Ω (es decir, f −1 (O) ∈ Σ) para todo abierto O de X. Las
funciones medibles (entendiendo ahora que X = [−∞, +∞] al hablar
de funciones, toda vez que permitimos que f pueda tomar los valo-
res −∞ y +∞) reciben el nombre de variables aleatorias en Teoría de
Probabilidades. Destacamos asimismo como una familia importan-
te de funciones medibles la constituida por aquéllas en las que Ω es
también un espacio topológico y la σ–álgebra asociada al mismo es
la de Borel: Σ = BΩ . Se trata de las funciones de Borel.
Observación 1. La topología considerada en [−∞, +∞] es de ahora en
adelante la del orden a menos que se especifique lo contrario, entendién-
dose ésta como la constituida por los conjuntos (abiertos) que resultan de
efectuar intersecciones finitas de uniones numerables de intervalos de la
forma ( a, +∞] y [−∞, b), con a, b ∈ [−∞, +∞]. Para evitar ambigüedades
aritméticas y garantizar la coherencia de las operaciones funcionales bási-
cas (cf. Proposición 2) adoptaremos de antemano aquellos convenios que
permitan resolver todas las situaciones eventuales de indeterminación, a
saber:

x ± ∞ = ±∞ ∀x ∈ R, ∞ − ∞ = 0, ±∞ ± ∞ = ±∞ ,
±∞ si x > 0

x · (±∞) = (±∞) · x = , 0 · (±∞) = (±∞) · 0 = 0 .
∓∞ si x < 0


José L. López
4

Proposición 1 (Caracterización de las funciones medibles). Sean (Ω, Σ)


un espacio medible y f : Ω → [−∞, +∞] una función. Las siguientes
propiedades son equivalentes:

(a) f es medible.
(b) f −1 (( a, +∞]) ∈ Σ ∀ a ∈ [−∞, +∞].
(c) f −1 ([ a, +∞]) ∈ Σ ∀ a ∈ [−∞, +∞].
(d) f −1 ([−∞, b)) ∈ Σ ∀ b ∈ [−∞, +∞].
(e) f −1 ([−∞, b]) ∈ Σ ∀ b ∈ [−∞, +∞].
(f) f −1 (( a, b)), f −1 (−∞), f −1 (+∞) ∈ Σ ∀ a, b ∈ [−∞, +∞].

Demostración. Probaremos en primer lugar la cadena de equivalencias


(a) ⇔ (b) ⇔ (c) ⇔ (d) ⇔ (e) y finalmente (a) ⇔ (f).
(a) implica (b) por definición de función medible. Que (b) implica (c) es
una consecuencia de la identidad
∞  1 i
f −1 ([ a, +∞]) = f −1 a − , + ∞ .
\

n =1
n

Para comprobar que (c) implica (d) basta con escribir


 c
f −1 ([−∞, a)) = f −1 ([ a, +∞]) .

La implicación (d) ⇒ (e) se obtiene como consecuencia de la propiedad


∞ h 1 
f −1 ([−∞, b]) = f −1 − ∞, b +
\
.
n =1
n

Para concluir con el primer ciclo de equivalencias comprobamos que (e)


implica la medibilidad de f . Para ello hay que demostrar que f −1 (O) ∈ Σ
para todo abierto O de [−∞, +∞]. Como f −1 respeta uniones e interseccio-
nes, podemos restringirnos al caso en que O es de una de las tres formas
siguientes: ( a, b), [−∞, b) o bien ( a, +∞], con a, b ∈ [−∞, +∞] (cf. Obser-
vación 1). Por hipótesis f −1 ([−∞, a]) ∈ Σ, de donde se deduce inmediata-
mente que f −1 (( a, +∞]) ∈ Σ por paso al complementario. Por otra parte,
podemos expresar

[−∞, b) = [−∞, bn ] , bn < b ∀ n ∈ N ,
[
lı́m {bn } = b ,
n→∞
n =1
Medibilidad 5

de donde se desprende que



[  ∞
f −1 ([−∞, b)) = f −1 [−∞, bn ] = f −1 ([−∞, bn ]) ∈ Σ ,
[

n =1 n =1

ya que f −1 ([−∞, bn ]) ∈ Σ para todo n ∈ N por hipótesis. Para acabar,


basta con tener en cuenta que ( a, b) = [−∞, b) ∩ ( a, +∞], de modo que

f −1 (( a, b)) = f −1 [−∞, b) ∩ ( a, +∞]




= f −1 ([−∞, b)) ∩ f −1 (( a, +∞]) ∈ Σ . (1)

Estudiamos en último lugar la equivalencia (a) ⇔ (f). El enunciado


(a) ⇒ (f) es evidente por definición de función medible, sin más que con-
siderar (1), escribir

{−∞} = [−∞, +∞] \ (−∞, +∞] ,


{+∞} = [−∞, +∞] \ [−∞, +∞) ,

y tener en cuenta que f −1 respeta pasos al complementario. Para verificar


(f) ⇒ (a) es suficiente con demostrar que las preimágenes por f de interva-
los de la forma ( a, +∞] y [−∞, b), con a, b ∈ [−∞, +∞], son elementos de
Σ, basándonos nuevamente en que f −1 respeta uniones e intersecciones y
en la Observación 1. En efecto:

f −1 (( a, +∞]) = f −1 (( a, +∞)) ∪ f −1 (+∞) ∈ Σ ,


f −1 ([−∞, b)) = f −1 ((−∞, b)) ∪ f −1 (−∞) ∈ Σ .

Ejemplo 2. Sean Ω un conjunto cualquiera y X un espacio topológico.


(a) Toda función f : ( X, B X ) → [−∞, +∞] continua es una función de
Borel. En efecto: si f es continua satisface por definición que f −1 (O) es un
conjunto abierto en X, luego (B X –)medible, para cualquier abierto O en
[−∞, +∞].
(b) Sean Σ una σ–álgebra sobre Ω y A ∈ Σ. Entonces la función caracte-
rística del conjunto A (también llamada función indicatriz), definida como

1 si x ∈ A
χ A : Ω → [−∞, +∞] , χ A (x) = ,
0 si x ∈
/A

José L. López
6

es medible. Podemos verificar la medibilidad de χ A aplicando, por ejem-


plo, la caracterización (b) de la Proposición 1:

 ∅∈Σ

si a ≥ 1
−1
χ A (( a, +∞]) = Ω∈Σ si a < 0 .
A∈Σ si 0 ≤ a < 1

El siguiente resultado expresa la gran estabilidad de que goza el con-


cepto de medibilidad funcional frente a operaciones aritméticas, conjun-
tistas y de paso al límite, entre otras. La prueba del mismo se deja al lector
como ejercicio (cf. Ejercicio 2).

Proposición 2 (Propiedades de las funciones medibles). Sean (Ω, Σ) y


(Γ, Υ) dos espacios medibles.
(a) Si f , g : (Ω, Σ) → [−∞, +∞] son funciones medibles, entonces las
f
funciones α f + βg, f g y g (si g 6= 0 en Ω) son también medibles para
cualesquiera α, β ∈ R.
(b) Si f : (Ω, Σ) → (Γ, Υ) y g : (Γ, Υ) → [−∞, +∞] son medibles,
entonces g ◦ f : (Ω, Σ) → [−∞, +∞] es también una función medible.
(c) Si f : (Ω, Σ) → [−∞, +∞] es una función medible, entonces las
funciones f + = máx{ f , 0} y f − = máx{− f , 0} también lo son. Como
consecuencia, | f | = f + + f − es una función medible.
(d) Si { f n : Ω → [−∞, +∞]} es una sucesión de funciones medibles,
entonces supn∈N { f n }, ı́nfn∈N { f n }, lı́m supn∈N { f n } y lı́m infn∈N { f n } son
también funciones medibles. Además, el conjunto
n o
L= x ∈ Ω : ∃ lı́m { f n ( x )} = f ( x )
n→∞

es medible y la función límite f es medible en L (respecto de la σ–álgebra


Σ ∩ L; véase la Definición 3 (b)).

Enumeramos a renglón seguido algunas nociones importantes relacio-


nadas con el concepto de medida así como algunas de sus propiedades
más interesantes de cara a futuros usos.

Definición 3. Sea Σ una σ–álgebra sobre Ω.


Medibilidad 7

(a) La función de conjuntos µ : Σ → [0, +∞] es una medida (positiva) si


satisface la propiedad de aditividad numerable (o σ–aditividad), es decir: da-
da una familia numerable y disjunta { An }∞n=1 de elementos de Σ, entonces


[  ∞
µ An = ∑ µ( An ) .
n =1 n =1

(b) Un espacio de medida (Ω, Σ, µ) es un espacio medible (Ω, Σ) en el que


se ha definido una medida µ sobre la σ–álgebra Σ. Si Ω = Rd y Σ = BRd ,
µ : BRd → [0, +∞] recibe el nombre de medida de Borel. Además, dado
A ∈ Σ se puede definir el subespacio de medida ( A, Σ A , µ| A ), donde

Σ A := Σ ∩ A = { E ∩ A : E ∈ Σ}

es la σ–álgebra (compruébese) formada por los subconjuntos medibles de


A y µ| A : Σ A → [0, +∞] es la restricción de µ a A.

Ejemplo 3. Algunos ejemplos de espacios de medida son los siguientes:


(a) Sea Ω un conjunto cualquiera y Σ = P (Ω) el conjunto de las partes
de Ω. Para cada subconjunto A de Ω (en particular, A ∈ Σ) se define µ( A)
como el número de elementos de A si A tiene cardinal finito y µ( A) = +∞
si A es un conjunto con cardinal infinito. La medida µ así construida recibe
el nombre de medida discreta sobre Ω.
(b) Sea Ω un conjunto cualquiera, Σ = P (Ω) y x ∈ Ω. Se define µ x :
Σ → [0, +∞] como 
1 si x ∈ A
µ x ( A) = ,
0 si x ∈
/A
para cualquier A ⊆ Ω. Esta medida recibe el nombre de masa unidad con-
centrada en x o masa de Dirac. Nótese que la función medible χ A : Ω →
{0, 1} definida como χ A ( x ) = µ x ( A) es la función característica del con-
junto A, como se estudió en el Ejemplo 2 (b).
(c) Sean (Ω, Σ) un espacio medible y P : Σ → [0, 1] una medida. Si la
propiedad P(Ω) = 1 es satisfecha, entonces P recibe el nombre de medi-
da de probabilidad y el espacio de medida (Ω, Σ, P) se denomina espacio de
probabilidad.


Finalmente establecemos algunas propiedades elementales de las me-


didas que serán empleadas más adelante.

José L. López
8

Proposición 3 (Propiedades de las medidas). Sean Σ una σ–álgebra y µ :


Σ → [0, +∞] una medida sobre Σ. Entonces se verifican las siguientes
propiedades:

(a) µ(∅) = 0.

(b) [Aditividad finita] Para toda familia finita y disjunta { Ai }in=1 de ele-
mentos de Σ se tiene
n
[  n
µ Ai = ∑ µ ( Ai ) .
i =1 i =1

(c) [Monotonía] Si A, B ∈ Σ con A ⊂ B, entonces µ( A) ≤ µ( B).

(d) [Subaditividad finita] Para toda familia finita { Ai }in=1 de elementos de


Σ se tiene
[n  n
µ Ai ≤ ∑ µ ( Ai ) .
i =1 i =1

(e) Si { An }∞
n=1 es una familia numerable de elementos de Σ tales que

A1 ⊂ A2 ⊂ A3 ⊂ . . .
S∞
yA= n =1 An , entonces {µ( An )} → µ( A) cuando n → ∞.

(f) Si { An }∞
n=1 es una familia numerable de elementos de Σ tales que

A1 ⊃ A2 ⊃ A3 ⊃ . . . ,
T∞
µ ( A1 ) < + ∞ y A = n =1 An , entonces {µ( An )} → µ( A) cuando
n → ∞.

(g) [σ–subaditividad] Para toda familia numerable { An }∞


n=1 de elementos
de Σ se tiene
[∞  ∞
µ An ≤ ∑ µ( An ) .
n =1 n =1

Demostración. (a) Sea A ∈ Σ con µ( A) < +∞ y tomemos

A1 = A , A2 = A3 = . . . = ∅ .
Medibilidad 9

Entonces, dado que tales conjuntos son disjuntos entre sí, de la σ–aditividad
de µ se deduce

[  ∞
+∞ > µ( A) = µ An = µ( A) + ∑ µ(∅) ,
n =1 n =2

por lo que ha de ser µ(∅) = 0.


(b) es también una consecuencia de la σ–aditividad de µ, pues basta
con elegir An+1 = An+2 = . . . = ∅ y aplicar el resultado establecido en
(a).
(c) se demuestra a partir de (b) sin más que considerar la descomposi-
ción B = ( B ∩ A) ∪ ( B \ A) = A ∪ ( B \ A). Claramente A ∩ ( B \ A) = ∅,
por lo que la propiedad de aditividad demostrada en (b) implica

µ( B) = µ( A) + µ( B \ A) ≥ µ( A) .

La propiedad (d) se obtiene como consecuencia de (b) sin más que es-
cribir
n
[   
µ A i = µ A 1 ∪ A 2 \ A 1 ∪ · · · ∪ A n \ ( A n −1 ∪ · · · ∪ A 1 )
i =1
n
∑ µ ( Ai ) ,

= µ ( A 1 ) + µ ( A 2 \ A 1 ) + · · · + µ A n \ ( A n −1 ∪ · · · ∪ A 1 ) ≤
i =1

donde la última desigualdad resulta de haber aplicado la propiedad (c).


Para demostrar (e) tomamos B1 = A1 y Bn = An \ An−1 para n ≥ 2.
Entonces Bn ∈ Σ para todo n ∈ N (nótese que Bn = An ∩ Acn−1 ∀ n ≥ 2) y
Bi ∩ Bj = ∅ si i 6= j. Además, in=1 Bi = An y A = i∞=1 Bi . Por consiguiente
S S

n n o ∞
{µ( An )} = ∑ i −→
µ ( B ) ∑ µ( Bi ) = µ( A) cuando n → ∞ ,
i =1 i =1

donde se ha usado nuevamente la propiedad (b) y la σ–aditividad de µ.


Para probar (f) definimos Bn = A1 \ An , de modo que

(i) B1 ⊂ B2 ⊂ B3 ⊂ . . . ⊂ Bn ⊂ . . . ,
(b)
(ii) A1 = An ∪ Bn ⇒ µ( Bn ) = µ( A1 ) − µ( An ) ,
T∞ S∞
(iii) A1 \ A = A1 \ n =1 An = n =1 Bn .

José L. López
10

Teniendo en cuenta nuevamente que

A1 = ( A1 \ A ) ∪ A ⇒ µ ( A1 ) = µ ( A1 \ A ) + µ ( A )

gracias a la propiedad de aditividad finita expresada en (b), podemos apli-


car (e) a la familia { Bn } (en virtud de (i)) y obtener

(iii ) (ii )
[ 
µ ( A1 ) − µ ( A ) = µ Bn = lı́m {µ( Bn )} = µ( A1 ) − lı́m {µ( An )} ,
n→∞ n→∞
n =1

de donde se concluye que {µ( An )} → µ( A) cuando n → ∞.


Finalmente, para demostrar (g) se emplean las propiedades (d) y (e):

[  ∞ [
[ n  n
n [ o
µ An = µ Ak = lı́m µ Ak
n→∞
n =1 n =1 k =1 k =1
n n o ∞
≤ lı́m
n→∞
∑ µ( Ak ) = ∑ µ( Ak ) .
k =1 k =1

Tres propiedades básicas de la medida de Lebesgue


La construcción de la medida de Lebesgue es una tarea ardua que es-
capa a los propósitos de este compendio. Sin embargo su estudio es una
inversión de alta rentabilidad, pues constituye una herramienta matemá-
tica tan potente que a la postre permite calcular correctamente el volumen
euclídeo de una gran cantidad de conjuntos. Por ejemplo, la medida de Le-
besgue de cualquier bola euclídea de radio R es (como se comprobará en
la Proposición 5)
R d d −1
| BR ( x )| = |S | , (2)
d
donde
d
d −1 2π 2
|S | = (3)
Γ 2d


es la superficie de la esfera unidad en Rd y Γ(λ) es la función Gamma (cf.


Observación 4).
La σ–álgebra a considerar en este ámbito es la de Lebesgue, a la que
denotaremos LRd , formada por todos los subconjuntos de Rd medibles en
el sentido de Lebesgue (según la Definición 4 de unas líneas más abajo), de
Tres propiedades básicas de la medida de Lebesgue 11

modo que el espacio de medida asociado es (Rd , LRd , λ), donde λ : LRd →
[0, +∞] es la llamada medida de Lebesgue. Describamos brevemente cómo
funciona esta medida. Actuando sobre conjuntos abiertos, la medida de
Lebesgue se define como la suma de los volúmenes de las piezas elementales
que los componen:

λ(O) = ∑ vol( Ij ) , (4)
j =1

donde { Ij }∞
j=1 es unaSfamilia numerable de intervalos de R disjuntos dos
d

a dos tales que O = ∞ j=1 I j (cf. Lema 1) y donde

vol( I ) = (b1 − a1 ) × · · · × (bd − ad )

es el volumen del intervalo I = [ a1 , b1 ] × · · · × [ ad , bd ] (independientemen-


te de que se trate de un intervalo cerrado, abierto o semiabierto). Para el
resto de conjuntos medibles, la medida de Lebesgue es la restricción a LRd
de la medida exterior λ? : P (Rd ) → [0, +∞] definida como

λ? ( A) = ı́nf{λ(O) : A ⊂ O , O abierto} . (5)

Llegado este punto, conviene recordar que una medida exterior es una fun-
ción de conjuntos µ? : P (Rd ) → [0, +∞] monótona y σ–subaditiva (cf.
Proposición 3 (c) y (g)) que asigna el valor cero al conjunto vacío (cf. Pro-
posición 3 (a)).1 Sobre esta base podemos destacar que la σ–álgebra LRd
está formada por todos los subconjuntos de Rd que satisfacen la siguiente
propiedad.

Definición 4 (Conjunto medible en el sentido de Lebesgue). Decimos que


A ⊂ Rd es un conjunto medible en el sentido de Lebesgue (es decir, A ∈
LRd ) si para todo ε > 0 existen un cerrado F y un abierto G en Rd tales que
F ⊆ A ⊆ G y λ( G \ F ) < ε. 2

Recordemos algunas de las propiedades más relevantes de la medida


de Lebesgue. En lo que sigue usaremos frecuentemente la notación | A| en
lugar de λ( A) para hacer referencia a la medida de Lebesgue del conjunto
A ∈ LRd . La antedicha medida es

(a) invariante por traslaciones,


1 Nótese que, a pesar del nombre, una medida exterior no es en general una medida
2 Nótese que G \ F es un conjunto abierto, luego medible en el sentido de Lebesgue
según la fórmula (4)

José L. López
12

es decir: para todo conjunto A ∈ LRd y para todo v ∈ Rd fijo,


| A| = | A + v| = |{ x + v : x ∈ A}| .
Una prueba palpable de la relevancia de esta propiedad la encontramos
en la fórmula clásica (2) , en la que se pone de manifiesto que la medida
de Lebesgue de cualesquiera dos bolas en Rd con igual radio es invariante
(es decir, no depende de dónde estén centradas). De hecho, ésta es (salvo
constantes) la única medida invariante por traslaciones en Rd .
Otras dos propiedades esenciales de la medida de Lebesgue son las
siguientes:
(b) regularidad interior:
| A| = sup{|C | : C ⊆ A , C compacto} ∀ A ∈ LRd (6)
y
(c) regularidad exterior (cf. (5)):
| A| = ı́nf{|O| : A ⊆ O , O abierto} ∀ A ∈ LRd . (7)
Esta última propiedad desempeñará un papel esencial en el siguiente ca-
pítulo, a la hora de aproximar funciones que solo satisfacen una propiedad
de integrabilidad por medio de funciones regulares.
Ejemplo 4. Para no llevarnos a engaños, a lo largo de este ejemplo ilustra-
remos, en particular, la existencia de conjuntos no medibles en el sentido de
Lebesgue. Además, construiremos algunos conjuntos medibles que revis-
ten especial interés.
(a) Los conjuntos de Borel son medibles en el sentido de Lebesgue (jus-
tifíquese). De hecho, se dispone del siguiente
Corolario 1. Todo conjunto A ⊂ Rd medible en el sentido de Le-
besgue se puede descomponer como una unión disjunta de la forma
A = B ∪ N, donde B ⊆ A es un conjunto de Borel y N es un subcon-
junto de A que tiene medida nula.

En efecto, en virtud de la Definición 4 basta con elegir B = F y


N = A \ F. Claramente B ∈ BRd y | N | = | A \ F | ≤ | G \ F | < ε según
dicta la Proposición 3 (c), luego ha de ser | N | = 0. Una lectura ade-
cuada del resultado anterior permite argumentar que los conjuntos
medibles en el sentido de Lebesgue están completamente determi-
nados a partir de la σ–álgebra de Borel o, dicho de otro modo, que
LRd es la completación de BRd respecto de la medida de Lebesgue.
Tres propiedades básicas de la medida de Lebesgue 13

(b) Q ⊂ R es medible en el sentido de Lebesgue, ya que el conjunto


unitario {q} es medible para cada q ∈ Q y la unión numerable de
conjuntos medibles es medible (recuérdese la propiedad (c) de las
σ–álgebras). En efecto:
 c
q = (−∞, q) ∪ (q, +∞) ∈ BR ⊂ LR .

Además, como |{q}| = 0 (en virtud de la propiedad de regularidad


exterior (7)) para todo q ∈ Q, la propiedad de σ–aditividad de las
medidas (cf. Proposición 3 (g)) establece que |Q| = 0.
(c) Consideremos ahora el conjunto de números irracionales contenidos
en un intervalo [ a, b]: A = [ a, b] \ ([ a, b] ∩ Q). Argumentando como
en el ejemplo anterior se tiene que [ a, b] ∩ Q ∈ LR , por lo que A
es también medible en [ a, b] en el sentido de Lebesgue por paso al
complementario (propiedad (b) de las σ–álgebras). Además se puede
escribir [ a, b] = A ∪ ([ a, b] ∩ Q), por lo que
b − a = |[ a, b]| = | A| + |[ a, b] ∩ Q| ≤ | A| + |Q| = | A| ,
en virtud de la aditividad finita y la monotonía de las medidas (cf.
Proposición 3 (b) y (c)). Por otro lado se tiene que | A| ≤ |[ a, b]| =
b − a (cf. Proposición 3 (c)), luego | A| = b − a.
(d) El siguiente ejemplo ilustra la existencia de conjuntos no numera-
bles que también tienen medida nula. Consideramos para ello el in-
tervalo I = [0, 1] y lo dividimos en tres partes iguales. Si tras es-
ta división se prescinde
  2 del interior del subintervalo central se ob-
1
tiene I1 = 0, 3 ∪ 3 , 1 . A continuación repetimos el proceso con
cada uno de los dos
1 2 1
 intervalos
2 7
 componen I1 , obteniéndose así
  8 que
I2 = 0, 9 ∪ 9 , 3 ∪ 3 , 9 ∪ 9 , 1 . Supongamos construido In , que
estaría formado por la unión de 2n intervalos cerrados y disjuntos,
cada uno de ellos de longitud (1/3)n . Procediendo del mismo mo-
do sucesivamente encontramos que In+1 ⊂ In para todo n ∈ N. Se
define entonces

\
C= In ,
n =1
que recibe el nombre de conjunto ternario de Cantor.
Claramente C es no vacío, pues contiene al menos a los extremos de
cada uno de los intervalos cerrados de cuya unión resultan los con-
juntos In ; y es cerrado, porque se obtiene como una intersección nu-
merable de conjuntos cerrados. Que C tiene medida nula es también

José L. López
14

de fácil comprobación, pues (cf. Proposición 3 (f))


 n 
2
|C | = lı́m {| In |} = lı́m = 0.
n→∞ n→∞ 3
Estudiemos finalmente la no numerabilidad de C. Para ello observa-
mos en primer lugar que, según la construcción llevada a cabo, todos
sus elementos pueden escribirse de la siguiente forma:
a1 a a an
C3x= + 22 + 33 + · · · + n + . . . ,
3 3 3 3
donde a j = 0 o bien a j = 2 para todo j ∈ N. Es decir, cada elemento
x ∈ C admite una expresión en base tres del tipo

x = 0.a1 a2 a3 . . . an . . .

y, recíprocamente, cada expresión de la forma anterior representa un


elemento de C. Razonamos entonces por reducción al absurdo, ad-
mitiendo para ello que C fuese numerable. En ese caso debería poder
escribirse como
C = { x n } n ∈N ,
donde cada uno de los elementos xn adoptaría la siguiente forma:

x1 = 0.a11 a12 a13 . . . a1n . . .


x2 = 0.a21 a22 a23 . . . a2n . . .
..
.
xn = 0.a1n a2n a3n . . . ann . . .
..
.

Consideremos ahora el elemento

y = 0.b1 b2 b3 . . . bn . . .

construido de acuerdo al siguiente convenio: si ann = 0 entonces


bn = 2, mientras que si ann = 2 entonces bn = 0. Dicho de otro modo,
la representación en base tres del elemento y tiene por mantisa el re-
sultado de cambiar ceros por doses y viceversa, de forma ordenada,
en cada una de las posiciones diagonales de las mantisas de los ele-
mentos xn . Claramente y 6= xn para todo n ∈ N y sin embargo y ∈ C,
lo cual nos conduce a una contradicción. Por tanto, C no puede ser
numerable.
Tres propiedades básicas de la medida de Lebesgue 15

Desde que los conjuntos de Cantor vieron la luz en 1883 y a raíz del
impulso experimentado por la geometría fractal de la mano de a Be-
noît Mandelbrot, éstos han sido utilizados como modelo en diversas
aplicaciones, como por ejemplo en fenómenos de turbulencia, distri-
buciones de galaxias en el universo, fluctuaciones de precios en un
mercado o control de ruidos en procesos de transmisión digital.

(e) Finalmente ilustramos la existencia de conjuntos no medibles en el


sentido de Lebesgue. Diremos para ello que dos elementos x, y ∈
[0, 1] están relacionados entre sí si x − y ∈ Q (compruébese que se
trata de una relación de equivalencia). Consideremos entonces un
conjunto A que contenga solamente un elemento de cada clase de
equivalencia.3 Un conjunto de este tipo recibe el nombre de conjun-
to de Vitali. Si A fuese medible en el sentido de Lebesgue, podría-
mos considerar también la siguiente familia de conjuntos medibles:
{ An = A + qn }, n ∈ N, donde {qn } representa aquí el conjunto
formado por los números racionales del intervalo [−1, 1]. Obsérve-
se que (i) cada An sería medible en el sentido de Lebesgue por ser
el trasladado de un conjunto medible y, además, tendría la misma
medida que A.
Claramente (ii) los conjuntos An son disjuntos dos a dos. En efecto:
si para n 6= m se considera x ∈ An ∩ Am , entonces habría de ser
x = a1 + qn = a2 + qm con a1 , a2 ∈ A, de donde se concluye que
a2 − a1 ∈ Q. Finalmente, como por construcción el conjunto A solo
contiene un elemento de cada clase de equivalencia habría de ser
a1 = a2 , luego qn = qm .
Comprobemos que además
S∞
(iii) [0, 1] ⊂ n =1 An ⊂ [−1, 2].

Para ello, sea en primer lugar x ∈ [0, 1] y consideremos el (único)


elemento x A de su clase de equivalencia que (por construcción) for-
ma parte de A, de modo tal que x y x A están relacionados, es decir,
x − x A = q j ∈ Q ∩ [−1, 1]. Entonces se tiene que x = x A + q j ∈ A j ,
lo que demuestra la primera de las relaciones de inclusión. Por otra
parte, si x ∈ ∞
S
n=1 An entonces ha de pertenecer a alguno de los An ,
luego x = a + qn con a ∈ A (⊂ [0, 1]) y qn ∈ Q ∩ [−1, 1]. Por consi-
guiente, x ∈ [−1, 2].
3 Nótese que para construir un conjunto tal es necesario recurrir al axioma de elección

José L. López
16

Para concluir, de la σ–aditividad (cf. (ii)) y la monotonía de las me-


didas (cf. Proposición 3 (c)) se deduce que
∞ ∞ ∞
(i )
[
∑ | A| = ∑ | An | = An ≤ |[−1, 2]| = 3 ,

n =1 n =1 n =1

S lo que necesariamente ha de ser | A| = 0. En particular se tiene


por

n=1 An = 0, lo cual contradice (iii).

El lector interesado en un estudio profundo y elegante de la medida


de Lebesgue y de la Teoría de la Medida en general puede acudir, por
ejemplo, a los textos [Rud1] y [Cohn] .

Integración y conjuntos de medida nula


Indudablemente, la teoría de la integración de Lebesgue es uno de los
paradigmas de la matemática del siglo XX y la culminación del largo via-
je iniciado por Riemann hasta encontrar la perspectiva adecuada desde la
que ha de contemplarse la teoría general de la integración. La idea que
subyace a la extensión que la integral de Lebesgue supuso de la integral
de Riemann reside, junto a la reparación de algunas limitaciones del teore-
ma fundamental del cálculo, en el hecho de que las funciones integrables
en el sentido de Riemann adquieren estructura de espacio métrico con la
distancia Z b
d( f , g) = | f ( x ) − g( x )| dx ,
a
si bien ésta no es completa. Uno de los ejemplos clásicos que sirven para
ilustrar esta situación es el siguiente: considérese la sucesión f n : [0, 1] →
R definida por 
1 si x ∈ {r1 , . . . , rn }
f n (x) = ,
0 en otro caso
donde rn denota el n–ésimo número racional del intervalo [0, 1]. Es cla-
ro que cada elemento de la sucesión anterior es una función integrable
en el sentido de Riemann, pues presenta un número finito de puntos de
discontinuidad. Sin embargo, su límite puntual es la función de Dirichlet
f : R → R definida como

1 si x ∈ Q

f (x) = , (8)
0 si x ∈ R \ Q
Integración y conjuntos de medida nula 17

que es discontinua en todos los puntos de [0, 1] y, por consiguiente, no


integrable en el sentido de Riemann.
Es precisamente la completación de este espacio el proceso que con-
duce hacia las funciones de módulo integrable en el sentido de Lebesgue
(L1 (Ω) en la notación del capítulo siguiente). El propósito de esta sección
es hacer un breve recorrido por algunos de los resultados más útiles re-
lacionados con la integración de funciones medibles, fundamentalmente
aquéllos que permiten entender cómo y cuándo está permitido intercam-
biar límite e integral. Para llevar a cabo un estudio detallado de la teoría
de integración de Lebesgue remitimos al lector a [Rud1] y [HS]. Comenza-
mos introduciendo algunas nociones y propiedades fundamentales de la
antedicha teoría.
Definición 5 (Función simple e integral de Lebesgue). Sea (Ω, Σ, µ) un
espacio de medida.
(a) Decimos que una función s : (Ω, Σ, µ) → [0, +∞] es simple si su ima-
gen consiste en un número finito de puntos de [0, +∞]. De hecho, si
{α1 , . . . , αn } es el conjunto discreto de valores que toma dicha fun-
ción y si denotamos Ai = { x ∈ Ω : s( x ) = αi }, entonces s( x ) se
puede expresar de la siguiente forma:
n
s( x ) = ∑ α i χ Ai ( x ) , (9)
i =1

donde χ Ai es la función característica del conjunto Ai . Claramente,


la función s es medible si y solamente si cada uno de los conjuntos
Ai es medible (cf. Ejemplo 2 (b)).
(b) Si A1 , . . . , An , E ∈ Σ y s : (Ω, Σ, µ) → [0, +∞] es la función simple
descrita en (9), se define
Z n

E
s dµ := ∑ αi µ ( Ai ∩ E ) , (10)
i =1

donde dado el caso se establecerá el convenio 0 · ∞ = 0. Obsérvese


que en particular se dispone de la siguiente identidad:
Z
χ A dµ = µ( A) ∀ A ⊆ E, (11)
E

la cual pone de manifiesto la siguiente máxima que se erige como


uno de los pilares de la teoría de la medida: medir un conjunto es inte-
grar su función característica. Por otro lado, si f : (Ω, Σ, µ) → [0, +∞]

José L. López
18

es una función medible y E ∈ Σ, se define


Z nZ o
f dµ := sup s dµ , (12)
E E

donde el supremo se toma sobre todas las funciones simples y medi-


bles s tales que 0 ≤ s( x ) ≤ f ( x ) ∀ x ∈ E. El primer miembro de (12)
es la conocida integral de Lebesgue.

El siguiente resultado de aproximación es crucial para la construcción


de la integral de Lebesgue a partir de funciones simples y, en general, muy
útil en toda la teoría de integración.

Teorema 1 (Aproximación de funciones medibles por funciones simples).


Sean (Ω, Σ) un espacio medible y f : (Ω, Σ) → [0, +∞] una función me-
dible. Entonces existe una sucesión creciente {sn } de funciones simples,
medibles y no negativas en Ω tal que

lı́m {sn ( x )} = f ( x ) ∀x ∈ Ω.
n→∞

Demostración. Se define la siguiente partición de la imagen de f :


 
i i i+1
An = x ∈ Ω : n ≤ f ( x ) < n , i ∈ [0, n2n ) ∩ (N ∪ {0}) ,
2 2
Bn = { x ∈ Ω : f ( x ) ≥ n} .

Es inmediato comprobar que ambas familias de conjuntos son medibles a


la luz de la Proposición 1, luego las funciones simples de la forma

n2n −1
i
sn = ∑ χ i + n χ Bn ,
2n A n
n ∈ N,
i =1

también lo son. Además, es evidente que 0 ≤ sn ≤ f .


Comprobemos ahora que lı́mn→∞ {sn ( x )} = f ( x ) para todo x ∈ Ω.
Para ello consideremos en primer lugar aquellos x ∈ Ω para los que
f ( x ) 6= ∞, los cuales permiten seleccionar, para valores suficientemente
grandes de n, un valor adecuado de i tal que x ∈ Ain . En consecuencia

i+1 i 1
0 ≤ f ( x ) − sn ( x ) < n
− n = n,
2 2 2
Integración y conjuntos de medida nula 19

de donde se concluye la convergencia esperada. Por el contrario, si x ∈ Ω


es tal que f ( x ) = ∞, entonces {sn ( x )} = {n} → ∞ = f ( x ) cuando n → ∞.
Únicamente falta por comprobar la monotonía de {sn }. Observamos
2i +1
en primer lugar que, dado i < n2n , se verifica Ain = A2i n+1 ∪ An+1 (ve-
rifíquese). Las tres posibilidades que se pueden presentar son, pues, las
siguientes:

Si x ∈ A2i
n+1 , entonces

2i i
s n +1 ( x ) = = = sn ( x ) .
2n +1 2n

+1
Si x ∈ A2i
n+1 , entonces

2i + 1 2i i
s n +1 ( x ) = > = = sn ( x ) .
2n +1 2n +1 2n

Si x ∈ Bn entonces f ( x ) ≥ n, luego
 

Ain+1  ∪ Bn+1 .
[
x∈
n2n+1 ≤i ≤(n+1)2n+1 −1

Por consiguiente, sn+1 ( x ) ≥ n = sn ( x ).


La construcción de la integral de Lebesgue es, por tanto, sutilmente di-
ferente a la que culmina con la integral de Riemann. En efecto, el concepto
de integral de Riemann se fundamenta en la partición sucesiva del domi-
nio de la función, mientras que la idea que sustenta el concepto de integral
de Lebesgue se basa en la partición de la imagen de la función (obsérvese
el aspecto que adoptan los conjuntos Ain y Bn en la demostración anterior).
De este modo es como la integral de Lebesgue extiende a la de Riemann,
coincidiendo ambas siempre que esta última existe, con la ventaja de que
la integral de Lebesgue hace integrables a muchas más funciones (incluso
no acotadas) que la de Riemann, generaliza los intervalos –vistos como re-
cintos de integración– a conjuntos medibles cualesquiera y supera algunas
de las limitaciones que la integral de Riemann exhibe frente al intercambio
con respecto al proceso de paso al límite.
En el siguiente resultado se recogen algunas de las propiedades más
importantes de la integral de Lebesgue.

José L. López
20

Proposición 4 (Propiedades de la integral de Lebesgue). Sea Ω ⊆ Rd .


Dadas dos funciones f y g medibles en (Ω, Σ, µ) y dados cualesquiera
E, F ∈ Σ, la integral de Lebesgue satisface las siguientes propiedades:

∀ α, β ∈ R.
R R R
(a) [Linealidad] E ( α f + βg ) dµ = α E f dµ + β E g dµ
R R
(b) [Monotonía] Si f ≤ g, entonces E f dµ ≤ E g dµ. En particular,
Z Z
f dµ ≤ | f | dµ .


E E

(c) [Aditividad del dominio] Si E ∩ F = ∅, entonces


Z Z Z
f dµ = f dµ + f dµ .
E∪ F E F

Demostración. Haremos la prueba para el caso en que f y g son funciones


simples. La extensión al caso general es consecuencia del argumento de
aproximación establecido en el Teorema 1. Sean por tanto
n m
f = ∑ α i χ Ai , g= ∑ β j χ Bj ,
i =1 j =1

Sn Sm
con E = i =1 Ai = j =1 Bj . Entonces
Z Z  n m 
(α f + βg) dµ = α ∑ α i χ Ai + β ∑ β j χ Bj dµ
E E i =1 j =1
Z  n m m  n
= α ∑ αi ∑ Ai ∩ B j
χ + β ∑ j ∑ Ai ∩Bj dµ
β χ
E i =1 j =1 j =1 i =1
Z n m n m
= ∑ ∑ (ααi + ββ j )χ Ai ∩Bj dµ = ∑ ∑ (ααi + ββ j )µ( Ai ∩ Bj )
E i =1 j =1 i =1 j =1
n m n m
=α∑ ∑ αi µ ( Ai ∩ B j ) + β ∑ ∑ β j µ ( Ai ∩ B j )
i =1 j =1 i =1 j =1
n m Z Z
= α ∑ αi µ ( Ai ) + β ∑ β j µ ( B j ) = α f dµ + β g dµ ,
i =1 j =1 E E

lo cual prueba la propiedad (a).


Integración y conjuntos de medida nula 21

Para demostrar (b) basta con tener en cuenta que


n m
g− f = ∑ ∑ ( β j − α i ) χ Ai ∩ B j
i =1 j =1

es una función simple no negativa (por hipótesis), luego su integral de


Lebesgue también ha de ser no negativa (cf. (10)), lo que combinado con
(a) permite concluir que
Z Z Z
0≤ ( g − f ) dµ = g dµ − f dµ .
E E E
Sn
Supongamos finalmente que E ∪ F = i =1 Ai con E ∩ F = ∅. Se tiene
Z n n
∑ αi µ ( Ai ∩ E ) ∪ ( Ai ∩ F ) = ∑ αi
 
f dµ = µ ( Ai ∩ E ) + µ ( Ai ∩ F )
E∪ F i =1 i =1
n n Z Z
= ∑ αi µ ( Ai ∩ E ) + ∑ αi µ ( Ai ∩ F ) = E
f dµ +
F
f dµ ,
i =1 i =1

lo que demuestra (c). Obsérvese que se ha utilizado la propiedad de aditi-


vidad finita de las medidas (cf. Proposición 3 (b)) para escribir

µ ( Ai ∩ E ) ∪ ( Ai ∩ F ) = µ ( Ai ∩ E ) + µ ( Ai ∩ F ) .

Definición 6 (Igualdad casi por doquier). Si f y g son dos funciones me-


dibles en (Ω, Σ, µ) que difieren en un conjunto que tiene medida nula, esto
es,
µ({ x ∈ Ω : f ( x ) 6= g( x )}) = 0 ,
decimos que f = g casi por doquier (c.p.d.) en Ω con respecto a la medida µ.
Este concepto depende, por supuesto, de la medida empleada y exclusiva-
mente en el caso en que se utilice la medida de Lebesgue nos referiremos
a esta propiedad sin hacer mención a la misma: f = g c.p.d. en Ω.

La igualdad c. p. d. constituye una relación de equivalencia (comprué-


bese) cuya repercusión en la teoría de integración es fundamental. Nótese
que si f = g c.p.d. en Ω con respecto a µ, entonces
Z Z
f dµ = g dµ para todo E ∈ Σ .
E E

José L. López
22

En efecto: sea N el subconjunto medible de Ω para el que µ( N ) = 0 y


f ( x ) = g( x ) en Ω \ N. Entonces cualquier conjunto medible E ∈ Σ se
puede escribir como la unión disjunta E = ( E \ N ) ∪ ( E ∩ N ) y se tiene (cf.
Proposición 4 (c))
Z Z Z
f dµ = f dµ + f dµ
E E\ N E∩ N
Z Z Z
= g dµ + g dµ = g dµ , (13)
E\ N E∩ N E

ya que f = g en E \ N y µ( E ∩ N ) = 0, en cuyo caso (12) y (10) se aplican


para deducir (13). Por tanto, se puede afirmar que los conjuntos de medida
nula son despreciables con respecto a la integración.
A la luz de estas disquisiciones es natural establecer la siguiente
Definición 7 (Convergencia casi por doquier). Sea { f n : Ω → R} una
sucesión de funciones medibles. Decimos que la sucesión { f n } converge
c.p.d. en Ω hacia una función f : Ω → R si { f n ( x )} → f ( x ) cuando n → ∞
salvo quizá en un conjunto de medida nula de Ω.
El siguiente resultado expone en qué sentido y bajo qué (extremada-
mente flexibles) condiciones se puede afirmar que la convergencia c.p.d. es
casi uniforme.
Teorema 2 (Egoroff). Sean (Rd , Σ, µ) un espacio de medida y { f n : Rd →
R} una sucesión de funciones medibles. Supongamos también que A ∈ Σ
con µ( A) < ∞ y que { f n } → g c.p.d. en A cuando n → ∞. Entonces, para
todo ε > 0 existe un conjunto medible B ⊂ A tal que
(i) µ( A \ B) < ε,
(ii) { f n } → g uniformemente en B cuando n → ∞.

Demostración. Se definen los conjuntos


∞ n
1o
x ∈ Rd : | f n ( x ) − g( x )| > i, j ∈ N .
[
Xi,j = ,
n= j
2i

Claramente Xi,j+1 ⊂ Xi,j para cualesquiera i, j ∈ N, luego para cada i ∈ N


(fijo) la sucesión { Xi,j } j∈N es decreciente (en sentido conjuntista). Como
además µ( A) < ∞, se tiene que (cf. Proposición 3 (f) y (a))
 ∞
\ 
lı́m {µ( A ∩ Xi,j )} = µ A ∩ Xi,j = µ(∅) = 0 .
j→∞
j =1
Integración y conjuntos de medida nula 23

Por tanto, para cualesquiera i ∈ N y ε > 0 existe ni ∈ N tal que


ε
µ( A ∩ Xi,ni ) < .
2i
Definimos ahora B = A \ i∞=1 Xi,ni . Gracias a la σ–subaditividad de µ (cf.
S

Proposición 3 (g)) obtenemos (i), ya que



µ( A \ B) ≤ ∑ µ( A ∩ Xi,ni ) < ε .
i =1

Por consiguiente, para cualesquiera i ∈ N, x ∈ B y n ≥ ni se tiene


1
| f n ( x ) − g( x )| ≤ ,
2i
de donde se desprende que { f n } → g uniformemente en B cuando n → ∞.
Esto concluye la prueba de (ii).

Los teoremas que exponemos a continuación son piedras angulares de
la teoría de integración y, en general, del análisis matemático.
Teorema 3 (de la convergencia monótona). Sean (Ω, Σ, µ) un espacio de
medida y { f n } una sucesión de funciones medibles en (Ω, Σ, µ) tales que
0 ≤ f n ( x ) ≤ f n +1 ( x ) ∀n ∈ N, ∀x ∈ Ω
y { f n ( x )} → f ( x ) para todo x ∈ Ω cuando n → ∞. Entonces f : Ω → R
es medible y
nZ o Z Z
lı́m f n dµ = lı́m { f n } dµ = f dµ .
n→∞ Ω Ω n→∞ Ω

Demostración [W. Rudin]. Comprobamos en primer lugar que f es medi-


ble. Para ello basta con observar que

f −1 (( a, b)) = f n−1 (( a, b)) ∀ a, b ∈ R .


[

n ∈N

Entonces, como por hipótesis f n es medible para cada n ∈ N se concluye


fácilmente que f es medible (cf. Proposición 1 (f)).
Por otro lado, como consecuencia de la monotonía de la integral de
Lebesgue (Proposición 4 (b)) se tiene
Z Z Z Z
0≤ f 1 dµ ≤ · · · ≤ f n dµ ≤ f n+1 dµ ≤ · · · ≤ f dµ ,
Ω Ω Ω Ω

José L. López
24

R
por lo que la sucesión Ω f n dµ se revela monótona y acotada, luego
puede garantizarse la existencia de
Z
0≤L≤ f dµ (14)

tal que
nZ o
lı́m f n dµ = L . (15)
n→∞ Ω
R
Demostramos ahora la desigualdad contraria: L ≥ Ω f dµ, con lo que con-
cluiría la prueba del teorema. Sea para ello

k
s( x ) = ∑ α i χ Ai ( x )
i =1

una función simple y medible cualquiera que satisfaga 0 ≤ s( x ) ≤ f ( x )


(cf. Teorema 1). Sea también 0 < λ < 1 una constante y consideremos la
familia de conjuntos

En = x ∈ Ω : f n ( x ) ≥ λs( x ) , n ∈ N .


Es evidente que cada En es medible y que E1 ⊂ · · · ⊂ En ⊂ En+1 ⊂ . . .


Además Ω = ∞
S
n=1 En , ya que
T∞
(i) si x ∈ Ω es tal que f ( x ) = 0, entonces s( x ) = 0 y x ∈ n =1 En ;

(ii) y, por otra parte, si f ( x ) > 0 entonces se cumple λs( x ) < s( x ) ≤


f ( x ), por lo que x ha de pertenecer a En para algún n ∈ N.4

Consecuentemente, la siguiente cadena de desigualdades es satisfecha


para todo n ∈ N:
Z Z Z k
f n dµ ≥ f n dµ ≥ λ s dµ = λ ∑ αi µ( En ∩ Ai ) . (16)
Ω En En i =1
S∞
Como los conjuntos En son todos medibles y Ω = n =1 En , se deduce que
(cf. Proposición 3 (e))

lı́m {µ( En ∩ Ai )} = µ(Ω ∩ Ai ) = µ( Ai ) ,


n→∞
4 Es
éste el momento en que se aprecia la necesidad de introducir el parámetro 0 <
λ < 1 para definir convenientemente los conjuntos En
Integración y conjuntos de medida nula 25

En s dµ → Ω s dµ cuando n → ∞ conforme a la Definición 5 (b).


R R
luego
De este modo, pasando al límite en la expresión (16) se tiene que
Z
L≥λ s dµ . (17)

Como la desigualdad (17) se verifica cualquiera que sea 0 < λ < 1, tam-
bién se tiene Z
L≥ s dµ

para toda función simple y medible s tal que 0 ≤ s ≤ f , de modo que al
tomar supremos sobre s se obtiene
Z
L≥ f dµ , (18)

nuevamente en virtud de la Definición 5 (b). La prueba concluye al com-


binar (15), (14) y (18).


Teorema 4 (Lema de Fatou). Sean (Ω, Σ, µ) un espacio de medida y { f n }


una sucesión de funciones medibles en (Ω, Σ, µ) tales que

f n (x) ≥ 0 ∀ x ∈ Ω y f ( x ) = lı́m inf{ f n ( x )} .


n→∞

Entonces Z nZ o
f dµ ≤ lı́m inf f n dµ .
Ω n→∞ Ω

Demostración. Definimos gn ( x ) = ı́nfi≥n { f i ( x )}. Entonces, conforme a la


definición de límite inferior se verifica

lı́m { gn ( x )} = f ( x ) .
n→∞

Además, 0 ≤ gn ( x ) ≤ gn+1 ( x ) y gn ( x ) ≤ f n ( x ) en Ω. Finalmente, aplican-


do el teorema de la convergencia monótona (Teorema 3) y la propiedad de
monotonía de la integral de Lebesgue (Proposición 4 (b)) se deduce
Z nZ o nZ o nZ o
f dµ = lı́m gn dµ = lı́m inf gn dµ ≤ lı́m inf f n dµ .
Ω n→∞ Ω n→∞ Ω n→∞ Ω

José L. López
26

Teorema 5 (de la convergencia dominada). Sean (Ω, Σ, µ) un espacio de


medida y { f n } una sucesión de funciones medibles en (Ω, Σ, µ) tales que
{ f n ( x )} → f ( x ) para todo x ∈ Ω cuando nZ → ∞. Supongamos además
que existe una función integrable g, esto es g dµ < ∞, tal que | f n ( x )| ≤

g( x ) para todo n ∈ N y para todo x ∈ Ω. Entonces f es integrable en Ω y
nZ o Z Z
lı́m f n dµ = lı́m { f n } dµ = f dµ .
n→∞ Ω Ω n→∞ Ω

En particular, la propiedad
nZ o
lı́m | f n − f | dµ = 0
n→∞ Ω

es satisfecha.
Demostración. La condición | f n ( x )| ≤ g( x ) expresa el hecho de que las
funciones | f n | son todas integrables (cf. Proposición 4 (b)). Como también
sucede que f n + g ≥ 0 y f + g ≥ 0 en Ω, del Lema de Fatou (Teorema 4)
se desprende que
Z nZ o
( f + g) dµ ≤ lı́m inf ( f n + g) dµ ,
Ω n→∞ Ω

luego Z nZ o
f dµ ≤ lı́m inf f n dµ .
Ω n→∞ Ω
Análogamente, como g − f n ≥ 0, se tiene
Z nZ o
( g − f ) dµ ≤ lı́m inf ( g − f n ) dµ ,
Ω n→∞ Ω

de modo que Z Z
n o
− f dµ ≤ lı́m inf − f n dµ
Ω n→∞ Ω
o, equivalentemente,
Z nZ o
f dµ ≥ lı́m sup f n dµ
Ω n→∞ Ω

en virtud de la conocida relación lı́m supn→∞ { xn } = − lı́m infn→∞ {− xn }.


Con esto finaliza la primera parte de la prueba, ya que ha de ser
nZ o nZ o nZ o Z
lı́m f n dµ = lı́m inf f n dµ = lı́m sup f n dµ = f dµ .
n→∞ Ω n→∞ Ω n→∞ Ω Ω
Integración y conjuntos de medida nula 27

Concluimos aplicando lo ya demostrado a la sucesión {| f n − f |}. Esta


sucesión converge a cero c.p.d. en Ω y es tal que | f n − f | ≤ g + | f | para
todo n ∈ N. Además, g + | f | es claramente integrable (g lo es por hipótesis
y para comprobar que | f | lo es basta con repetir los argumentos anteriores
para la sucesión {| f n |}), por lo que todas las hipótesis del teorema son
satisfechas.

Una aplicación importante del teorema de la convergencia dominada
que resulta de gran utilidad en la práctica es la siguiente.

Corolario 2 (Derivación bajo el signo integral). Sea f : Ω × ( a, b) → R una


función integrable en Ω ⊂ Rd y derivable en ( a, b). Sea también F : Ω → R
una función integrable que verifica
∂f
( x, t) ≤ F ( x ) ∀ ( x, t) ∈ Ω × ( a, b) .

∂t
Entonces
d ∂f
Z  Z
f ( x, t) dx = ( x, t) dx .
dt Ω Ω ∂t

Demostración. Sea {hn } ⊂ R una sucesión tal que {hn } → 0 cuando


n → ∞. Por el teorema del valor medio, es bien sabido que para cada
n ∈ N existe ξ n ∈ ( a, b) tal que

f ( x, t + hn ) − f ( x, t) ∂f
= ( x, ξ n ) .
hn ∂t
Por tanto,
f ( x, t + hn ) − f ( x, t)
≤ F(x) .
hn

Del teorema de la convergencia dominada (Teorema 5) se desprende final-


mente que

f ( x, t + hn ) − f ( x, t)
Z 
d
Z 
f ( x, t) dx = lı́m dx
dt Ω n→∞ Ω hn
f ( x, t + hn ) − f ( x, t)
 
∂f
Z Z
= lı́m dx = ( x, t) dx .
Ω n → ∞ hn Ω ∂t

José L. López
28

Observación 2. Tanto en el teorema de la convergencia monótona como


en el lema de Fatou y en el teorema de la convergencia dominada las hi-
pótesis de monotonía, no negatividad y acotación uniforme, respectiva-
mente, que fueron supuestas ciertas en todo punto, pueden debilitarse y
considerarse solamente satisfechas c.p.d. sin que las conclusiones de estos
resultados experimenten alteración alguna.

Seguidamente exponemos dos de los resultados más provechosos tan-
to para el estudio de la integrabilidad de una función como para la eva-
luación de integrales múltiples sobre un recinto. Para ello necesitamos de
algunos conceptos preliminares que no serán debatidos con profundidad
aquí, aunque los detalles pueden encontrarse en cualquier texto básico de
teoría de la medida.
Consideremos ( X, A, µ) e (Y, B , ν) dos espacios de medida y denote-
mos A × B a la σ–álgebra generada por los rectángulos A × B, donde
A ∈ A y B ∈ B . Si E es un subconjunto del producto cartesiano X × Y,
se pueden definir las secciones transversales
Ex = {y ∈ Y : ( x, y) ∈ E} , Ey = { x ∈ X : ( x, y) ∈ E} .
Si además E ∈ A × B es un subconjunto medible de X × Y, entonces se
puede demostrar que Ex ∈ B y Ey ∈ A. Las siguientes propiedades (con-
súltese, por ejemplo, [Che])
(P1) la función y 7→ µ( Ey ) es medible;
(P2) la función x 7→ ν( Ex ) es medible;
(P3) X ν( Ex ) dµ = Y µ( Ey ) dν;
R R

permiten definir la llamada medida producto µ ⊗ ν sobre A × B , que actúa


de la siguiente forma:
Z Z
(µ ⊗ ν)( E) = µ( Ey ) dν = ν( Ex ) dµ ,
Y X

o equivalentemente5
Z Z  Z Z 
(µ ⊗ ν)( E) = χ Ey dµ dν = χ Ex dν dµ .
Y X X Y

De este modo, ( X × Y, A × B , µ ⊗ ν) es un espacio de medida. Así las co-


sas, ya podemos demostrar uno de los resultados fundamentales de toda
la teoría de integración.
5 Recuérdese que medir un conjunto es integrar su función característica
Integración y conjuntos de medida nula 29

Teorema 6 (Fubini). Sean ( X, A, µ), (Y, B , ν) dos espacios de medida y sea


f : X × Y → [0, +∞] una función medible definida sobre el producto
cartesiano de X e Y. Entonces
Z Z
ϕ( x ) = f ( x, y) dν , ψ(y) = f ( x, y) dµ
Y X

son funciones medibles y positivas. Además, se verifica


Z Z Z
ϕ( x ) dµ = ψ(y) dν = f ( x, y) d(µ ⊗ ν) . (19)
X Y X ×Y

Demostración. Si f es la función característica de un conjunto E ∈ A × B ,


entonces la función y 7→ f ( x, y) = χ E ( x, y) = χ Ex (y) es medible para todo
x ∈ X y, análogamente, x 7→ χ Ey ( x ) es medible para todo y ∈ Y, dado que
Ex ∈ A y Ey ∈ B . Por tanto
Z Z
ϕ( x ) = χ E ( x, y) dν = χ Ex (y) dν = ν( Ex )
Y Y

es medible en virtud de la propiedad (P2), al igual que ψ(y) (cf. (P1)). La


positividad de ambas funciones deriva de la propiedad de monotonía de
la integral de Lebesgue establecida en la Proposición 4 (b), toda vez que
f ≥ 0. Finalmente, se tiene
Z
f ( x, y) d(µ ⊗ ν) = (µ ⊗ ν)( E)
X ×Y
Z Z
y
= µ( E ) dν = ψ(y) dν
ZY ZY
= ν( Ex ) dµ = ϕ( x ) dµ .
X X

Por consiguiente, el teorema es cierto para funciones características de


subconjuntos medibles de X × Y y, a su vez, para funciones simples gracias
a la linealidad de la integral (Proposición 4 (a)). Si f : X × Y → [0, +∞]
es ahora cualquier función medible, se puede garantizar la existencia de
una sucesión de funciones simples, medibles y no negativas que converge
monótonamente hacia f gracias al Teorema 1. Como el límite puntual de
funciones medibles es medible (compruébese), se deduce fácilmente que
ϕ( x ) y ψ(y) son funciones medibles. Finalmente, (19) es una consecuencia
inmediata del teorema de la convergencia monótona (Teorema 3).


José L. López
30

Observación 3. La extensión del teorema de Fubini al caso en que f :


X × Y → R toma valores reales (no necesariamente positivos) pasa sim-
plemente por descomponer la función en sus partes positiva y negativa,
en tanto que para funciones con valores complejos se procede tratando se-
paradamente sus partes real e imaginaria. Esta última versión del teorema
de Fubini adquirirá especial relevancia en el ámbito de la transformada de
Fourier, a la que se dedica el Capítulo 3.
Corolario 3 (Tonelli–Hobson). Sean ( X, A, µ), (Y, B , ν) dos espacios de me-
dida y f : X × Y → R una función medible definida sobre el producto
cartesiano de X e Y. Entonces f es absolutamente integrable con respecto
a la medida producto, es decir
Z
| f ( x, y)| d(µ ⊗ ν) < ∞ ,
X ×Y

si y solamente si
Z Z 
| f ( x, y)| dν dµ < ∞
X Y
o bien Z Z 
| f ( x, y)| dµ dν < ∞ .
Y X

Concluimos esta sección con uno de los resultados más frecuentemente


empleados en las aplicaciones: el teorema de cambio de variable. Comen-
zamos para ello recordando el concepto de difeomorfismo.
Definición 8 (Difeomorfismo C1 regular). Sea Ω ⊆ Rd un abierto. Deci-
mos que una aplicación ϕ : Ω → Rd es un difeomorfismo C1 regular si es
inyectiva, ϕ ∈ C1 (Ω) y ϕ−1 ∈ C1 ( ϕ(Ω)).
El siguiente lema recoge algunas propiedades topológicas del espacio
euclídeo (e incluso en algunos casos válidas en espacios más generales,
aunque aquí nos limitaremos a Rd por simplicidad) de uso frecuente en
las aplicaciones analíticas.
Lema 1. Las siguientes afirmaciones son satisfechas:

(a) [Descomposición de un abierto en intervalos diádicos] Todo abierto


en Rd puede expresarse como una unión numerable de intervalos de
Rd . Es más, eligiendo intervalos de la forma I = I1k × · · · × Idk con
aj aj + 1
 
k
Ij = , , a j ∈ Z , k ∈ N ∪ {0} , 1 ≤ j ≤ d , (20)
2k 2k
Integración y conjuntos de medida nula 31

puede conseguirse que la unión sea disjunta. Además, cada uno de


los Ijk –y por tanto cualquier abierto en Rd – puede expresarse como
una unión numerable de intervalos cerrados con interiores disjuntos.

(b) Para cualquier compacto K ⊂ Rd y cualquier abierto O ⊂ Rd tales


que K ⊂ O , existe un abierto U relativamente compacto6 que satis-
face K ⊂ U ⊂ U ⊂ O .

(c) Sean Ω ⊆ Rd un abierto, E ⊂ Ω un subconjunto medible en el senti-


do de Lebesgue y ϕ : Ω → Rd un difeomorfismo C1 regular. Enton-
ces ϕ( E) es medible y
Z
| ϕ( E)| ≤ | det( J ϕ ( x ))| dx ,
E
 
donde J ϕ ( x ) = ∂
∂xi ϕ j ( x ) , 1 ≤ i, j ≤ d, es la matriz jacobiana de ϕ
en x y | ϕ( E)| denota la medida de Lebesgue del conjunto ϕ( E).

Demostración. Comprobamos en primer lugar que todo abierto en Rd


puede expresarse como una unión numerable de intervalos de Rd de la
forma I1k × · · · × Idk , con Ijk como en (22). Es evidente que, para cada k ∈
N ∪ {0}, los intervalos de la forma
d d 
aj aj + 1

k
I = ∏ Ijk =∏ ,
2k 2k
, aj ∈ Z , k ∈ N ∪ {0} ,
j =1 j =1

constituyen un recubrimiento de Rd . Sea entonces Ω ⊆ Rd un abierto cual-


quiera. Consideramos en primer lugar la familia Λ0 formada por todos los
intervalos de la forma anterior con k = 0, es decir I 0 = ∏dj=1 ( a j , a j + 1],
contenidos en Ω. Seguidamente consideramos la familia Λ1 formada por
a a +1
 i
todos los intervalos de la forma I 1 = ∏dj=1 2j , j 2 contenidos en Ω y no
contenidos en ninguno de los anteriores. Continuando con este proceso se
obtiene un conjunto numerable {Λi }i∈N∪{0} de familias de intervalos dis-
juntos dos a dos cuya unión está contenida en Ω. Para concluir la prueba
de (a) basta con observar que se satisface también la inclusión contraria, a
saber, Ω ⊆ ∪i∞=0 Λi . Sean para ello ε > 0, x ∈ Ω, Bε ( x ) ⊂ Ω y k ∈ N ∪ {0}
suficientemente grande para que los intervalos I k tengan diámetro menor
que ε. Entonces x ha de pertenecer a alguno de los I k que, obviamente, ha
6 Esto es, cuya clausura topológica es un conjunto compacto

José L. López
32

de estar contenido en Ω. Como consecuencia, x o bien forma parte de al-


guno de los intervalos que conforman Λk o bien de alguno de los de Λr con
r < k, con lo que la primera parte del enunciado (a) queda demostrada.
Para concluir la prueba de lo expuesto en (a) observamos que
∞ 
aj aj + 1 aj 1 aj
  
[ 1
, = + , + , (21)
2k 2k n =1
2k 2k + n 2k 2k + n −1

intervalos estos últimos con interiores disjuntos.


La prueba de (b) la llevaremos a cabo en dos etapas.
Primera etapa: Si x ∈ O ⊂ Rd , entonces existe un abierto U ⊂ Rd relativa-
mente compacto tal que x ∈ U ⊂ U ⊂ O .
Como Rd es localmente compacto, cualquier x ∈ Rd debe admitir un
entorno V relativamente compacto. En esta situación, se tiene que O ∩ V es
un abierto en Rd relativo a V que contiene a x. Entonces V \ (O ∩ V ) es, por
paso al complementario, un cerrado relativo a V que no contiene a x, luego
la regularidad de Rd (como espacio topológico)7 implica la existencia de
abiertos O1 y O2 relativos a V para los que

(i) x ∈ O1 , (ii) V \ (O ∩ V ) ⊂ O2 , (iii) O1 ∩ O2 = ∅ .

En particular, se tiene que

(iii ) (ii )
A ∩ V = O1 ⊂ O1 ⊂ V \ O2 ⊂ O ∩ V ,

para algún abierto A en Rd . Definimos finalmente U := A ∩ V , que satis-


face claramente la propiedad del enunciado.
Segunda etapa: Prueba de la propiedad enunciada en (b).
Sean K ⊂ Rd un compacto y O ⊂ Rd un abierto tales que x ∈ K ⊂
O . Según lo demostrado en la etapa anterior, ha de existir un abierto re-
lativamente compacto (al que denotaremos U x ) que cumpla x ∈ U x ⊂
U x ⊂ O . En particular, la familia {U x } x∈K constituye un recubrimiento
por abiertos de K, del que se ha de poder extraer un subrecubrimiento
finito {U x1 , . . . , U xn } en virtud de la compacidad de K. Definimos enton-
ces U := U x1 ∪ · · · ∪ U xn , que se trata de un abierto en Rd relativamente
compacto que cumple trivialmente lo deseado.
7 Un
espacio topológico X se dice regular si pueden separarse puntos y cerrados por
medio de abiertos disjuntos, esto es: Dados x ∈ X y C ⊂ X un cerrado cualquiera que no
contenga a x, existen U y V abiertos disjuntos tales que x ∈ U y C ⊂ V
Integración y conjuntos de medida nula 33

La prueba de (c) la efectuaremos también en varias etapas.


Primera etapa: Si ϕ : Rd → Rd es un isomorfismo lineal y Ω ⊆ Rd es un
abierto, entonces8
| ϕ(Ω)| = | det( ϕ)||Ω| .

En efecto: observamos en primer lugar que podemos reducirnos al caso


en que Ω es un intervalo de Rd de la forma

( a1 , b1 ] × · · · × ( ad , bd ] , (22)

y ϕ responde a uno de los tres modelos siguientes:


(i) ϕ( x1 , . . . , xd ) = (λx1 , x2 , . . . , xd ) , λ ∈ R \ {0},

(ii) ϕ( x1 , . . . , xi , . . . , x j , . . . , xd ) = ( x1 , . . . , x j , . . . , xi , . . . , xd ),

(iii) ϕ( x1 , . . . , xd ) = ( x1 + x2 , x2 , . . . , xd ),
pues

(I) si Ω ⊆ Rd fuese un abierto arbitrario podría descomponerse (cf. ítem


(a) del lema) como unión numerable de intervalos disjuntos de la
forma (22), por lo que sería suficiente con usar la σ–aditividad de la
medida de Lebesgue para concluir el razonamiento;

(II) si ϕ fuese un isomorfismo lineal arbitrario podría escribirse

ϕ = ϕ n ◦ ϕ n −1 ◦ · · · ◦ ϕ 1 ,

donde cada una de las aplicaciones ϕ j , 1 ≤ j ≤ n, son como en (i),


(ii) o bien (iii). En ese caso se tendría

| ϕ(Ω)| = | det( ϕn )| · · · | det( ϕ1 )||Ω| = | det( ϕ)||Ω| ,


y con ello el resultado esperado.

Basta entonces con verificar el resultado para los conjuntos de la forma


(22) y las aplicaciones lineales establecidas en (i), (ii) y (iii).
Para el caso (i) se tiene

ϕ(Ω) = (λa1 , λb1 ] × ( a2 , b2 ] × · · · × ( ad , bd ] ,


8 Obsérvese que a lo largo de la prueba identificaremos tácitamente cada isomorfismo
lineal ϕ con su matriz asociada según convenga, de ahí que tengan sentido las expresio-
nes del tipo det( ϕ)

José L. López
34

de donde se concluye que ϕ(Ω) es medible y

| ϕ(Ω)| = λ|Ω| si λ > 0 , | ϕ(Ω)| = −λ|Ω| si λ < 0 ,

luego
| ϕ(Ω)| = |λ||Ω| = | det( ϕ)||Ω| ∀λ 6= 0 .
Por tanto, el resultado es trivialmente satisfecho para la clase de isomor-
fismos lineales especificada en (i). Para el caso de (ii) se tiene claramente
| ϕ(Ω)| = |Ω|, que a su vez coincide con | det( ϕ)||Ω| pues | det( ϕ)| = 1,
luego el resultado es nuevamente satisfecho. Finalmente, para el caso (iii)
se tiene

ϕ(Ω) = ( x1 , . . . , xd ) ∈ Rd tales que




a1 + x2 < x1 ≤ b1 + x2 , a2 < x2 ≤ b2 , . . . , ad < xd ≤ bd ,

por lo que, en virtud del teorema de Fubini (Teorema 6),


Z Z
| ϕ(Ω)| = χ ϕ(Ω) dx = dxd dxd−1 . . . dx1
Rd ϕ(Ω)
Z b Z b Z b3 Z b2 Z b +x 
d d −1 1 2
= ··· dx1 dx2 . . . dxd
ad a d −1 a3 a2 a1 + x2
Z b Z b Z b2 Z b1
d d −1
= ··· dx1 . . . dxd = |Ω| = | det( ϕ)||Ω|
ad a d −1 a2 a1

toda vez que | det( ϕ)| = 1.


Segunda etapa: Si ϕ : Rd → Rd es un isomorfismo lineal y E ⊂ Rd un
conjunto medible, entonces ϕ( E) es un conjunto medible y

| ϕ( E)| = | det( ϕ)|| E| .

En efecto: fijado ε > 0, existen un abierto G y un cerrado F que satisfa-


cen
ε
F ⊆ E ⊆ G , |G \ F| <
| det( ϕ)|
gracias a la medibilidad de E (cf. Definición 4). Claramente ϕ( G ) es abier-
to, ϕ( F ) es cerrado y ϕ( F ) ⊆ ϕ( E) ⊆ ϕ( G ). Además, usando lo demostra-
do en la primera etapa de la prueba se tiene

| ϕ( G ) \ ϕ( F )| = | ϕ( G \ F )| = | det( ϕ)|| G \ F | < ε ,


Integración y conjuntos de medida nula 35

luego ϕ( E) es medible en el sentido de Lebesgue. Por otro lado, en virtud


de la regularidad exterior de la medida de Lebesgue (cf. (7)),
| ϕ( E)| = ı́nf{|O| : ϕ( E) ⊂ O , O abierto}
= ı́nf{| ϕ( G )| : E ⊂ G, G abierto}
= ı́nf{| det( ϕ)|| G | : E ⊂ G, G abierto}
= | det( ϕ)| ı́nf{| G | : E ⊂ G, G abierto} = | det( ϕ)|| E| ,
con lo que concluye la prueba de esta etapa.
Tercera etapa: Si Ω ⊆ Rd es un abierto, I un intervalo compacto de Rd con-
tenido en Ω y ϕ un difeomorfismo C1 regular, entonces se verifica
Z
| ϕ( I )| ≤ | det( J ϕ ( x ))| dx .
I

La prueba de esta parte de la demostración es algo más laboriosa. Co-


menzamos destacando que el conjunto ϕ( I ) es claramente medible por ser
compacto y que la función x ∈ I 7→ | det( J ϕ ( x ))| es integrable por ser
continua (e I compacto). Denotemos a = ( a1 , . . . ad ) el centro de I y r su
semiarista, es decir,9
I = x ∈ Rd : k x − a k ≤ r .


Aplicando el teorema del valor medio para cualquier x ∈ I se obtiene



k ϕ( x ) − ϕ( a)k ≤ sup k J ϕ ( a + λ( x − a))k k x − ak
λ∈(0,1)
 
≤ sup k J ϕ (z)k k x − ak ≤ sup k J ϕ (z)k r .
z∈ I z∈ I

Dicho de otro modo, ϕ( I ) está contenido


 en el intervalo cerrado centrado
en ϕ( a) con semiarista igual a supz∈ I k J ϕ (z)k r. Por tanto,
!d

| ϕ( I )| ≤ sup k J ϕ (z)k |I| . (23)
z∈ I

Fijado x ∈ I, se define ψ := J ϕ ( x )−1 ◦ ϕ. Aplicando a ψ la desigualdad (23)


se obtiene !d
|ψ( I )| ≤ sup k J ϕ ( x )−1 ◦ J ϕ (z)k

|I| . (24)
z∈ I

9 A lo largo de la prueba de este resultado usaremos siempre, por comodidad, la norma

del máximo. Por tanto, cada vez que escribamos k · k debe entenderse k · k∞

José L. López
36

Es evidente que este supremo se alcanza, pues z 7→ k J ϕ ( x )−1 ◦ J ϕ (z)k es


una función continua en I. Por otra parte, según lo demostrado en la se-
gunda etapa de la prueba se sabe que

| ϕ( I )|
|ψ( I )| = | det( J ϕ ( x )−1 )|| ϕ( I )| = . (25)
| det( J ϕ ( x ))|

Combinando ahora (24) y (25) se llega a que


!d
| ϕ( I )| ≤ | det( J ϕ ( x ))| sup k J ϕ ( x )−1 ◦ J ϕ (z)k

|I| . (26)
z∈ I

Por consiguiente, podemos concluir que para cada x ∈ I existe z0 ∈ I tal


que
| ϕ( I )| ≤ | det( J ϕ ( x ))|k J ϕ ( x )−1 ◦ J ϕ (z0 )kd | I | . (27)
No es menos cierto que la función ( x, z) ∈ I × I 7→ k J ϕ ( x )−1 ◦ J ϕ (z)k es
continua en el compacto I × I, luego uniformemente continua. Por tanto,
fijado ε > 0 podemos considerar, en virtud de la compacidad de I y del
Lema 1 (a), la descomposición finita
n
[
I= Ik , Ik intervalos cerrados y disjuntos dos a dos ,
k =1

de modo que si x, z ∈ Ik para algún 1 ≤ k ≤ n, entonces se verifica

|k J ϕ ( x )−1 ◦ J ϕ (z)k − k J ϕ ( x )−1 ◦ J ϕ ( x )k| < ε

y, consecuentemente,

k J ϕ ( x )−1 ◦ J ϕ (z)k < 1 + ε en Ik .

Para cada intervalo Ik , sea ahora xk ∈ Ik tal que



| det( J ϕ ( xk ))| = ı́nf | det( J ϕ (z))| .
z∈ Ik

Entonces existe zk ∈ Ik tal que la fórmula (27) puede aplicarse en Ik para


determinar que

| ϕ( Ik )| ≤ | det( J ϕ ( xk ))|k J ϕ ( xk )−1 ◦ J ϕ (zk )kd | Ik |


Z
d d
< | det( J ϕ ( xk ))|(1 + ε) | Ik | ≤ (1 + ε) | det( J ϕ (z))| dz ,
Ik
Integración y conjuntos de medida nula 37

luego
n n Z
| ϕ( I )| = ∑ | ϕ( Ik )| < (1 + ε ) d
∑ | det( J ϕ (z))| dz
k =1 k=1 Ik
Z
= (1 + ε ) d | det( J ϕ (z))| dz
I

en virtud de las Proposiciones 3 (b) y 4 (c). Haciendo finalmente ε → 0


concluye esta etapa de la demostración.
Cuarta etapa: Si O es un abierto en Rd contenido en Ω y ϕ un difeomorfismo
C1 regular, entonces ϕ(O) es medible y
Z
| ϕ(O)| ≤ | det( J ϕ ( x ))| dx .
O

En efecto: ϕ(O) es claramente abierto y, por consiguiente, un conjunto


medible. Basta entonces con considerar (cf. (a) del Lema 1)

[
O= In , In intervalos cerrados y disjuntos dos a dos ,
n =1

en cuyo caso se tiene (nuevamente en virtud de las Proposiciones 3 (b) y 4


(c))
∞ ∞ Z Z
| ϕ(O)| = ∑ | ϕ( In )| ≤ ∑ | det( J ϕ ( x ))| dx =
O
| det( J ϕ ( x ))| dx ,
n =1 n=1 In

para lo que se ha usado el resultado demostrado en la tercera etapa de la


prueba.10
Quinta etapa: Si E es un subconjunto medible de Ω y ϕ un difeomorfismo C1
regular, entonces ϕ( E) es medible y
Z
| ϕ( E)| ≤ | det( J ϕ ( x ))| dx .
E

Para probar este resultado podemos reducirnos al caso en que la fun-


ción x 7→ | det( J ϕ ( x ))| es acotada en Ω. En efecto, de no ser así bastaría
con considerar

Ω= Ωn , con Ωn = { x ∈ Ω : | det( J ϕ ( x ))| < n} ,
[

n =1
10 Nótese que los In son, de hecho, compactos (cf. (21))

José L. López
38

y argumentar sobre cada Ωn . Supongamos entonces que

| det( J ϕ ( x ))| ≤ M ∀ x ∈ Ω

y sea ε > 0. Como E es medible, ha de cumplirse la consabida propiedad


ε
F ⊆ E ⊆ G ⊆ Ω, |G \ F| < ,
M
para algún abierto G y algún cerrado F en Ω. Entonces ϕ( G ) es abierto,
ϕ( F ) es cerrado y ϕ( F ) ⊆ ϕ( E) ⊆ ϕ( G ). Además, gracias al resultado
demostrado en la cuarta etapa de la prueba se tiene
Z
| ϕ( G ) \ ϕ( F )| = | ϕ( G \ F )| ≤ | det( J ϕ ( x ))| dx ≤ M| G \ F | < ε ,
G\ F

de donde se sigue que ϕ( E) es medible. Finalmente


Z
| ϕ( E)| ≤ | ϕ( G )| ≤ | det( J ϕ ( x ))| dx
Z G Z
= | det( J ϕ ( x ))| dx + | det( J ϕ ( x ))| dx
F G\ F
Z Z
≤ | det( J ϕ ( x ))| dx + M| G \ F | < | det( J ϕ ( x ))| dx + ε
E E

como consecuencia de las Proposiciones 3 (c), 4 (b) y (c) y la etapa anterior


de la demostración. Al hacer ahora ε → 0 se obtiene
Z
| ϕ( E)| ≤ | det( J ϕ ( x ))| dx ,
E

con lo que concluye la prueba de esta etapa y, con ella, la del lema.


Teorema 7 (Teorema del cambio de variable). Sean Ω ⊆ Rd un abierto,


ϕ : Ω → Rd un difeomorfismo C1 regular y f : ϕ(Ω) → R una función
integrable en el sentido de Lebesgue. Entonces
Z Z
f ( x ) dx = ( f ◦ ϕ)( x )| det( J ϕ ( x ))| dx .
ϕ(Ω) Ω

Demostración. Observamos en primer lugar que si se prueba la desigual-


dad Z Z
f ( x ) dx ≤ ( f ◦ ϕ)( x )| det( J ϕ ( x ))| dx (28)
ϕ(Ω) Ω
Integración y conjuntos de medida nula 39

para cualquier difeomorfismo C1 regular ϕ : Ω → Rd , entonces la de-


sigualdad contraria se demuestra de forma inmediata sin más que aplicar
(28) a ϕ−1 . En efecto: si definimos g( x ) := ( f ◦ ϕ)( x )| det( J ϕ ( x ))| se obtie-
ne
Z Z
( f ◦ ϕ)( x )| det( J ϕ ( x ))| dx = g( x ) dx
Ω ϕ−1 ( ϕ(Ω))
Z
≤ ( g ◦ ϕ−1 )( x )| det( J ϕ−1 ( x ))| dx
ϕ(Ω)
Z
= f ( x ) dx .
ϕ(Ω)

Por consiguiente, es suficiente con demostrar que la desigualdad (28) es


satisfecha. Supongamos inicialmente que f ≥ 0 en ϕ(Ω) y demostremos
en primera instancia la desigualdad (28) para funciones simples de la for-
ma
n
s( x ) = ∑ α i χ Ai ( x ) , 0 ≤ s( x ) ≤ f ( x ) ,
i =1

donde los conjuntos Ai ⊂ ϕ(Ω) son medibles para todo 1 ≤ i ≤ n, disjun-


tos dos a dos y tales que su unión coincide con ϕ(Ω). En ese caso
Z n n Z

ϕ(Ω)
s( x ) dx = ∑ αi | Ai | ≤ ∑ αi ϕ −1 ( A i )
| det( J ϕ ( x ))| dx
i =1 i =1
n Z
≤ ∑ −1
( f ◦ ϕ)( x )| det( J ϕ ( x ))| dx
i =1 ϕ ( A i )
Z
= ( f ◦ ϕ)( x )| det( J ϕ ( x ))| dx

gracias al Lema 1 (c) y a la Proposición 4 (b) y (c). Tomando ahora supre-


mos sobre el conjunto {s simple : 0 ≤ s ≤ f } se obtiene (recuérdese la
Definición 5 (b) de la integral de Lebesgue)
Z Z
f ( x ) dx ≤ ( f ◦ ϕ)( x )| det( J ϕ ( x ))| dx .
ϕ(Ω) Ω

Finalmente, si no fuese f ≥ 0 bastaría con considerar la descompo-


sición f = f + − f − , donde f + y f − denotan respectivamente las partes
positiva y negativa de f (cf. Proposición 2 (c)).


José L. López
40

Aplicación: Coordenadas polares en Rd y medida de bolas y esferas


Para d > 1 se considera la siguiente transformación:
ϕ : (0, ∞) × [0, π ] × · · · × [0, π ] × [0, 2π ] ⊂ Rd → Rd ,
definida como ϕ(r, θ1 , . . . , θd−1 ) := ( x1 , . . . , xd ) = x, donde
x1 (r, θ1 , . . . , θd−1 ) = r cos(θ1 ) ,
x j (r, θ1 , . . . , θd−1 ) = r sen(θ1 ) . . . sen(θ j−1 ) cos(θ j ) , 2 ≤ j ≤ d − 1 ,
xd (r, θ1 , . . . , θd−1 ) = r sen(θ1 ) . . . sen(θd−1 ) .
Claramente r = | x | y ϕ es una parametrización de la esfera (d − 1)–
dimensional de radio r. Un sencillo ejercicio de cálculo nos permite afirmar
que
| det( J ϕ ( x ))| = r d−1 sen(θ1 )d−2 sen(θ2 )d−3 . . . sen(θd−2 ) .
Por tanto, si f es integrable en Rd ha de cumplirse, según el teorema de
cambio de variable (Teorema 7) y el teorema de Fubini (Teorema 6), la
siguiente identidad:
Z
f ( x ) dx
Rd
Z 2π Z π Z πZ ∞
= ... r d−1 sen(θ1 )d−2 . . . sen(θd−2 ) f (rω ) dr dθ1 . . . dθd−1
0 0 0 0
Z ∞ Z 
= r d −1 f (rω ) dω dr , (29)
0 Sd −1

donde ω = ω (θ1 , . . . , θd−1 ) denota la parametrización de la esfera unidad


inducida por ϕ y donde además hemos hecho la identificación
Z
f (rω )dω
Sd −1
Z 2π Z π Z π
:= ... f (rω ) sen(θ1 )d−2 . . . sen(θd−2 ) dθ1 . . . dθd−1 . (30)
0 0 0

Las nuevas coordenadas (r, θ1 , . . . , θd−1 ) reciben el nombre de coordenadas


polares en Rd . Demostramos finalmente las fórmulas (2) y (3).
Proposición 5 (Superficie y volumen de la esfera). Para todo d > 1 se tiene
d d
d −1 2π 2 d R d d −1 2π 2 Rd
|S |=  , | BR ( x )| = | B1 (0)| R = |S | =  ,
Γ d2 d d Γ d2

donde Sd−1 es la esfera unidad en Rd , Br (z) es la bola euclídea d–dimensional


de radio r centrada en z y Γ(λ) es la función Gamma.
Integración y conjuntos de medida nula 41

Demostración. El teorema de Fubini (Teorema 6) nos permite escribir


Z d Z ∞ Z ∞
d
− x2j d

Rd
e −k x k2
dx = ∏ e dx j = e − x2
dx = π2 ,
j =1 − ∞ −∞

donde la última igualdad se obtiene como consecuencia del siguiente cálcu-


lo:
Z ∞ 2 Z Z 2π Z ∞ 
− x2 −k x k2 −r 2
e dx = e dx = re dr dθ = π ,
−∞ R2 0 0

para el que se han introducido coordenadas polares en R2 . Aplicando aho-


ra la fórmula de integración (29) resulta
Z Z Z ∞
2 2
e−k xk dx = r d−1 e−r dr dω
Rd Sd −1 0
| Sd −1 | ∞ | Sd −1 |
 
d
Z
d
= u 2 −1 e −u
du = Γ ,
2 0 2 2
donde se ha utilizado el teorema√ de cambio de variable (Teorema 7) aplica-
do a la transformación ϕ : u 7→ u. Por otra parte, es claro que | BR ( x )| =
| B1 ( x )| Rd = | B1 (0)| Rd en virtud de lo probado en la primera etapa de la
demostración del Lema 1 (b) y de la propiedad de invariancia por trasla-
ciones de la medida de Lebesgue. La prueba concluye tras observar que

| Sd −1 |
Z Z Z 1
| B1 (0)| = χk xk≤1 dx = r d−1 dr dω = ,
Rd Sd −1 0 d
para lo que se ha empleado nuevamente la fórmula (29).


Observación 4 (Sobre la función Gamma). Por comodidad para el lector


recordamos brevemente la definición y algunas de las propiedades más
importantes de la función Gamma. La función Gamma se define por me-
dio de la siguiente expresión integral:
Z ∞
Γ(λ) = e−t tλ−1 dt ,
0

la cual es convergente para valores positivos del parámetro λ. Integrando


por partes es fácil comprobar que

Γ ( λ + 1)
Γ(λ) = . (31)
λ

José L. López
42

20

10

-3 -2 -1 1 2 3

-10

-20

Figura 1: Representación gráfica de la función Gamma en el intervalo (−3, 3).

Asimismo, por integración directa se observa que Γ(1) = 1. Combinando


esta última propiedad con (31) se concluye que

Γ ( n ) = ( n − 1) ! ∀n ∈ N.

Por tanto, se puede afirmar que la función Gamma interpola a los datos
(n − 1)! cuando se consideran como nodos los números naturales. Final-
mente, se puede extender la definición de Γ(λ) para valores λ < 0 tales
que λ ∈/ Z, de forma que la ecuación funcional Γ(λ) = (λ − 1)Γ(λ − 1) se
siga cumpliendo. Por consiguiente, la función Gamma tiene singularida-
des en Z0− (véase Figura 4).


Fundamentos de Topología y Análisis Funcional


Esta sección está dedicada a asentar algunos conceptos generales y es-
tablecer varios resultados clásicos de Topología y de Análisis Funcional
Fundamentos de Topología y Análisis Funcional 43

que harán acto de presencia en repetidas ocasiones a lo largo del desarro-


llo del presente curso. Para indagar sobre la temática que (brevemente) se
expone a continuación son muy recomendables los textos [Yos], [Rud2],
[Bre], [Lax], [Mor], [RS1] y [Zei], entre otros. Comenzamos recordando al-
gunas nociones clave y destacando los aspectos más relevantes relaciona-
dos con la completitud de un espacio métrico. En adelante X 0 denotará
el dual topológico de X, es decir, el espacio vectorial formado por todos
los operadores lineales y continuos L : X → R. El dual topológico de un
espacio admite una norma natural definida del siguiente modo:

k Lk X 0 = sup {| L( x )|} . (32)


k x k X ≤1

Análogamente X 00 denotará el bidual topológico de X, constituido por to-


dos los operadores lineales y continuos definidos sobre X 0 .
Definición 9. Un espacio métrico X se dice

(a) completo si toda sucesión de Cauchy en X es convergente;

(b) separable si existe un subconjunto D ⊂ X numerable y denso.

Un espacio vectorial es

(c) un espacio de Banach si es normado y completo;

(d) un espacio de Hilbert si admite un producto escalar que lo hace com-


pleto.

Un espacio de Banach X (dotado de la norma k · k X ) se dice

(e) reflexivo si la aplicación canónica i : X → X 00 definida como

hi ( x ), f i X 00 ,X 0 = h f , x i X 0 ,X , f ∈ X0 , x ∈ X , (33)

es sobreyectiva, donde los corchetes h·, ·i A,B hacen referencia a la


dualidad existente entre los espacios A y B a que pertenecen los ele-
mentos considerados y a su correspondiente acción;

(f) uniformemente convexo si para todo ε > 0 existe δ = δ(ε) > 0 tal que,
dados cualesquiera x, y ∈ X con k x k X ≤ 1, kyk X ≤ 1 y k x − yk X > ε,
se tiene x + y
< 1−δ.

2

X

José L. López
44

Es decir: dados cualesquiera dos elementos x, y en la bola unidad


de X cerrada y centrada en el origen, separados por una distancia
superior a ε, el punto medio del segmento que los une cae siempre
en el interior de la bola, a una distancia no inferior a δ de la frontera
de la misma.

Observación 5. La convexidad uniforme es una propiedad intrínseca de


la norma empleada, en tanto que pueden existir otras normas equivalentes
en el mismo espacio que no sean uniformemente convexas.


Ejemplo 5. Algunos ejemplos destacados de normas uniformemente con-


vexas son los siguientes.
q
(a) En Rd , la norma euclídea k x k E = x12 + · · · + xd2 es uniformemente
convexa mientras que la norma de la suma k x kS = | x1 | + · · · + | xd |
no lo es. Este ejemplo ilustra adecuadamente el hecho de que la con-
vexidad uniforme de un espacio está íntimamente ligada a la redon-
dez de la bola unidad del mismo (cf. Ejercicio 17).

(b) Todo espacio de Hilbert es uniformemente convexo. En efecto: en


cualquier espacio vectorial normado ( X, k · k X ) cuya norma derive
de un producto escalar (·, ·) X , es decir,
q
kxkX = ( x, x ) X ,

se satisface la llamada ley del paralelogramo:11

k x + yk2X + k x − yk2X = 2 k x k2X + kyk2X .



(34)

Verificar entonces que la norma es uniformemente convexa no pasa


de un√sencillo ejercicio (compruébese que basta con elegir δ(ε) =
1 − 12 4 − ε2 ).

Teorema 8 (Baire). Sea ( X, d) un espacio métrico completo no vacío. En-


tonces la intersección de cualquier familia numerable de abiertos densos
en X es densa en X.
11 De hecho, la ley del paralelogramo caracteriza a los espacios de Hilbert
Fundamentos de Topología y Análisis Funcional 45

Demostración. Sea {On } una familia numerable de conjuntos abiertos y


densos en X. Para demostrar que O = ∞ n=1 On es un conjunto denso en X
T

bastará con observar que interseca a cualquier bola abierta (no vacía) de X.
Sean para ello x1 ∈ X y r1 > 0. Se define entonces B1 = { x ∈ X : d( x, x1 ) <
r1 }. Como O1 es abierto y denso en X, claramente O1 ∩ B1 es abierto y
no vacío. En consecuencia, han de poder elegirse x2 ∈ B1 y r2 > 0 tales
que B2 ⊂ O1 ∩ B1 . En particular, podríamos tomar d( x2 , x1 ) < r2 < r21 .
Repitiendo este proceso sucesivamente con cada uno de los On , se obtiene

B3 ⊂ O2 ∩ B2 , B4 ⊂ O3 ∩ B3 , ...

Incluso puede construirse la sucesión de radios para que satisfaga {rn } →


0 cuando n → ∞ (por ejemplo, eligiendo sistemáticamente rn < 2nr−1 1 ), con
lo que
Bn+1 ⊂ On ∩ Bn ⊂ On ∩ B1 ∀n ∈ N . (35)
Por otro lado, la sucesión { xn } así construida es de Cauchy, ya que para
cualesquiera p, q ≥ n0 ∈ N se tiene que x p , xq ∈ Bn0 y
r1
d( x p , xq ) ≤ d( x p , xn0 ) + d( xn0 , xq ) < 2rn0 < .
2 0 −2
n

Como X es completo, ha de existir x ∈ X tal que { xn } → x cuando n → ∞.


Es claro que, en virtud de (35),

xk ∈ Bn+1 ⊂ On ∩ B1 , ∀k > n,

luego al hacer k → ∞ se desprende que x ∈ Bn+1 ⊂ On ∩ B1 para todo n ∈


N. Por consiguiente, queda patente que O interseca a B1 . Esto concluye la
prueba.

El siguiente corolario refleja la forma en que habitualmente se emplea
el teorema de Baire en las aplicaciones.

Corolario 4. Si un espacio métrico completo no vacío puede expresarse


como unión numerable de una familia de conjuntos cerrados, entonces al
menos uno de ellos ha de tener interior no vacío.

Demostración. Razonamos por reducción al absurdo. Sea X un espacio


métrico completo no vacío y supongamos que pudiera escribirse como

[
X= Cn , (36)
n =1

José L. López
46

donde los conjuntos Cn son todos cerrados con interior vacío. En ese caso
sus complementarios, a saber On = X \ Cn , serían abiertos densos en X,
luego por el teorema de Baire se concluye que el conjunto ∞ n=1 On ha de
T

ser denso en X y, por consiguiente, no vacío. Sin embargo



\ ∞
[
x∈ On ⇒ x ∈ X \ Cn ,
n =1 n =1

lo cual es contradictorio con (36).




Ejemplo 6. Q no puede expresarse como una intersección numerable de


abiertos de R. En efecto: como Q es denso en R, de poderse hacer tendría
que tratarse de una intersección numerable de abiertos densos en R, de
modo que R \ Q y, por tanto,

R = Q∪ R\Q = {q} ∪ R \ Q ,
 [ 
q ∈Q

podrían expresarse como uniones numerables de cerrados con interior va-


cío, lo cual es contradictorio con la tesis del Corolario 4. Dicho en otros
términos, no existe una distancia completa en Q capaz de generar la topo-
logía usual inducida por R.

Teorema 9 (de la aplicación abierta). Sean X, Y espacios de Banach y T :
X → Y una aplicación lineal, continua y sobreyectiva. Entonces T lleva
abiertos de X en abiertos de Y.
Demostración. Denotemos BrZ la bola abierta de Z de radio r centrada en
el origen. Efectuaremos la prueba en tres etapas.
Primera etapa: Para todo ε > 0 existe δ > 0 tal que BδY ⊂ T ( B2ε
X ).

Dado ε > 0, por ser T sobreyectiva y lineal se tiene


∞ 
[  ∞  ∞ 
nBεX T (nBεX ) nT ( BεX ) .
[ [
Y = T(X) = T = =
n =1 n =1 n =1

Aplicando entonces el Corolario 4 (al teorema de Baire) se deduce la exis-


tencia de algún n ∈ N para el que nT ( BεX ) contiene alguna bola de Y,
pongamos BrY (y), luego
y
BYr ⊂ T ( BεX ) . (37)
n n
Fundamentos de Topología y Análisis Funcional 47

De este modo, si definimos los conjuntos


Y y
n  o n o
X
A = y1 − y2 : y1 , y2 ∈ B r , B = x1 − x2 : x1 , x2 ∈ Bε ,
n n
X ) en virtud de (37) (compruébese). Fi-
se tiene que A ⊂ T ( B) ⊂ T ( B2ε
nalmente observamos que cualquier elemento yδ ∈ BδY puede expresarse
como un elemento de A:
 y y
yδ = yδ + − ,
n n
para δ > 0 suficientemente pequeño (δ < nr ), con lo que concluye esta
etapa de la demostración.
X ).
Segunda etapa: Para todo ε 0 > 0 existe δ0 > 0 tal que BδY0 ⊂ T ( B2ε 0

Consideremos una sucesión positiva {ε n } tal que ∑∞


n=1 ε n < ε 0 . Usando
el resultado de la primera etapa de la prueba se concluye la existencia de
una sucesión {δn } tal que
BδYn ⊂ T ( BεXn ) , n ∈ N ∪ {0} . (38)
De hecho, {δn } puede elegirse de forma que satisfaga {δn } → 0 cuando
n → ∞. En efecto: sea y ∈ BδY0 . Aplicando (38) con n = 0 se deduce la
existencia de x0 ∈ BεX0 tal que ky − T ( x0 )kY < δ1 . Como y − T ( x0 ) ∈ BδY1 ,
aplicando nuevamente (38), ahora con n = 1, se verifica que existe x1 ∈ BεX1
tal que ky − T ( x0 ) − T ( x1 )kY < δ2 . Repitiendo este proceso sucesivamente
se concluye además (mediante un simple argumento inductivo) que existe
una sucesión { xn }, con xn ∈ BεXn para todo n ∈ N ∪ {0}, tal que
 n 
y − T ∑ xk < δn+1 . (39)

k =0 Y

Es claro que la serie ∑∞


n=1 xn converge absolutamente, puesto que
∞ ∞
∑ k xn k X ≤ ∑ εn < ε0 ,
n =1 n =1

luego la serie ∑∞ ∞ 12
n=1 xn es convergente (pongamos que ∑n=1 xn = x). En-
12 En efecto: si {sn } = ∑nk=1 xk denota la sucesión de sumas parciales asociada a la


serie ∑∞
k =1 xk , entonces para cualesquiera n, m ∈ N (con n < m) se satisface
( )
m
∑ k xk k X < ε 0 ,

ksm − sn k X ≤
k = n +1

luego {sn } es de Cauchy en X y, por tanto, convergente

José L. López
48

tonces
∞ ∞
kxkX ≤ ∑ k xn k X ≤ ∑ ε n < 2ε 0 .
n =0 n =0

Finalmente, de (39) se desprende que ha de ser y = T ( x ) en virtud de la


continuidad de T y teniendo presente que la sucesión {δn } se ha construi-
do convergente hacia cero.
Tercera etapa: Para cualquier abierto O ⊂ X y para todo y = T ( x ) con x ∈
O , existe una bola BξY tal que y + BξY ⊂ T (O). En particular esto demostraría
que T (O) es abierto, con lo que concluiría la prueba del teorema.
En efecto: como O es abierto en X, para cualquier x ∈ O existen ε > 0
y una bola BεX tales que x + BεX ⊂ O . Usando ahora lo demostrado en la
segunda etapa se deduce la existencia de ξ > 0 tal que BξY ⊂ T ( BεX ), luego

y + BξY = T ( x ) + BξY ⊂ T ( x ) + T ( BεX ) = T ( x + BεX ) ⊂ T (O)

en virtud de la linealidad de T.

El siguiente resultado se nos presenta muy útil porque permite dedu-
cir estimaciones uniformes a partir de estimaciones que en principio son
únicamente puntuales.

Teorema 10 (principio de acotación uniforme13 ). Sean X un espacio de


Banach, Y un espacio vectorial normado y { Ti : X → Y }i∈ I una familia de
operadores lineales y continuos de X en Y. Supongamos que

sup{k Ti ( x )kY } < ∞ ∀x ∈ X. (40)


i∈ I

Entonces
sup{k Ti kL(X,Y ) } < ∞ .
i∈ I

Demostración. Se definen los conjuntos


n o
Cn = x ∈ X : sup{k Ti ( x )kY } ≤ n .
i∈ I

Claramente X = ∞ n=1 Cn gracias a (40). Teniendo en cuenta que los con-


S

juntos Cn son cerrados en X al ser los operadores Ti continuos, alguno de


13 También se encuentra en la literatura con el nombre de teorema de Banach–Steinhaus
Fundamentos de Topología y Análisis Funcional 49

ellos (léase Cm ) ha de contener una bola en virtud del Corolario 4 al teore-


ma de Baire. Supongamos, por tanto, que dados x0 ∈ X y r > 0 se tiene

Br ( x0 ) = { x ∈ X : k x − x0 k X < r } ⊂ Cm .

Dado cualquier x ∈ B1 ( x0 ) es evidente que x0 + rx ∈ Br ( x0 ), luego


 x + rx − x 
k Ti ( x )kY = Ti 0 0

r

Y
1  2m
≤ k Ti ( x0 + rx )kY + k Ti ( x0 )kY ≤ ,
r r
donde se ha usado la linealidad de los operadores Ti . Por consiguiente

2m
k Ti kL(X,Y ) ≤ ∀i ∈ I,
r
con lo que concluye la prueba.


Teorema 11 (Urysohn14 ). Sea ( X, τ ) un espacio topológico normal, esto es:


dados cualesquiera cerrados C1 y C2 de X tales que C1 ∩ C2 = ∅, existen O1
y O2 abiertos disjuntos de X tales que C1 ⊆ O1 y C2 ⊆ O2 . Entonces, si A
y B son cerrados disjuntos de X existe una función continua f : X → [0, 1]
tal que
f (x) = 0 ∀x ∈ A , f (x) = 1 ∀x ∈ B .

Demostración15 . La llevaremos a cabo en tres etapas.


Primera etapa: dado n ∈ N, se puede asignar a cada elemento r del conjunto
nk o
Dn = , k = 1, 2 . . . , 2n − 1 ,
2n
14 El recíproco también es cierto, si bien la implicación más útil en futuras aplicaciones
es la establecida en el enunciado del Teorema 11. En efecto: si ( X, τ ) es un espacio topo-
lógico y para cualesquiera dos cerrados disjuntos A y B de X existe una función continua
f : X → [0, 1] que satisface f ( A) = 0 y f ( B) = 1, entonces los conjuntos

O1 = f −1 ([0, a)) , O2 = f −1 (( a, 1])

son, cualquiera que sea a ∈ (0, 1), abiertos disjuntos de X tales que A ⊆ O1 y B ⊆ O2
15 Reproducimos aquí la demostración del teorema de Urysohn siguiendo las pautas de

[AP], donde esta fue presentada con un espíritu didáctico y un nivel de detalles dignos
de mención

José L. López
50

formado por los números (racionales) diádicos del intervalo [0, 1], un abierto Or ⊂
X tal que

(i) A ⊆ Or , (ii) B ⊆ X \ Or , (iii) Or ⊆ Os si r < s ∈ Dn .

Para comprobarlo haremos uso del principio de inducción completa.

(a) Estudiamos en primer lugar el caso n = 1. Existen, por hipótesis,


abiertos disjuntos U y V que separan A de B, es decir, que verifican
A ⊆ U , B ⊆ V y U ∩ V = ∅. Basta entonces con elegir O 1 = U , pues
2
de esa forma ha de cumplirse B ⊆ X \ O 1 y las propiedades (i) y
2

  n =2, partiendo esta


(ii) son satisfechas. Al repetireste proceso para
vez de los pares de cerrados A, X \ O 1 y O 1 , B , se obtienen los
2 2
abiertos O 1 y O 3 , respectivamente, los cuales han de satisfacer
4 4

A ⊆ O1 , X \ O1 ⊆ X \ O1 , O1 ⊆ O3 , B ⊆ X \ O3 .
4 2 4 2 4 4

Es evidente entonces que

O1 ⊆ O1 ⊆ O1 ⊆ O3 ,
4 2 2 4

luego se verifican las condiciones (i)–(iii).

(b) Se plantea ahora la hipótesis de inducción: suponemos construidos


los abiertos Or asociados a r = 2nk−1 , con k = 1, 2, . . . , 2n−1 − 1, de
modo que las condiciones (i)–(iii) son satisfechas. Esto es:

A⊆O 1 ⊆O 1 ⊆O 2 ⊆ · · · ⊆ O 2n −1 −2 ⊆ O 2n −1 −1 ,
2n −1 2n −1 2n −1 2n −1 2n −1

B ⊆ X \ O 2n −1 −1 .
2n −1

(c) Aplicando repetidamente la propiedad de normalidad de X conclu-


ye el proceso inductivo con la siguiente construcción:
 
Del par de cerrados A, X \ O 1 se obtiene un abierto O 1
2n −1 2n
que satisface
A⊆O 1 ⊆ O 1n ⊆ O 1 .
2n 2 2n −1
Fundamentos de Topología y Análisis Funcional 51

 
Del par de cerrados O 1 ,X \ O 2 se obtiene un abierto
2n −1 2n −1
O 3n que satisface
2

O 1 ⊆ O 3n ⊆ O 3n ⊆ O 2 .
2n −1 2 2 2n −1

Y así sucesivamente, de modo que:


 
En el penúltimo paso, del par de cerrados O 2n−1 −2 , X \ O 2n−1 −1
2n −1 2n −1
se obtiene un abierto O 2n −3 que satisface
2n

O 2n −1 −2 ⊆ O 2n −3 ⊆ O 2n −3 ⊆ O 2n −1 −1 .
2n −1 2n 2n 2n −1

 
En el último paso, del par de cerrados O 2n−1 −1 , B se obtiene
2n −1
un abierto O 2n −1 que satisface
2n

O 2n −1 −1 ⊆ O 2n −1 , B ⊆ X \ O 2n −1 .
2n −1 2n 2n

Segunda etapa: Construcción de f .


Denotamos [
D= Dn .
n ∈N
Entonces se define la función f : X → [0, 1] de la siguiente forma:

si x ∈
/ r ∈ D Or
S
1
f (x) = .
ı́nf{r : x ∈ Or } si x ∈ r∈ D Or
S

Se tiene pues, en virtud de (i) y (ii), que f = 0 en A y f = 1 en B.


Tercera etapa: f es continua.
Distinguiremos tres casos.

(a) f es continua en X0 = { x ∈ X : f ( x ) = 0}.

En efecto: como D es denso en [0, 1], para cualquier ε > 0 existen


n ∈ N (suficientemente grande) y r0 ∈ Dn tales que 0 < r0 < ε. Sea
x0 ∈ X0 . Como f ( x0 ) = 0, ha de ser x0 ∈ Or0 en virtud de la propia
definición de f . Además, es fácil observar que siempre que x ∈ Os
para algún s ∈ D se tiene f ( x ) ≤ s; nótese, para ello, que si fuese

José L. López
52

f ( x ) > s existirían k ∈ N y r ∈ Dk tales que s < r < f ( x ), por lo que


x no podría pertenecer a Or (nuevamente en virtud de la definición
de f ), lo cual contradice claramente la condición (iii). Por tanto

0 ≤ f ( x ) ≤ r0 < ε ∀ x ∈ O r0 ,
luego Or0 es un entorno abierto de x0 que satisface

f (Or0 ) ⊆ [0, ε) .

Esto equivale a afirmar que f es continua en X0 .

(b) f es continua en X1 = { x ∈ X : f ( x ) = 1}.

En efecto: como en el caso anterior, para cualquier ε > 0 han de exis-


tir n ∈ N y r1 ∈ Dn tales que 1 − ε < r1 < 1. Sea x1 ∈ X1 . Como
/ r∈ D Or por definición de f . En particular,
f ( x1 ) = 1, se verifica x1 ∈
S

x1 ∈ / Or cualquiera que sea r ∈ D. Además, se puede observar fácil-


mente que si x ∈ / Or entonces f ( x ) ≥ r; en efecto, nótese que si fuese
f ( x ) < r existirían k ∈ N y s ∈ Dk tales que x ∈ Os y f ( x ) < s < r,
de donde se concluiría que x ∈ Os ⊆ Or en virtud de (iii), lo cual
conduce nuevamente a contradicción. Por consiguiente

1 − ε < r1 ≤ f ( x ) ≤ 1 ∀ x ∈ X \ O r1 ,

luego X \ Or1 es un entorno abierto de x1 que satisface

f ( X \ Or1 ) ⊆ (1 − ε, 1] .

Esto equivale a afirmar que f es continua en X1 .

(c) f es continua en Xα = { x ∈ X : 0 < f ( x ) = α < 1}.

En efecto: se tiene que, para cualesquiera x ∈ Xα y ε > 0, han de


existir r, s ∈ D tales que

f (x) − ε < r < f (x) < s < f (x) + ε .

Claramente x ∈ Os \ Or , pues de no ser así sucedería lo siguiente:

• x∈/ Os ⇒ f ( x ) ≥ s en virtud del argumento expuesto en (b), lo


cual es contradictorio con las anteriores desigualdades. O bien
• x ∈ Or ⇒ f ( x ) ≤ r en virtud (de una extensión inmediata)
del argumento expuesto en (a), lo cual es también obviamente
contradictorio.
Fundamentos de Topología y Análisis Funcional 53

Haciendo uso nuevamente de los argumentos esgrimidos en (a) y en


(b) se obtiene
r ≤ f ( x ) ≤ s ∀ x ∈ O s \ Or ,
luego Os \ Or es un entorno abierto de x que satisface

f (Os \ Or ) ⊆ [r, s] ⊆ f ( x ) − ε, f ( x ) + ε .

Esto equivale a afirmar que f es continua en Xα .


Desembocamos así en el teorema de Hahn–Banach, que constituye una
de las piezas clave del Análisis Funcional. En el siguiente capítulo lo em-
plearemos, a través de algunos de sus corolarios más importantes, a lo lar-
go del proceso de identificación de los duales topológicos de los espacios
de Lebesgue (recogido en el teorema de representación de Riesz).16
Teorema 12 (Hahn–Banach). Sean X un espacio vectorial real, U un subes-
pacio vectorial de X y p : X → R una función que verifica la siguiente
propiedad de sublinealidad:

p(λx ) = λp( x ) , p( x + y) ≤ p( x ) + p(y) ∀ x, y ∈ X , ∀ λ ≥ 0 .

Entonces cualquier operador lineal T : U → R mayorado por p, esto es,


tal que T (u) ≤ p(u) para todo u ∈ U, admite una extensión lineal T e :
X → R que se mantiene mayorada por p. Si, en particular, X es normado
y φ : U → R es un operador lineal tal que φ(u) ≤ C kuk X ∀ u ∈ U y algún
C > 0, entonces φ admite una extensión lineal a X que satisface la misma
desigualdad.
Demostración. Comenzamos construyendo la extensión de T a U + hyi,
para cualquier elemento y de X que no pertenece a U. Para ello basta con
especificar cuánto ha de valer T (y) para que se satisfagan las relaciones

T ( x + λy) = T ( x ) + λT (y) ≤ p( x + λy) , x ∈ U, λ ∈ R .

La desigualdad es cierta por hipótesis si λ = 0. Por otro lado se tiene:


si λ > 0, ha de cumplirse T ( x1 ) + T (y) ≤ p( x1 + y), donde hemos
denotado x1 = λx ;
16 Sibien no es necesario. Algunos autores prefieren prescindir de la generalidad de
los resultados analíticos abstractos en favor de cálculos y argumentos exclusivamente
vinculados al ambiente en que se desarrollan las demostraciones, en este caso el de los
espacios L p (Ω) (véase, por ejemplo, [LL])

José L. López
54

p( x +λy)
si λ < 0, ha de cumplirse T ( x2 ) + T (y) ≥ λ = − p(− x2 − y),
donde hemos denotado x2 = λx .

Combinando ambas condiciones se llega a que

− p(− x2 − y) − T ( x2 ) ≤ T (y) ≤ p( x1 + y) − T ( x1 ) . (41)

La cuestión es entonces: ¿existe un número T (y) tal que las relaciones ex-
puestas en (41) son satisfechas? Para comprobar que la respuesta es afir-
mativa basta con calcular

T ( x1 ) − T ( x2 ) = T ( x1 − x2 ) ≤ p ( x1 − x2 )
= p( x1 + y − x2 − y) ≤ p( x1 + y) + p(− x2 − y) .

Por consiguiente, acabamos de probar que es posible construir una exten-


sión lineal de T a U + hyi que esté dominada por la función p.
Para concluir la demostración es necesario hacer uso del Lema de Zorn.17
Consideremos para ello el orden parcial inducido por la relación de inclu-
sión de conjuntos (R = ⊂), de modo que diremos que dos extensiones
lineales de T dominadas por p, llamémoslas T1 y T2 , están relacionadas
(pongamos que T2 ⊂ T1 ) si el dominio de T1 contiene al de T2 y además T1
y T2 coinciden sobre el dominio de T2 . Con vista a aplicar el lema de Zorn
consideraremos una cadena arbitraria en el conjunto de operadores linea-
les que extienden a T y están dominados por p, ordenada por medio de la
relación ⊂. Para verificar que este conjunto tiene una cota superior basta
con considerar la unión de todos los elementos de la cadena, luego por el
lema de Zorn existe un elemento maximal F en el conjunto que ha de ser
un operador lineal que extiende a T y está dominado por p. Finalmente
destacamos que F ha de estar definido en X, ya que de no ser así se podría
seguir extendiendo linealmente el operador según el patrón descrito en la
primera parte de la prueba (en particular, F no sería maximal en contra de
lo dictado por el lema de Zorn). La última parte del enunciado del teorema
17 Un conjunto parcialmente ordenado es un par ( X, R) en el que X es un conjunto y R es
una relación en X tal que las dos siguientes propiedades son satisfechas:
(a) [Reflexividad] x R x ∀ x ∈ X;
(b) [Transitividad] si x Ry e yRz, entonces x Rz.
Si, además, dados dos elementos x, y cualesquiera de X se cumple que x Ry o bien yR x,
entonces X se dice totalmente ordenado (o cadena). El lema de Zorn establece que cualquier
conjunto parcialmente ordenado contiene un elemento maximal (es decir, un elemento
m ∈ X tal que el único x ∈ X que satisface m ≤ x es x = m) si cada subconjunto
totalmente ordenado admite una cota superior
Fundamentos de Topología y Análisis Funcional 55

es un caso particular del mismo que resulta de elegir p( x ) = C k x k X , con


C ∈ R.

Muchos son los resultados que emanan del tronco principal que con-
forma el teorema de Hahn–Banach. En particular, el que presentamos a
continuación constituye una herramienta muy provechosa para demostrar
que un subespacio es denso en el total.18
Corolario 5. Sea ( X, k · k) un espacio vectorial normado y U un subespa-
cio vectorial de X. Si x ∈ X y
d( x, U ) := ı́nf {k x − uk} > 0 ,
u ∈U

entonces existe un operador lineal y continuo φ : X → R tal que φ(u) = 0


para todo u ∈ U, φ( x ) = 1 y
1
kφkL(X,R) = .
d( x, U )

Demostración. Sea V = hU, x i el subespacio vectorial generado por U y


x. Claramente todo elemento v ∈ V admite una representación única de
la forma v = u + λx, donde u ∈ U y λ ∈ R. Se define φ(u + λx ) := λ.
Entonces φ(u) = 0 y φ( x ) = 1. Además
|φ(u + λx )|
 
kφkL(V,R) = sup
{u∈U,λ∈R : 06=u+λx ∈V } ku + λx kV
|λ|
 
= sup
{u∈U,λ∈R : 06=u+λx ∈V } k u + λx kV
 
 
 1 
= sup
{u∈U,λ∈R : 06=u+λx ∈V } 
 λu + x 

V
1 1
= = .
ı́nf{k x − wkV : w ∈ U } d( x, U )
Finalmente, el (último enunciado del) teorema de Hahn–Banach permite
extender linealmente el operador φ a todo el espacio sin que aumente su
norma, de lo que se desprende su continuidad.
18 Enefecto, leído en su forma contrarrecíproca, el resultado afirma que si el único ope-
rador lineal y continuo que se anula sobre el subespacio U es el constantemente nulo,
entonces la clausura de U ha de coincidir con el espacio total

José L. López
56


El teorema de Milman para espacios uniformemente convexos será la
pieza clave que nos permita deducir la reflexividad de los espacios de Le-
besgue en el siguiente capítulo. Para llegar a demostrarlo comenzamos
estableciendo el siguiente resultado preliminar.
Teorema 13 (Helly). Sean X un espacio de Banach, { f i : X → R}1≤i≤n una
familia finita de operadores lineales y continuos en X y λ1 , . . . , λn ∈ R. En
tales condiciones, para todo ε > 0 existe xε ∈ X tal que
(a) f i ( xε ) = λi , 1 ≤ i ≤ n,
(b) k xε k X ≤ α + ε,

si y solamente si
n n
∑ µi λi ≤ α ∑ µi f i (42)

i =1 i =1 X0

para algún α > 0 y cualesquiera µ1 , . . . , µn ∈ R.


Demostración. De izquierda a derecha: Fijemos µ1 , . . . , µn arbitrariamente.
De (a) y (b) se desprende entonces que, para cualquier ε > 0, existen xε ∈
X y α > 0 tales que
n n n n
∑ µi λi = ∑ µi f i ( x ε ) ≤ ∑ µi f i 0 k x ε k X ≤ ∑ µi f i 0 ( α + ε ) ,

i =1 i =1 i =1 X i =1 X

de donde se deduce el resultado deseado.


De derecha a izquierda: Podemos suponer, sin pérdida de generalidad,
que la familia { f 1 , . . . , f n } es linealmente independiente; si no lo fuese,
algún subconjunto suyo habría de serlo a buen seguro y generaría el mis-
mo subespacio vectorial que la familia original. Definimos entonces Φ :
X → Rn como Φ( x ) = ( f 1 ( x ), . . . , f n ( x )) y denotamos λ = (λ1 , . . . , λn )
y BαX+ε la bola de X de radio α + ε centrada en el origen. Claramente Φ
es lineal, continua y sobreyectiva (si damos por cierto lo establecido en la
propiedad (a)), por lo que el teorema de la aplicación abierta (Teorema 9)
permitiría asegurar que Φ( BαX+ε ) contiene al vector nulo de Rn como pun-
to interior. La prueba concluye vía un argumento de reducción al absurdo
sobre la condición (b). En efecto: si suponemos que λ ∈ / Φ( BαX+ε ), lo que
en particular supone que ha de ser λ 6= 0, el Corolario 5 (al teorema de
Hahn–Banach) garantiza la existencia de L ∈ (Rn )0 tal que

0 = L(Φ( x )) < L(λ) = 1 ∀ x ∈ BαX+ε . (43)


Fundamentos de Topología y Análisis Funcional 57

Además, el operador L : Rn → R puede ser representado mediante un


vector µ := (µ1 , . . . , µn ) ∈ Rn del siguiente modo:
n
L(λ) = ∑ µi λi ,
i =1

que no es más que el isomorfismo canónico que permite identificar (Rn )0


con Rn . Entonces, de (43) se deduce
n n
∑ µi f i ( x ) < ∑ µi λi ∀ x ∈ BαX+ε .

i =1 i =1

Tomando finalmente supremos en BαX+ε se concluye que (cf. (32))


n n
( α + ε ) ∑ µi f i 0 ≤ ∑ µi λi ,

i =1 X i =1

lo cual contradice (42).




Teorema 14 (Milman19 ). Todo espacio de Banach uniformemente convexo


es reflexivo.
Demostración [Kakutani]. Sea X un espacio de Banach uniformemente
convexo. El objetivo de la prueba consiste en demostrar que, dado F ∈
X 00 , existe x ∈ X tal que i ( x ) = F, donde i : X → X 00 es la aplicación
canónica definida en (33). Esta propiedad es obvia si F = 0, por lo que
podemos reducirnos al caso en que k F k X 00 = 1 sin perder generalidad
alguna. Efectuamos la demostración en varias etapas.
Primera etapa: Dado F ∈ X 00 con k F k X 00 = 1, existen una sucesión { xk } y
una familia finita { f 1 , . . . , f n } ⊂ X 0 tales que
xk ∈ B1X+ 1 ∀ k ∈ N , lı́m {k xk k} = 1 y f i ( xk ) = F ( f i ) ∀ 1 ≤ i ≤ n .
k k→∞

En efecto: como k F k X 00 = 1, existe una sucesión { f k } ⊂ X 0 que satisface


k f k k X 0 ≤ 1 y | F ( f k )| ≥ 1 − 1k para todo k ∈ N (cf. (32)). Aplicando entonces
el teorema de Helly (Teorema 13, implicación de derecha a izquierda) con
1
λi = F ( f i ) , α = k F k X 00 = 1 , ε= ,
k
19 Enocasiones este resultado (Milman, 1938) aparece referido en la literatura como
teorema de Milman–Pettis, ya que este último publicó una demostración del mismo en
1939 [Pettis, B. J. A proof that every uniformly convex space is reflexive. Duke Math. J. 5(2),
249–253, 1939]

José L. López
58

se deduce la existencia de una sucesión { xk } ⊂ X tal que

f i ( x k ) = F ( f i ), 1 ≤ i ≤ n, (44)

que además satisface


1
k xk k X ≤ 1 + , (45)
k
pues
n  n  n
∑ µi F ( f i ) = F ∑ µi f i ≤ k F k X 00 ∑ µi f i .

i =1 i =1 i =1 X0

Como
1 1
1− ≤ | F ( f k )| = | f k ( xk )| ≤ k f k k X 0 k xk k X ≤ k xk k X ≤ 1 +
k k
para todo 1 ≤ k ≤ n y n ∈ N es arbitrario, se tiene también que

lı́m {k xk k X } = 1 . (46)
k→∞

Segunda etapa: { xk } converge fuertemente hacia un elemento x ∈ X que


resuelve el sistema de ecuaciones (44) en B1X .
En efecto: de no producirse la convergencia fuerte de { xk } en X, exis-
tirían ε > 0 y n1 < m1 < n2 < m2 < · · · < nk < mk < . . . tales que

k x mk − x nk k X > ε , k ∈ N .20 (47)


Entonces

x x x
nk mk mk
≤ 1, < ≤1

1 + 1 1 + 1 1 + 1


nk X nk X m k X

conforme a (45) y
x − x ε
mk nk
>
1+ 1 2

n k X
en virtud de (47). Por otra parte, gracias a la convexidad uniforme de X se
satisface

x +x
mk nk
  < 1 − δ ,
2 1 + 1
nk
X
20 Nóteseque es aquí donde se pone de manifiesto el hecho de que X es un espacio de
Banach, luego completo
Fundamentos de Topología y Análisis Funcional 59

luego
 1
k x m k + x n k k X < 2(1 − δ ) 1 +
nk
y, por consiguiente,

lı́m sup{k xmk + xnk k X } ≤ 2(1 − δ) < 2 . (48)


k→∞

Además, como consecuencia de (44) se tiene

f nk ( x nk ) = f nk ( x mk ) = F ( f nk ) ,

por lo que
 1
2 1− ≤ 2| F ( f nk )| = | f nk ( xmk + xnk )|
nk
≤ k f nk k X 0 k x mk + x nk k X ≤ k x mk + x nk k X ,

lo cual contradice (48). Luego lı́mk→∞ { xk } = x tal que k x k X = 1 (según lo


demostrado en la etapa anterior), y las siguientes igualdades son satisfe-
chas en virtud de la continuidad de f i :

f i ( x ) = F ( f i ), 1 ≤ i ≤ n. (49)

Tercera etapa: La solución del sistema de ecuaciones (49) es única en B1X .


En efecto: de no serlo existiría un elemento y ∈ B1X (distinto de x) que
satisfaría las mismas ecuaciones, por lo que, en vista de la convexidad uni-
forme de X, habría de cumplirse k x + yk X < 2. Además, conforme a (49)
y a la linealidad de los operadores f i también serían válidas las relaciones

f i ( x + y) = 2F ( f i ) , 1 ≤ i ≤ n,

luego
 1
2 1− ≤ 2| F ( f i )| = | f i ( x + y)| ≤ k f i k X 0 k x + yk X ≤ k x + yk X
i
y por tanto
n  1 o
k x + yk X ≥ lı́m 2 1 − = 2,
i→∞ i
lo que nos conduce a una nueva contradicción.
Cuarta etapa: X es reflexivo.

José L. López
60

Sea un elemento cualquiera f 0 ∈ X 0 . Probaremos a continuación que


F ( f 0 ) = f 0 ( x ), a raíz de lo cual podremos afirmar que la aplicación canóni-
ca i : X → X 00 es sobreyectiva y, con ello, que X es reflexivo. Consideremos
para ello la familia de operadores { f 0 , f 1 , . . . , f n } en lugar de{ f 1 , . . . , f n }.
Repitiendo los argumentos anteriores se obtiene y ∈ X con kyk X = 1 y tal
que
f i (y) = F ( f i ), i ∈ {0, . . . , n} .

Finalmente, en virtud de la unicidad de solución en B1X para el sistema


de ecuaciones (49) se deduce que ha de ser y = x, con lo que concluye la
prueba.21


Ejemplo 7. Los espacios de Banach de dimensión finita son todos reflexi-


vos como consecuencia del teorema de Milman y de la convexidad unifor-
me de la norma euclídea k · k2 , pues cualquiera de ellos es topológicamente
isomorfo a (Rd , k · k2 ).


A continuación abordamos algunos de los teoremas de completación y


extensión más significativos.

Teorema 15 (Completación de un espacio métrico). Sea ( X, d) un espacio


métrico (no completo). Entonces existe un espacio métrico completo ( X,
e de)
tal que X es isométrico a un subconjunto denso de X.
e

Demostración. Consideremos la familia formada por todas las sucesiones


de Cauchy { xn } ⊂ X relacionadas entre sí de la siguiente forma:

{ xn } ∼ {yn } si lı́m {d( xn , yn )} = 0 .


n→∞

Es sencillo comprobar que esta relación es de equivalencia. Se define en-


tonces el conjunto cociente ( X,e ∼) formado por todas las clases de equiva-
lencia xe = [{ xn }] de sucesiones de Cauchy en X según la relación anterior.
Se define también la siguiente métrica en X:e

de( xe, ye) = de([{ xn }], [{yn }]) := lı́m {d( xn , yn )} . (50)
n→∞

21 Aunque no se haya hecho notar previamente, conviene observar que el hecho de ha-
ber elegido F unitario en la primera etapa de la demostración no supone pérdida alguna
de generalidad, pues cualquier otra elección no trivial de un elemento de X 00 puede nor-
malizarse convenientemente a la unidad sin más que dividir por su norma
Fundamentos de Topología y Análisis Funcional 61

Efectuaremos la demostración en varias etapas.


Primera etapa: La métrica de está bien definida.
Para garantizar que la definición de detiene sentido se ha de comprobar
que
(i) el límite de (50) existe
y que
(ii) la definición hecha no depende del representante escogido en cada
clase de equivalencia, es decir: si { xn1 } ∼ { xn2 } e {y1n } ∼ {y2n }, enton-
ces
lı́m {d( xn1 , y1n )} = lı́m {d( xn2 , y2n )} .
n→∞ n→∞

Comenzamos verificando (i). Sean { xn } e {yn } dos sucesiones de Cauchy


en X. En virtud de la desigualdad triangular de d se tiene

|d( xn , yn ) − d( xm , ym )| ≤ |d( xn , yn ) − d( xn , ym )| + |d( xn , ym ) − d( xm , ym )|


≤ d(yn , ym ) + d( xn , xm ) .

Por tanto, dados n, m ∈ N suficientemente grandes el segundo miembro


de la desigualdad anterior puede hacerse tan pequeño como se desee, lue-
go la sucesión {d( xn , yn )} es de Cauchy en R y, por consiguiente, conver-
gente.
Para hacer la comprobación de (ii) se usa nuevamente la desigualdad
triangular de la métrica, que garantiza en este caso que

|d( xn1 , y1n ) − d( xn2 , y2n )| ≤ |d( xn1 , y1n ) − d( xn1 , y2n )| + |d( xn1 , y2n ) − d( xn2 , y2n )|
≤ d(y1n , y2n ) + d( xn1 , xn2 ) .

Basta entonces con observar que el segundo miembro de esta desigualdad


converge hacia cero en virtud de la relación de equivalencia definida. Se
concluye, por tanto, que de define una métrica sobre X.
e

Segunda etapa: ( X,
e de) es completo.

Tomemos una sucesión de Cauchy xek = [{ xnk }] k∈N en X,



e donde se ha
denotado { xnk }n∈N a un representante destacado de la clase de equivalen-
cia que ocupa el k–ésimo término de la sucesión { xek }. Por ser de Cauchy
se verifica la siguiente condición:
p q
∀ε > 0 ∃n0 ∈ N : p, q ≥ n0 ⇒ de( xep , xeq ) = lı́m {d( xn , xn )} < ε . (51)
n→∞

José L. López
62

Para demostrar que { xek } es convergente en X e se considera la sucesión


{ xnn } construida de la forma típica a través de un proceso de extracción
diagonal (basado en el principio de selección de Cantor). Veamos que { xnn }
es de Cauchy en X.

Como { xnl }n∈N es de Cauchy en X para todo l ∈ N, existe N0 ∈ N


tal que si n, k ≥ N0 entonces d( xnn , xkn ) < 3ε .

De (51) se desprende la existencia de N1 ∈ N tal que si k, n, m ≥ N1


entonces d( xkn , xkm ) < 3ε .

Por consiguiente, si k, n, m ≥ N = máx{ N0 , N1 }, se verifica

d( xnn , xm
m
) ≤ d( xnn , xkn ) + d( xkn , xkm ) + d( xkm , xm
m
) < ε,

luego { xnn } es de Cauchy en X. Además, para k ∈ N suficientemente gran-


de se tiene (cf. (51))

de([{ xnk }], [{ xnn }]) = lı́m {d( xnk , xnn )} < ε ,
n→∞

e cuando k → ∞, de donde se desprende


por lo que [{ xnk }] → [{ xnn }] en X


que Xe es completo.

Tercera etapa: X es isométrico a un subconjunto denso de X.


e

Para ello se construye f : ( X, d) → ( X,


e de) de la siguiente forma:

f ( x ) := [ x ] , con [ x ] = [{ x, x, x, . . . }] .

De este modo

de( f ( x ), f (y)) = de([{ x }], [{y}]) = d( x, y)

para cualesquiera x, y ∈ X, es decir, X y f ( X ) son isométricos. Concluimos


la prueba observando que f ( X ) es denso en X. e En efecto: si la sucesión
{ xn } es de Cauchy en X, dados ε > 0 y xe = [{ xn }] ∈ X e han de existir
n0 ∈ N y [ xn0 ] ∈ f ( X ) tales que

de( xe, [ xn0 ]) = lı́m {d( xn , xn0 )} < ε .


n→∞

Por consiguiente, f ( X ) es denso en X.


e

Fundamentos de Topología y Análisis Funcional 63

Teorema 16 (Teorema B. L. T.22 ). Sean ( X, k · k1 ) un espacio vectorial nor-


mado, (Y, k · k2 ) un espacio de Banach y T : X → Y una aplicación li-
neal y continua. Entonces T admite una única extensión lineal y continua
T e → Y, donde X
e : X e denota la completación de X, tal que k T kL(X,Y ) =
kTek e .
L( X,Y )

Demostración. Conforme al Teorema 15, para cada xe ∈ X e existe una su-


cesión { xn } ⊂ X tal que { xn } → xe cuando n → ∞. La sucesión { xn } es
por tanto de Cauchy,23 de modo que para todo ε > 0 podemos encon-
trar n0 ∈ N tal que, si p, q ≥ n0 , entonces se tiene k x p − xq k1 < kTε k . Por
consiguiente k T ( x p ) − T ( xq )k2 = k T ( x p − xq )k2 ≤ k T kk x p − xq k1 < ε,
de donde se desprende que { T ( xn )} es también una sucesión de Cauchy
en Y. Por ser Y completo, puede concluirse que lı́mn→∞ { T ( xn )} = y para
algún y ∈ Y. Definamos entonces T e( xe) = y y veamos que T e está bien
definida de esta forma. Para ello se consideran dos sucesiones, { xn } y
{ xn0 }, tales que lı́mn→∞ { xn } = lı́mn→∞ { xn0 } = xe. Entonces la sucesión
{ x1 , x10 , x2 , x20 , . . . } → xe, luego { T ( x1 ), T ( x10 ), T ( x2 ), T ( x20 ), . . . } → y según
el argumento anterior. Por tanto, lı́mn→∞ { T ( xn )} = lı́mn→∞ { T ( xn0 )} = y,
de donde se deduce que T e está bien definida. Además T e es (trivialmente)
lineal y continua, pues

kTe( xe)k2 = kyk2 = lı́m { T ( xn )} = lı́m {k T ( xn )k2 }
2
n→∞ n→∞
≤ lı́m {k T kk xn k1 } = k T kk xek1 .
n→∞

Finalmente, la prueba que corrobora la unicidad de T


e es el fruto de un
sencillo ejercicio.

Los resultados siguientes jugarán un papel primordial a la hora de de-
tectar cuáles son los espacios de Lebesgue no reflexivos.
Corolario 6. Sea X un espacio vectorial normado. Las siguientes propie-
dades son satisfechas:
(a) Para todo x ∈ X existe f ∈ X 0 tal que k f k X 0 = 1 y f ( x ) = k x k X .
22 B.L. T. = Bounded Linear Transformation
23 Aquí el abuso del lenguaje es palpable. Técnicamente es f ( X ) el subconjunto denso
de X, donde f : ( X, d) → ( X,
e e de) es la isometría construida en la prueba del Teorema
15. De este modo, lo que rigurosamente se puede afirmar es que existe { xn } ⊂ X tal
que { f ( xn )} → xe cuando n → ∞ y, por tanto, { f ( xn )} es de Cauchy. Sin embargo, las
sucesiones { f ( xn )} y { xn } preservan las distancias entre sus términos ya que f es una
isometría, luego { xn } es también de Cauchy

José L. López
64

(b) Para todo x ∈ X se cumple



k x k X = sup | f ( x )|} .
k f k X 0 ≤1

(c) La aplicación canónica i : X → X 00 definida en (33) es una isometría.

Demostración. (a) Sea x ∈ X y consideremos el funcional g : gen{ x } → R


definido por g(y) = g(λx ) := λk x k X , λ ∈ R, donde hemos denotado
gen{ x } el subespacio vectorial de X generado por el elemento x. Clara-
0
mente g ∈ gen{ x } y k gk 0 = 1, pues se tiene
gen{ x}

k gk 0 = sup | g(λx )| = 1 .
gen{ x} kλx k ≤1 X

Finalmente, el Teorema B. L. T. (Teorema 16) garantiza la existencia de un


elemento f ∈ X 0 que extiende a g y satisface k f k X 0 = k gk 0 = 1.
gen{ x}
Basta entonces con elegir λ = 1 para concluir que f ( x ) = g( x ) = k x k X .
(b) Por una parte es claro que, para el elemento  f ∈ X 0 del enunciado
(a), se tiene que k x k X = | f ( x )| ≤ supk f k 0 ≤1 | f ( x )|}. Recíprocamente,
X 
como | f ( x )| ≤ k f k X 0 k x k X , también se tiene que supk f k 0 ≤1 | f ( x )|} y con
X
ello la anunciada igualdad.


Teorema 17. Sea X un espacio de Banach reflexivo. Las siguientes afirma-


ciones son satisfechas:
(a) Todo subespacio vectorial cerrado de X es reflexivo.
(b) Si Y es un subespacio vectorial cerrado de X 0 que verifica la siguien-
te propiedad:
h f , x i X 0 ,X = 0 ∀ f ∈ Y ⇒ x = 0 ,
entonces Y = X 0 .
Demostración. (a) Sea U un subespacio vectorial cerrado de X. Se define
en primer lugar la restricción de X a U de la siguiente forma:

R : X0 → U0 , R ( ϕ ) = ϕ |U ∀ ϕ ∈ X 0 .

Por otra parte, dado F ∈ U 00 se define

u : = i −1 ( F ◦ R ) ∈ X ,
Fundamentos de Topología y Análisis Funcional 65

donde i : X → X 00 es la aplicación canónica descrita en (33). Obsérvese que


tal elemento u ha de existir porque X es reflexivo. El resto de la prueba la
efectuaremos en dos etapas.
Primera etapa: u ∈ U.
En efecto: si fuese u ∈
/ U, según el Corolario 5 (al teorema de Hahn–
Banach) habría de existir ϕ ∈ X 0 tal que ϕ(U ) = 0 y ϕ(u) = 1. Entonces se
tendría que R( ϕ) = 0 y, por tanto, la siguiente contradicción:

ϕ(u) = h ϕ, i−1 ( F ◦ R)i X 0 ,X = h F ◦ R, ϕi X 00 ,X 0 = 0 .

Segunda etapa: h F, ψiU 00 ,U 0 = hψ, uiU 0 ,U para todo ψ ∈ U 0 .


e de ψ a X proporcionada por el
Consideremos para ello la extensión ψ
teorema de Hahn–Banach (Teorema 12). Entonces ψ = R(ψ e) y

h F, ψiU 00 ,U 0 = h F, R(ψe)iU 00 ,U 0 = hi (u), ψei X 00 ,X 0 = hψ,


e ui X 0 ,X = hψ, uiU 0 ,U .

(b) Razonamos por reducción al absurdo, para lo cual supondremos


que Y 6= X 0 . Nuevamente el Corolario 5 garantiza la existencia de F ∈ X 00
(no idénticamente nulo) que se anula sobre Y. Como además X es reflexivo
por hipótesis, existirá algún elemento x ∈ X tal que h F, f i X 00 ,X 0 = h f , x i X 0 ,X
para todo f ∈ X 0 . En particular ha de ser h F, f i X 00 ,X 0 = 0 para todo f ∈ Y,
luego x = 0 por hipótesis. Esto contradice, sin embargo, el hecho de que F
no pueda ser idénticamente nulo.24


Proposición 6. Sean X e Y espacios vectoriales normados y T : X → Y un


isomorfismo isométrico. En tal caso, si uno de los dos espacios es reflexivo
también lo es el otro. Dicho de otro modo, la propiedad de reflexividad se
preserva por la acción de un isomorfismo isométrico.
Demostración. Comenzamos definiendo las aplicaciones T ? : X 0 → Y 0 y
T ?? : X 00 → Y 00 del siguiente modo:

T ? f (y) := f T −1 y para cualesquiera f ∈ X 0 , y ∈ Y ,



(52)
− 1
T ?? F ( g) := F T ? g para cualesquiera F ∈ X 00 , g ∈ Y 0 , (53)


a la vez que denotamos i : X → X 00 y j : Y → Y 00 las correspondientes


inyecciones canónicas (cf. (33)). Observamos en primer lugar que T ? es un
24 En ambos casos, el hecho de que tanto U ⊂ X como Y ⊂ X 0 sean cerrados es esencial.
¿Cómo se utiliza?

José L. López
66

isomorfismo isométrico, dado que se trata de un homomorfismo biyectivo


que satisface

k T ? f kY0 = sup T ? f (y) = sup f ( T −1 y)


 
k y kY ≤ 1 k y kY ≤ 1
 
= sup | f ( x )| = sup | f ( x )| = k f k X 0
k Tx kY ≤1 k x k X ≤1

para cualesquiera x ∈ X y f ∈ X 0 . Un argumento análogo basado en


el hecho anterior permite afirmar que T ?? es asimismo un isomorfismo
isométrico. Sea ahora F0 ∈ X 00 y definamos x0 := T −1 j−1 T ?? F0 ∈ X.


Comprobaremos que si Y es reflexivo entonces X ha de serlo también. Se


tiene 25
(53)  (52)
T ?? F0 T ? f = T ? f j−1 ( T ?? F0 = f T −1 j−1 ( T ?? F0
 
F0 ( f ) =
= f ( x0 ) ,

de donde se deduce que ha de ser i ( x0 ) = F0 , luego i : X → X 00 es sobre-


yectiva y, en consecuencia, X es reflexivo.


Proposición 7. Sea X un espacio de Banach. Las siguientes propiedades


son satisfechas:

(a) Si X es separable, cualquier M ⊂ X también lo es.

(b) Si X 0 es separable, entonces X también lo es.

(c) Si X es separable y reflexivo, entonces X 0 es separable.

(d) X es reflexivo si y solamente si X 0 es reflexivo.

En particular, X es separable y reflexivo si y solamente si X 0 es separa-


ble y reflexivo.

Demostración. (a) Sea { x j } ⊂ X un subconjunto numerable y denso. En-


tonces podemos construir un subconjunto numerable de M sin más que
considerar {mnj } ⊂ M ∩ B 1 ( x j ), salvo cuando dichas intersecciones sean
n
vacías. Veamos que también es denso en M. Para ello, sean m ∈ M y
0 < ε < 1, y tomemos x j ∈ B 4ε (m). Tomemos asimismo un valor adecuado
25 En este punto se emplea de forma esencial la reflexividad de Y. Deberías de ser capaz

de discernir en qué momento


Fundamentos de Topología y Análisis Funcional 67

de n (a saber, tal que ε


4 ≤ 1
n ≤ 2ε ) para poder asegurar que M ∩ B 1 ( x j ) 6= ∅.
n
1
De esta manera se concluye la existencia de mnj tal que kmkj − x j k X ≤ n.
Finalmente se tiene
ε ε
kmnj − mk X ≤ kmnj − x j k X + k x j − mk X ≤ + ,
2 4
luego la densidad de {mnj } en M.
(b) Por ser X 0 separable, sabemos que ha deexistir una familia { f n } ⊂
X numerable y densa, con k f n k X 0 = supk xk≤1 | f n ( x )| para todo n ∈ N.
0

De este modo tenemos también garantizada la existencia de { xn } ⊂ B1X tal


que
1
| f n ( xn )| ≥ k f n k X 0 . (54)
2
Denotemos
( ) ( )
n n
EQ = ∑ λ j x j : λ j ∈ Q, n ∈ N y ER = ∑ λ j x j : λ j ∈ R, n ∈ N
j =1 j =1

los espacios constituidos por todas las combinaciones lineales finitas de


elementos de { xn } con coeficientes racionales y reales, respectivamente.
En primer lugar es fácil observar que EQ es numerable, pues se puede
escribir como una unión numerable de conjuntos numerables:

[ 
EQ = gen x1 , . . . , xk ,
k =1

donde gen x1 , . . . , xk denota el espacio vectorial generado por la familia
{ x1 , . . . , xk }. También es de comprobación inmediata el hecho de que EQ
es denso en ER , toda vez que Q es denso en R. Bastará pues con verificar
que ER es denso en X, pues en tal caso se tendría que EQ es un conjunto
numerable y denso en X, lo que concluiría la prueba. Tómese para ello
f ∈ X 0 tal que
f = 0 en ER . (55)
Al ser el conjunto { f n } denso en X 0 , se cumple que para cada ε > 0 ha de
existir n ∈ N (suficientemente grande) para el que

k f n − f kX0 < ε , (56)

en cuyo caso se tendrá


1
k f n k X 0 ≤ | f n ( xn )| ≤ | f n ( xn ) − f ( xn )| + | f ( xn )| ≤ k f n − f k X 0 k xn k X < ε
2

José L. López
68

en virtud de (54), (55) y (56). Por consiguiente k f k X 0 ≤ k f − f n k X 0 +


k f n k X 0 < 3ε, y necesariamente ha de ser f = 0. Aplicando en última ins-
tancia el (contrarrecíproco del) Corolario 5 deducimos que ER ha de ser
denso en X.
(c) El hecho de que X sea reflexivo conlleva que i ( X ) = X 00 , donde
i : X → X 00 es la aplicación canónica definida en (33). Por otra parte, como
X es separable existirá una familia { xn } ⊂ X numerable y densa. Com-
probemos para concluir que el conjunto { Fn := i ( xn )} ⊂ X 00 es también
numerable y denso. En efecto: Dados ε > 0 y F ∈ X 00 , existe x ∈ X tal
que i ( x ) = F (por la sobreyectividad de i) y k xn − x k X < ε para valores
suficientemente grandes de n ∈ N (por la densidad del conjunto { xn } en
X). Siendo así, se tiene que
k Fn − F k X 00 = ki ( xn ) − i ( x )k X 00 = ki ( xn − x )k X 00 = k xn − x k X < ε ,
de donde se desprende que X 00 es separable. Finalmente, aplicando el
enunciado demostrado en (a) se concluye que X 0 es separable.
(d) De izquierda a derecha: Sea Φ ∈ X 000 y el funcional f Φ : X → R
definido del siguiente modo: f Φ ( x ) := hΦ, i ( x )i X 000 ,X 00 . Es claro que f Φ ∈
X 0 . Asimismo se tiene que
hi ( x ), f Φ i X 00 ,X 0 = h f Φ , x i X 0 ,X = hΦ, i ( x )i X 000 ,X 00 ,
en virtud de las definiciones de i : X → X 00 y f Φ : X → R. Como i
es sobreyectiva por hipótesis, se cumple hΦ, F i X 000 ,X 00 = h F, f Φ i X 00 ,X 0 para
todo F ∈ X 00 , luego la inyección canónica de X 0 en X 000 es sobreyectiva y,
en consecuencia, X 0 es reflexivo.
De derecha a izquierda: Si X 0 es reflexivo, la implicación anterior garan-
tiza que también lo es X 00 . Basta entonces con observar que i ( X ) es un
subespacio cerrado de X 00 26 para poder afirmar que i ( X ) es reflexivo, se-
gún lo expuesto en el Teorema 17 (a). Finalmente, X es reflexivo como
consecuencia de la Proposición 6.

El siguiente es un resultado clásico de aproximación por funciones re-
gulares, especialmente ventajoso para demostrar algunos de los teoremas
de densidad más representativos. Comenzamos definiendo el concepto de
soporte de una función continua.
Definición 10 (Soporte de una función continua). Se define el soporte de
una función continua f : Rd → R, y lo denotamos sop( f ), como la clau-
sura topológica del conjunto { x ∈ Rd : f ( x ) 6= 0}.
26 Justifíquese
Fundamentos de Topología y Análisis Funcional 69

En adelante denotaremos Cc∞ (Ω) el espacio de funciones test en Ω ⊆ Rd ,


formado por todas aquellas funciones f : Ω → R de clase C ∞ cuyo soporte
es compacto en Ω.
Teorema 18 (Partición de la unidad). Sea A = {On } una familia nume-
rable de abiertos de Rd . Entonces puede construirse una sucesión {ψn } ⊂
Cc∞ (Rd ) (a la que típicamente se denomina partición de la unidad subordina-
da a A) que verifica las siguientes propiedades:
(a) 0 ≤ ψn ≤ 1 ∀ n ∈ N.
(b) Para cada n ∈ N, existe On ∈ A tal que sop(ψn ) ⊂ On .
S∞
(c) Para todo conjunto compacto K ⊂ n =1 O n , existe m ∈ N tal que
ψ1 + · · · + ψm = 1 en un entorno de K .


Demostración [Rudin]. Consideremos la familia Brn ( xn ) formada por
las bolas cerradas de Rd que están centradas en puntos xn ∈ Rd con coor-
denadas racionales y cuyos radios rn son también racionales, que además
satisfacen que cada una de ellas está contenida en un elemento de A:
Brn ( xn ) ⊂ On ∀ n ∈ N. Por otra parte, es sabido que para cada n ∈ N
existe una función test φn tal que 0 ≤ φn ≤ 1, φn ( x ) = 1 en B rn ( xn ) y
2
φn ( x ) = 0 en el exterior de Brn ( xn ).27 Para construir la sucesión {ψn } del
teorema basta con elegir ψ1 := φ1 y
ψn := (1 − φ1 )(1 − φ2 ) . . . (1 − φn−1 )φn , n ≥ 2.
Con esta definición la condición (a) es claramente satisfecha. Para compro-
bar (b) es suficiente con tener en cuenta que ψn se anula en el exterior de
Brn ( xn ), por lo que sop(ψn ) ⊂ Brn ( xn ) ⊂ On . Concluimos con la prueba de
(c). Usando el principio de inducción completa se demuestra la siguiente
identidad:
ψ1 + · · · + ψn = 1 − (1 − φ1 )(1 − φ2 ) . . . (1 − φn ) . (57)
En efecto: es obvio que la ecuación (57) es válida para n = 1. Si suponemos
que también lo es para n − 1, se tiene que
ψ1 + · · · + ψn = 1 − (1 − φ1 ) . . . (1 − φn−1 ) + ψn
= 1 − (1 − φ1 ) . . . (1 − φn−1 ) + (1 − φ1 ) . . . (1 − φn−1 )φn
= 1 − (1 − φ1 ) . . . (1 − φn−1 )(1 − φn ) ,
27 Véase el Ejercicio 18

José L. López
70

luego (57) también es cierta para n, con lo que concluye el proceso induc-
tivo. Por otro lado, si x ∈ m
S
n=1 B r2n ( xn ) ocurre que φn ( x ) = 1 para algún
n ∈ {1, 2, . . . , m}, luego ψ1 ( x ) + · · · + ψm (nx ) = 1 como
o se desprende de
(57). Por último, como la familia de bolas B rn ( x n ) constituye un recu-
2
brimiento por abiertos de n=1 On , cada compacto K ⊂ ∞
S∞
n=1 On está a
S
Sm
su vez contenido en una unión finita n=1 B rn ( xn ), lo cual concluye la de-
2
mostración.


Sobre topologías fuertes y débiles


En el ámbito de las ecuaciones en derivadas parciales es común preten-
der demostrar la existencia de soluciones de un determinado problema no
lineal, pongamos L[u] = 0, en un espacio funcional de dimensión infini-
ta. Esto suele hacerse mediante un proceso de regularización del proble-
ma original consistente en construir una sucesión convergente adecuada,
{un } → u, de modo que el correspondiente problema regularizado (o li-
nealizado) L[un ] = 0 sea más adecuado o tratable desde una perspectiva
analítica (lo que en el caso que nos trae significa simplemente que admita
solución). Así, toda vez que se haya verificado que un resuelve L[un ] = 0
para cada n ∈ N, es de esperar que { L[un ]} → L[u] para poder deducir
que u resolverá nuestra ecuación original. Esto quiere decir, en definitiva,
que este tipo de problemas serán tanto más abordables cuantas más suce-
siones convergentes puedan construirse; o, dicho de otro modo, cuantos
más conjuntos compactos admita la topología en cuestión, lo cual debe
traducirse a su vez en un déficit de abiertos.
Sea X un espacio de Banach dotado de la norma k · k X . Dada f ∈ X 0 ,
denotaremos L f : X → R la aplicación definida como L f ( x ) = h f , x i X 0 ,X .

Definición 11 (Topología débil). La topología débil sobre X, habitualmente


denotada por σ( X, X 0 ), es la topología menos fina (es decir, la que tiene el
menor número de abiertos) sobre X que hace continuas a todas las aplica-
ciones de la familia { L f } f ∈X 0 .

Definición 12 (Convergencias fuerte y débil). Sea { xn } ⊂ X. Se dice que

(a) { xn } converge fuertemente hacia x en X (y se denota { xn } → x) si y


solamente si
lı́m {k xn − x k X } = 0 .
n→∞
Sobre topologías fuertes y débiles 71

(b) { xn } converge débilmente hacia x en X (y se denota { xn } * x) si y


solamente si para todo f ∈ X 0 se tiene

lı́m L f ( xn − x ) = 0 .
n→∞

Observación 6. La convergencia fuerte implica de forma inmediata la con-


vergencia de las normas, ya que |k xn k X − k x k X | ≤ k xn − x k X . Nótese que
esta propiedad se ha usado ya con anterioridad en varias ocasiones.


Recordemos brevemente, antes de continuar avanzando en la teoría, que


se puede definir una inyección canónica i : X → X 00 que sea continua
de la siguiente forma (cf. (33)): hi ( x ), f i X 00 ,X 0 = L f ( x ). La aplicación i es
isométrica, como se desprende de la igualdad de normas siguiente:
 
ki ( x )k X 00 = sup hi ( x ), f i X 00 ,X 0 = sup h f , x i X 0 ,X = k x k X ,
k f k X 0 ≤1 k f k X 0 ≤1

pero no es en general sobreyectiva puesto que X 00 es un espacio típicamen-


te más grande que X (caso de serlo es cuando X se dice reflexivo). En el
siguiente resultado se contemplan algunas propiedades elementales rela-
cionadas con las convergencias fuerte y débil.

Proposición 8. Sean X un espacio de Banach y { xn } ⊂ X. Se verifican:

(a) Si { xn } → x en X, entonces { xn } * x en X.

(b) Si { xn } * x en X, entonces la sucesión {k xn k X } es acotada.

(c) Si { xn } * x en X y { f n } → f en X 0 , entonces L f n ( xn ) → L f ( x ).


Demostración. La propiedad (a) se deduce inmediatamente de la defini-


ción de convergencia débil, puesto que | L f ( xn − x )| ≤ k f k X 0 k xn − x k X .
La propiedad (b) es una consecuencia del principio de acotación unifor-
me (Teorema 10). En efecto: considérese la sucesión de operadores lineales
y continuos { Fn := i ( xn ) : X 0 → R} definida como h Fn , f i X 00 ,X 0 = L f ( xn ),
donde i : X → X 00 es la aplicación canónica introducida en (33). Se tiene
n o n o
sup |h Fn , f i X 00 ,X 0 | = sup | L f ( xn )| < ∞ ∀ f ∈ X0 ,
n ∈N n ∈N

José L. López
72

puesto que la sucesión { L f ( xn )} converge por hipótesis hacia L f ( x ) pa-


ra todo f ∈ X 0 , por lo que en particular ha de ser acotada. Entonces el
Teorema 10 garantiza que
n o n o
sup k xn k X = sup k Fn k X 00 < ∞ ,
n ∈N n ∈N

donde se ha usado el hecho de que la aplicación i : X → X 00 es una isome-


tría.
Finalmente, para demostrar (c) observamos que

| L f n ( xn ) − L f ( x )| ≤ | L f n − f ( xn )| + | L f ( xn − x )|
≤ k f n − f k X 0 k xn k X + | L f ( xn − x )| ,
lo cual nos permite concluir a sabiendas de que la sucesión {k xn k X } es
acotada como consecuencia de (b).

Antes de analizar la relación existente entre las topologías fuerte y dé-
bil, veamos cómo puede obtenerse una base de entornos para la topología
σ ( X, X 0 ).
Proposición 9. Para cualquier x0 ∈ X, la familia constituida por todos los
conjuntos de la forma
n o
Uε ( x0 ) = x ∈ X : | L f i ( x − x0 )| < ε ∀ i ∈ I

es una base de entornos de x0 para la topología débil σ( X, X 0 ), donde I es


un conjunto finito de índices, f i ∈ X 0 ∀i ∈ I y ε > 0.
Demostración. Es claro que Uε ( x0 ) puede reescribirse como la siguiente
intersección finita de abiertos para la topología débil σ( X, X 0 ) que contie-
nen a x0 :  
L− 1
\
Uε ( x0 ) = f ] L
i
fi ( x 0 ) − ε, L fi ( x 0 ) + ε [ .
i∈ I
Por otra parte, es bien conocido que dado un punto x0 ∈ X los conjuntos
de la forma i∈ I L− 1
T
f i ( ωi ), con I finito, forman una base de entornos de
x0 para la topología σ ( X, X 0 ), donde ωi es un entorno de L f i ( x0 ) en R. Por
tanto, si V ( x0 ) es un entorno cualquiera de x0 en σ( X, X 0 ) ha de existir otro
entorno W ( x0 ) de x0 tal que W ( x0 ) = i∈ I L− 1
f i ( ωi ) ⊂ V ( x0 ). Finalmente,
T

existe ε > 0 (suficientemente pequeño) tal que

] L f i ( x0 ) − ε, L f i ( x0 ) + ε[⊂ ωi ∀i ∈ I,
Sobre topologías fuertes y débiles 73

de donde se deduce que x0 ∈ Uε ( x0 ) ⊂ W ( x0 ) ⊂ V ( x0 ), lo que concluye


la prueba.


Proposición 10. Si dim( X ) = d < ∞, la topología débil σ( X, X 0 ) y la


topología fuerte coinciden. En particular, una sucesión en X converge dé-
bilmente si y solamente si converge fuertemente.
Demostración. Una inclusión es evidente, ya que en general la topología
débil tiene menos abiertos que la topología fuerte. Recíprocamente, hemos
de comprobar que todo abierto para la topología fuerte lo es también para
la topología débil. Sean para ello x0 ∈ X, r > 0 y U ( x0 ) un entorno de x0 en
la topología fuerte que contiene a la bola Br ( x0 ) de X. Tomemos una base
{e1 , . . . , ed } de X con kei k X = 1 para todo 1 ≤ i ≤ d. Entonces, cualquiera
que sea x ∈ X existirán λ1 , . . . , λd ∈ R tales que x = ∑id=1 λi ei . Las d
proyecciones pi : x 7→ λi son claramente elementos de X 0 , por lo que
d d
k x − x0 k X = ∑ L pi ( x − x0 ) ei ≤ ∑ | L pi (x − x0 )| . (58)

i =1 X i =1

Dado ε > 0 se define


n o
Vε ( x0 ) := x ∈ X : | L pi ( x − x0 )| < ε ∀1 ≤ i ≤ d ,

que es una base de entornos de x0 para la topología σ( X, X 0 ) según lo de-


mostrado en la Proposición 9. Entonces, de (58) se desprende que k x −
x0 k X < εd para todo x ∈ Vε ( x0 ). Finalmente, basta con elegir ε = dr para
concluir que Vε ( x0 ) ⊂ U ( x0 ). De este modo, podemos afirmar que cual-
quier abierto de la topología fuerte se genera a partir de conjuntos de la
forma Vε ( x0 ), luego es también un abierto en la topología débil.

Por el contrario, si dim( X ) = ∞ la topología débil es estrictamente me-
nos fina que la topología fuerte, esto es, existen abiertos fuertes que no son
abiertos débiles. En este caso se pueden encontrar sucesiones que son dé-
bilmente convergentes y sin embargo no convergen en la topología fuerte,
lo que sirve para enlazar con lo que se dijo en el preámbulo de la sección.
Ésta es una de las mayores ventajas de las topologías débiles: en espacios
vectoriales de dimensión infinita, la topología débil permite que converjan muchas
más sucesiones que la topología fuerte. En tal caso, abordar el estudio de un
problema en derivadas parciales no lineal, planteado por ejemplo en un
espacio de Lebesgue o de Sobolev (que serán el objeto de los capítulos II

José L. López
74

0.5

0.2 0.4 0.6 0.8 1

-0.5

-1

Figura 2: Representación gráfica de los cuatro primeros elementos de la sucesión


de funciones del Ejemplo 8.

y IV, respectivamente), a través de una secuencia conveniente de proble-


mas aproximados, se convierte en una técnica a priori más exitosa desde la
perspectiva de las correspondientes topologías débiles.
Ejemplo 8. Considérese la sucesión de funciones

f n ( x ) = 2 sen(nπx )
en Ω = (0, 1). Esta sucesión converge débilmente hacia cero en L2 (Ω).28
En efecto: tomando ϕ ∈ Cc∞ (Ω) e integrando por partes se obtiene
√ Z
√ Z1 2 1
L ϕ ( f n ) = h ϕ, f n i = 2 sen(nπx ) ϕ( x ) dx = cos(nπx ) ϕ0 ( x ) dx ,
0 nπ 0
luego
C
|h ϕ, f n i| ≤ → 0 cuando n → ∞ ,
n

con C = π2 máx | ϕ0 ( x )| : x ∈ [0, 1] . Finalmente, un sencillo argumen-


to de densidad (más adelante comprobaremos que Cc∞ (Ω) es denso en


28 Aunque los espacios L p (Ω) serán estudiados exhaustivamente en el siguiente capí-
1
tulo, retengamos por el momento que f ∈ L2 (Ω) si k f k L2 (Ω) := Ω f ( x )2 dx 2 < ∞,
R

y que L2 (Ω) está dotado del siguiente producto escalar: h f , gi = Ω f ( x ) g( x ) dx. Esto,
R

junto con el hecho de que L2 (Ω)0 y L2 (Ω) son isomorfos, es suficiente para afrontar con
éxito este ejemplo
Sobre topologías fuertes y débiles 75

L2 (Ω), que a su vez es isomorfo a L2 (Ω)0 ) nos permite concluir. Sin em-
bargo, { f n } no puede converger en la topología fuerte de L2 (Ω), pues de
hacerlo también convergería la sucesión de las correspondientes normas
(cf. Observación 6). No obstante
Z 1 Z 1
k f n k2L2 (Ω) 2

=2 sen (nπx ) dx = 1 − cos (2nπx ) dx = 1 6= 0 .
0 0

Sean { f n } ⊂ X 0 y f ∈ X 0 . Se pueden definir tres topologías destacadas


sobre X 0 :

(a) la topología fuerte: { f n } → f si

lı́m {k f n − f k X 0 } = 0 ;
n→∞

(b) la topología débil: { f n } * f si

hΦ, f n i X 00 ,X 0 = hΦ, f i X 00 ,X 0 ∀Φ ∈ X 00 ;

lı́m
n→∞

(c) la topología débil ?: { f n } * f débil ? si



lı́m L fn (x) = L f (x) ∀x ∈ X .
n→∞

En general la topología débil ? es estrictamente menos fina que la topolo-


gía débil, que a su vez es menos fina (como ya sabemos) que la topología
fuerte. Si X es reflexivo, las topologías débil y débil ? en X 0 son claramente
la misma.
En X = R es bien sabido, gracias al teorema de Bolzano–Weierstrass,
que basta con que una sucesión sea acotada para poder extraer de ella
una subsucesión convergente. Por el contrario, cuando X es un espacio
de Banach de dimensión infinita la condición de acotación no es en gene-
ral suficiente. Sin embargo, en el caso de espacios duales se dispone del
siguiente resultado.

Teorema 19 (Banach–Alaoglú). Para todo espacio vectorial normado X, la


bola unidad cerrada de X 0 , BX 0 = { f ∈ X 0 : k f k X 0 ≤ 1}, es compacta en la
topología débil ?.

José L. López
76

Observación 7. La bola unidad cerrada de un espacio vectorial normado


de dimensión infinita nunca es compacta en la topología fuerte (consúltese
al respecto el teorema de Riesz VI.5 en [Bre]), de ahí la importancia del
resultado anterior para establecer propiedades de compacidad en algunos
espacios de Banach de interés.

Demostración del Teorema 19. Consideremos el espacio
Z = RX = ∏ R,
x∈X

cuyos elementos son listas de la forma z = (z x ) x∈X con z x ∈ R para todo


x ∈ X, dotado de la topología producto, es decir, la topología menos fina
que hace continuas a cada una de las proyecciones canónicas Px : z 7→ z x
cuando x recorre X. Consideremos asimismo la topología débil ? sobre
X 0 . Se define entonces Φ : X 0 → Z como Φ( f ) = L f ( x ) x∈X . La apli-
cación Φ es claramente continua e inyectiva. Es más, puede demostrar-
se fácilmente que Φ : X 0 → Φ( X 0 ) es un homeomorfismo sin más que
verificar la continuidad de Φ−1 : Φ( X 0 ) → X 0 (nótese que Φ( X 0 ) he-
reda la topología producto de Z). Para ello es suficiente con comprobar
que, para cualquier x ∈ X, la aplicación Ψ x : Φ( X 0 ) → R definida co-
mo z 7→ LΦ−1 (z) ( x ) es continua en Φ( X 0 ). En efecto: para todo f ∈ X 0 se
tiene que Ψ x (Φ( f )) = L f ( x ) = Px (Φ( f )), luego Ψ x coincide con la pro-
yección Px , que es continua, al actuar sobre Φ( X 0 ). Por consiguiente, BX 0
es compacto si y solamente si Φ( BX 0 ) lo es. Observamos en primer lugar
que, para cada x ∈ X, se tiene |Φ( f )| = | L f ( x )| ≤ k f k X 0 k x k X ≤ k x k X
cualquiera que sea f ∈ BX 0 , luego
Φ ( BX 0 ) ⊂ A : = ∏ − k x k X , k x k X ,
 
x∈X

que es un compacto29 para la topología producto de Z, de donde se des-


prende que basta con verificar que Φ( BX 0 ) es cerrado en A para concluir
la prueba.30
Sea g ∈ Φ( BX 0 ). En primer lugar comprobaremos que el funcional f :
X → R definido como
f ( x ) := gx = coordenada x–ésima de g (59)
29 En virtud del teorema de Tychonoff, que establece que el producto cartesiano de una
familia arbitraria de compactos es compacto para la topología producto. La prueba de es-
te resultado requiere del axioma de elección. El lector interesado en ella puede consultar,
por ejemplo, § 4.11 de [Fri-1]
30 Cualquier subconjunto cerrado de un espacio topológico compacto es también com-

pacto
77

es lineal. En efecto: dado ε > 0, tómense cualesquiera dos puntos x1 , x2 ∈


X y cualesquiera escalares λ1 , λ2 ∈ R. Sea U un entorno de g formado por
los elementos (z x ) x∈X tales que

| z x1 − g x1 | < ε , | z x2 − g x2 | < ε , | z λ1 x1 + λ2 x2 − gλ1 x1 + λ2 x2 | < ε

y z x arbitrario si x 6= x1 , x 6= x2 y x 6= λ1 x1 + λ2 x2 . Como g ∈ Φ( BX 0 ), ha
de existir un elemento h ∈ Φ( BX 0 ) ∩ U. En particular, tal elemento ha de
responder a la forma h = Φ( f 0 ) para algún funcional f 0 : X → R lineal y
continuo. Además, se verifica

| h x1 − g x1 | < ε , | h x2 − g x2 | < ε , | h λ1 x1 + λ2 x2 − gλ1 x1 + λ2 x2 | < ε ,


h λ1 x1 + λ2 x2 = λ 1 h x1 + λ 2 h x2 . (60)

Por consiguiente

| λ 1 g x1 + λ 2 g x2 − gλ1 x1 + λ2 x2 |
≤ |λ1 || gx1 − h x1 | + |λ2 || gx2 − h x2 | + | gλ1 x1 +λ2 x2 − hλ1 x1 +λ2 x2 |
≤ (|λ1 | + |λ2 | + 1)ε ,
tras sumar y restar las cantidades apropiadas y haber empleado las pro-
piedades expuestas en (60). Como ε es arbitrario, se concluye que el fun-
cional f definido en (59) es lineal. Además, como g ∈ A se tiene que
| f ( x )| ≤ k x k X , luego f ∈ X 0 y k f k X 0 ≤ 1. Es por ello que f ∈ BX 0 y,
por tanto, g = Φ( f ) ∈ Φ( BX 0 ), lo que prueba que Φ( BX 0 ) es cerrado en A.

Una exposición amplia y detallada de diversas técnicas relacionadas
con criterios de compacidad débil en el ámbito del cálculo de variaciones
y de las ecuaciones en derivadas parciales puede encontrarse en [Eva2].

Distribuciones: la delta de Dirac y su papel en el


ámbito de las ecuaciones en derivadas parciales
Como se vio en el Ejemplo 3 (b), una masa puntual se describe mate-
máticamente por medio de la llamada medida de Dirac. En efecto: si supo-
nemos una masa unidad concentrada en el origen de coordenadas (Ω = R
y A = {0} en el Ejemplo 3 (b)), entonces la medida de Dirac asociada (a la
cual denotaremos ρ0 ) no es otra que

1 si x = 0
ρ0 ( x ) = .
0 si x 6= 0

José L. López
78 Distribuciones: la delta de Dirac y su papel en el ámbito de las EDPs

Sin embargo, si nuestro propósito fuese medir la densidad de masa aso-


ciada a un punto material la situación se torna algo más compleja. Para el
caso particular de un intervalo I, es bien sabido que la densidad de masa
asociada es la razón entre la masa total m contenida en I y el volumen de
I (que no es otra cosa que su medida de Lebesgue | I |):
m
ρ( I ) = .
|I|
En nuestra situación se ha considerado una masa unidad concentrada en
un intervalo puntual (m = 1, I = {0}), por lo que | I | = 0 y se tendría

∞ si x = 0

ρ( x ) = . (61)
0 si x 6= 0

Es obvio que esta expresión no tiene sentido matemático como función,


de modo que hemos de recurrir a una aproximación distinta de la reali-
dad física subyacente. Para ello se consideran promedios de densidad en
entornos pequeños del punto material Iε = [−ε, ε] (véase [Vla1]), de ma-
nera que la densidad puntual de masa pueda caracterizarse (al menos a
nivel intuitivo) como el límite cuando ε → 0 de una sucesión de funciones
(discontinuas) δε ( x ) definidas como
(
1
| Iε |
= 2ε1 si | x | ≤ ε
δε ( x ) = .
0 si | x | > ε

Es evidente que, para cualquier ε > 0, el área de la región delimitada por


la gráfica de la función δε ( x ) es unitaria, y que al calcular su límite puntual
cuando ε → 0 se obtiene (61).
Llegado este punto un nuevo problema nos aguarda. Es físicamente
exigible que la integral de la densidad de masa asociada a cualquier inter-
valo I (que en nuestro caso contenga al punto x = 0) proporcione la masa
total distribuida en el interior de I; en particular, habría de cumplirse
Z Z
lı́m{δε ( x )} dx = ρ( x ) dx = ρ0 .
I ε →0 I

Esto, sin embargo, es contradictorio con el hecho de que


nZ o
lı́m δε ( x ) dx = 1
e →0 I

siempre que el intercambio de límite e integral fuese factible, lo cual viene


a significar que el límite puntual de la sucesión {δε ( x )} no es el adecuado
79

para recuperar la densidad de masa puntual a partir de la densidad de


masa asociada a un intervalo. ¿Cómo debemos definirla entonces?
Para dar una respuesta satisfactoria a esta pregunta se introdujo el con-
cepto de distribución o función generalizada. Comencemos calculando el lí-
mite débil de la sucesión de promedios de densidad {δε ( x )} (cf. Capítulo
II), esto es: para toda función continua ϕ : [ a, b] → R, tal que 0 ∈ [ a, b], se
calcula
nZ b o
lı́m δε ( x ) ϕ( x ) dx .
ε →0 a
Es fácil comprobar que este límite es ϕ(0). En efecto:
Z b 1 ε
Z
( x ) ( x ) dx − ( 0 ) ≤ | ϕ( x ) − ϕ(0)| dx .

δε ϕ ϕ
2ε −ε

a

La continuidad de ϕ permite hacer el segundo miembro tan pequeño como


se desee, lo que prueba la afirmación anterior. Luego el límite débil de la
sucesión de promedios de densidad {δε } es el operador que asocia a cual-
quier función continua ϕ su evaluación en el punto en que se concentra
la masa (en nuestro caso, ϕ 7→ ϕ(0)). Es este operador, al que denotamos
δ0 , el que se usa para describir la densidad de masa asociada a un punto
material. El operador δ0 definido como
nZ b o
hδ0 , ϕi := lı́m δε ( x ) ϕ( x ) dx = ϕ(0)
ε →0 a

recibe el nombre de delta de Dirac en honor a Paul Dirac, quien introdujo


las distribuciones en la ciencia a raíz de los estudios que llevó a cabo en
el terreno de la Mecánica Cuántica y sistematizó el uso de la distribución
delta que lleva su nombre.
De modo análogo, si es una masa total m la que se concentra en el pun-
to x = 0, se tiene que la densidad correspondiente viene dada por mδ0 . Si
la masa m se concentra en cualquier otro punto x0 , entonces la densidad
de masa asociada es mδx0 , entendiendo que δx0 es el operador que asocia a
cada función continua ϕ su evaluación en x0 . Si, por el contrario, se dispo-
ne de una distribución finita de masas {m j }1≤ j≤n que se concentran en los
puntos { x j }1≤ j≤n , entonces la densidad de masa del sistema es ∑nj=1 m j δx j .
Con la mirada puesta en el ejemplo anterior presentamos la siguiente
Definición 13 (Distribución). Se define una distribución como un opera-
dor lineal y continuo que actúa sobre el espacio D(Rd ) = Cc∞ (Rd ) formado
por las funciones de clase C ∞ con soporte compacto en Rd ; es decir, como
un elemento del dual topológico de D(Rd ). Es por ello que el espacio de
las distribuciones se denota habitualmente D 0 (Rd ).

José L. López
80 Distribuciones: la delta de Dirac y su papel en el ámbito de las EDPs

Ejemplo 9. Algunos ejemplos de distribuciones son los siguientes:


(a) La delta de Dirac: δx (Φ) = Φ( x ), para toda Φ ∈ D(Rd ). En efecto:

(i) δx es lineal, pues


δx (λ1 Φ1 + · · · + λk Φk ) = (λ1 Φ1 + · · · + λk Φk )( x )
= λ1 Φ1 ( x ) + · · · + λ k Φ k ( x )
= λ1 δx (Φ1 ) + . . . λk δx (Φk ) .
(ii) δx es continua. Basta con demostrar la continuidad en 0, ya que
acabamos de comprobar que es un operador lineal. Sea {Φn } ⊂
D(Rd ) tal que {Φn } → 0 en D(Rd ), entendiendo que la conver-
gencia de una sucesión en D(Rd ) no es más que la convergencia
uniforme de dicha sucesión y de las sucesiones de derivadas de
cualquier orden en un compacto K que contenga a los soportes
de todos los elementos de la sucesión, es decir: { f n } → f en
D(Rd ) si existe un compacto K ⊂ Rd , tal que sop( f n ) ⊂ K para
todo n ∈ N, para el que
n o
lı́m sup D α f n ( x ) − D α f ( x ) = 0 , (62)
n→∞ x ∈K

donde α = (α1 , α2 , . . . , αd ) es cualquier multiíndice y


∂|α|
Dα = α . (63)
∂αx11 . . . ∂ xdd
Entonces es de comprobación inmediata la siguiente propiedad:
lı́m {δx (Φn )} = lı́m {Φn ( x )} = 0 = δx (0) ∀ x ∈ Rd ,
n→∞ n→∞

y con ella la continuidad de la distribución delta de Dirac.

(b) Asociada a toda función continua f : Rd → R hay una distribu-


ción definida de la siguiente forma:
Z
T f (Φ) = f ( x )Φ( x ) dx , Φ ∈ D(Rd ) .
Rd

La linealidad de T f es obvia. Sean entonces {Φn } ⊂ D(Rd ) una suce-


sión tal que {Φn } → 0 en D(Rd ) y K ⊂ Rd un compacto que contiene
al soporte de Φn para todo n ∈ N. En consecuencia
Z
| T f (Φn )| = f ( x )Φn ( x ) dx ≤ |K | sup{| f ( x )|} sup{|Φn ( x )|} ,

K x ∈K x ∈K
81

de modo que lı́mn→∞ { T f (Φn )} = 0 = T f (0) (cf. (62)), de donde se


desprende que T f es continua.

(c) La distribución de Heaviside unidimensional H : D(R) → R se


define como Z ∞
H (Φ) = Φ( x ) dx .
0
Se trata de un operador lineal y continuo sobre D(R) puesto que la
integral lo es.


Estos primeros ejemplos ponen ya de manifiesto que el espacio de las


distribuciones es muy amplio. Piénsese que acabamos de verificar que
cualquier función continua genera una distribución, luego hay al menos
tantas distribuciones como funciones continuas. Pero sabemos también
que el espacio de las distribuciones contiene incluso operadores defini-
dos en D(Rd ) que no son (identificables con) funciones, como es el caso
de la delta de Dirac.
Esta sección no pretende ser una revisión exhaustiva de los principios
matemáticos relacionados con la teoría de distribuciones, sino únicamente
una exposición elemental del andamiaje necesario para alcanzar el resulta-
do fundamental que nos concierne en el ámbito de las ecuaciones diferen-
ciales, a saber: que toda ecuación en derivadas parciales lineal y con coeficientes
constantes admite una solución en el sentido de las distribuciones. En pos de
este objetivo comenzamos estudiando los conceptos de derivada de una dis-
tribución, convolución de una distribución con una función de D(Rd ) y solución
fundamental de un operador diferencial.
Definición 14 (Derivada de una distribución). Sean T ∈ D 0 (Rd ) y α =
(α1 , . . . , αd ) un multiíndice. Se define la α–derivada de T, y se denota ∂α T,
como la distribución que viene dada por

∂α T := (−1)|α| ( T ◦ D α ) ,

donde D α denota la α–derivada clásica (cf. (63)) y |α| = α1 + · · · + αd .


Tanto la linealidad como la continuidad de la derivada distribucional
se desprenden de las correspondientes propiedades de linealidad y conti-
nuidad de los operadores T : D(Rd ) → R y D α : D(Rd ) → D(Rd ).
Ejemplo 10. Se plantean seguidamente algunas situaciones interesantes
que relacionan las funciones signo y de Heaviside con la delta de Dirac a
través de la noción de derivada distribucional.

José L. López
82 Distribuciones: la delta de Dirac y su papel en el ámbito de las EDPs

(a) La derivada de la distribución de Heaviside es la delta de Dirac cen-


trada en el origen. En efecto: para toda función Φ ∈ D(R) se tiene
Z ∞
∂H (Φ) = − H (Φ0 ) = − Φ0 ( x ) dx = Φ(0) = δ0 (Φ) .
0

(b) Sea f ( x ) = | x |. Es claro que f ∈ C (R) pero no admite derivada clá-


sica. Calculemos en su lugar la derivada distribucional de f . Como f
es continua, sabemos (cf. Ejemplo 9 (b)) que puede identificarse con
una distribución T f definida como
Z ∞
T f (Φ) = f ( x )Φ( x ) dx ∀Φ ∈ D(R) .
−∞

Se trata, por tanto, de encontrar otra distribución Tg tal que

∂T f = Tg , (64)

aunque como veremos g ya no habrá de ser necesariamente continua.


Para toda Φ ∈ D(R), la función g ha de verificar
Z ∞ Z ∞
g( x )Φ( x ) dx = − f ( x )Φ0 ( x ) dx
−∞ −∞
Z 0 Z ∞
= xΦ0 ( x ) dx − xΦ0 ( x ) dx
−∞ 0
Z 0 Z ∞
= − Φ( x ) dx + Φ( x ) dx
−∞ 0

para que la identidad (64) sea satisfecha, donde la última igualdad


procede de haber aplicado la fórmula clásica de integración por par-
tes. Luego 
−1 si x < 0
g( x ) = = signo( x ) . (65)
1 si x ≥ 0

(c) La función h : R → R definida como



0 si x < 0
h( x ) =
1 si x ≥ 0

recibe el nombre de función de Heaviside. Claramente Th = H (cf.


Ejemplo 9 (c)) y g( x ) = 2h( x ) − 1 para la función g de (65). Entonces
la derivada distribucional de segundo orden de f (Rx ) = | x | viene

dada por ∂2 T f = ∂Tg = 2∂H = 2δ0 , pues Tg = 2H − −∞ Φ( x ) dx.

83

Definición 15 (Convolución de una distribución con una función test y


con otra distribución). Sean T, S ∈ D 0 (Rd ) y Φ ∈ D(Rd ).

(a) Se define la convolución de T con Φ, y se denota T ∗ Φ, como la


función
( T ∗ Φ)( x ) := T (τx RΦ) , (66)
donde τx y R son los operadores (lineales) de traslación y reflexión,
respectivamente:

(τx f )(y) = f (y − x ) , ( R f )(y) = f (−y) .

La función T ∗ Φ induce una distribución, a la que denotaremos λ T ∗Φ ,


que viene dada por

λ T ∗Φ (Ψ) = T ( RΦ ∗ Ψ) ∀Ψ ∈ D(Rd ) . (67)

En efecto, haciendo uso de la aproximación estándar de la integral


por las sumas de Riemann se dispone de la siguiente cadena de
igualdades:
Z
λ T ∗Φ (Ψ ) = ( T ∗ Φ)( x )Ψ( x ) dx
Rd
n n o
= lı́m ∑ ( T ∗ Φ)( x j )Ψ( x j )( x j − x j−1 )
n→∞
j =1
n n o
∑ Φ Ψ

= lı́m T ( x j − y ) ( x j )( x j − x j −1 )
n→∞
j =1
n  n o
= lı́m T ∑ Φ( x j − y)Ψ( x j )( x j − x j−1 )
n→∞
j =1
= T ( RΦ ∗ Ψ) .

(b) Diremos que T se anula en Ω ⊂ Rd si T (Φ) = 0 cualquiera que


sea Φ ∈ D(Rd ) con sop(Φ) ⊂ Ω. Se define entonces el soporte de
T como sop( T ) = Rd \ O , donde O denota la unión de todos los
abiertos O j ⊂ Rd en los que T se anula.31 En tal caso, si al menos
31 Puede demostrarse que si T se anula en una familia numerable de abiertos, enton-
ces se anula también en la unión de los mismos. En efecto: sean Φ ∈ D(O) y {ψj } una
partición de la unidad subordinada a la familia de abiertos {O j } en los que T se anu-
la. Entonces T (Φ) = ∑m j=1 T ( ψ j Φ ) = 0, en virtud de las consabidas propiedades de la
partición (cf. Teorema 18)

José L. López
84 Distribuciones: la delta de Dirac y su papel en el ámbito de las EDPs

una de las dos distribuciones tiene soporte compacto, se define T ∗ S


como la (única) distribución que satisface

( T ∗ S) ∗ Φ = T ∗ (S ∗ Φ) .

Observación 8. Las siguientes especificaciones son fundamentales para


dar sentido a la Definición 15:

(a) Si S tiene soporte compacto, es claro que S ∗ Φ ∈ D(Rd ), luego la


acción T ∗ (S ∗ Φ) está bien definida en virtud de (66). Por otra par-
te, si fuera T la distribución que tiene soporte compacto, T ∗ (S ∗ Φ)
representaría la convolución de una distribución con soporte com-
pacto y una función de clase C ∞ (tal como quedará patente en el
Teorema 20). Veremos a continuación que esta operación está bien
definida, en tanto que cualquier distribución con soporte compacto
puede identificarse con un elemento del dual topológico de C ∞ (Rd )
con la topología derivada de la familia de seminormas

k f k β,K = sup | D β f ( x )| , K ⊂ Rd compacto.



x ∈K

En efecto: si sop( T ) es compacto, existirá una función χ ∈ D(Rd ) tal


que χ = 1 en un entorno de sop( T ) (cf. Ejercicio 18). Definimos

e(φ) := T (χφ)
T para toda φ ∈ C ∞ (Rd ) .

• T
e es lineal.
e es continua en C ∞ (Rd ). Si se considera {φn } → 0 en C ∞ (Rd )
• T
es claro que {χφn } → 0 en D(Rd ), toda vez que sop(χφn ) ⊂
sop(χ) para todo n ∈ N, luego T (φn ) = { T (χφn )} → 0.
e
e extiende a T. Dada Φ ∈ D(Rd ) se cumple que sop(Φ − χΦ) ∩
• T
sop( T ) = ∅, luego T (Φ) − T e(Φ) = T (Φ − χΦ) = 0 o, lo que
e a D(Rd ) coincide con T. Ade-
es equivalente, la restricción de T
más, Te es la única extensión de T a C ∞ (Rd ) que satisface la pro-
piedad
e(φ) = 0 si sop( T
T e) ∩ sop(φ) = ∅ . (68)
En efecto, cualquier otra extensión T
b que satisficiera la propie-
dad (68) habría de verificar
b(φ − χφ) = T
0=T b(φ) − T (χφ) = T
b(φ) − T
e(φ) .
85

e tales que T ∗ Φ = T
(b) Si hubiese dos distribuciones T y T e ∗ Φ para toda
Φ ∈ D(Rd ), habría de cumplirse (cf. (66))

T (Φ) = T ∗ ( RΦ) (0) = T e(Φ) ,


 
e ∗ ( RΦ) (0) = T

con lo que ambas habrían de coincidir.

(c) La convolución conmuta con el operador de traslación:

( T ∗ τh Φ)( x ) = T (τx Rτh Φ) = T (τx−h RΦ) = ( T ∗ Φ)( x − h)


= τh T ∗ Φ)( x ) .

(d) Si T ∈ D 0 (Rd ), la aplicación FT : D(Rd ) → C ∞ (Rd ) definida como


FT (Φ) := T ∗ Φ es lineal y continua (compruébese).

(e) Sea F : D(Rd ) → C ∞ (Rd ) un operador lineal y continuo que conmu-


ta con el operador de traslación. Entonces existe T ∈ D 0 (Rd ) tal que
F = FT (compruébese).

El siguiente resultado establece la forma en que se deriva la convolución


(66):

Teorema 20. Si T ∈ D 0 (Rd ) y Φ ∈ D(Rd ), entonces

D α ( T ∗ Φ) = ∂α T ∗ Φ = T ∗ D α Φ

para todo multiíndice α. En particular, T ∗ Φ se revela como una función


de clase C ∞ . Un resultado análogo es válido para la derivada de la convo-
lución de dos distribuciones.

Demostración.32 Se observa en primer lugar que

(∂α T ∗ Φ)( x ) = ∂α T (τx RΦ) = (−1)|α| ( T ◦ D α )(τx RΦ)


= (−1)|α| T (τx D α ( RΦ)) = T (τx RD α Φ) = ( T ∗ D α Φ)( x ) .

Por tanto, bastaría con probar que

Dα ( T ∗ Φ) = T ∗ Dα Φ (69)
32 Es
muy recomendable intentar resolver el Ejercicio 18 antes de proceder con esta
demostración

José L. López
86 Distribuciones: la delta de Dirac y su papel en el ámbito de las EDPs

para concluir la demostración. Consideramos para ello el caso más simple


posible, es decir, aquel que resulta de elegir α = ei en (63), donde he-
mos utilizado ei para denotar el i–ésimo vector de la base canónica de Rd :
D α Φ = ∂x
∂Φ
para algún 1 ≤ i ≤ d. Se tiene entonces que
i

Φ(y) − Φ(y − hei ) (τ0 − τhei )Φ


   
∂Φ
(y) = lı́m = lı́m (y) ,
∂xi h →0 h h →0 h

de donde se deduce fácilmente que

(τ0 − τhei )Φ
 
∂Φ
lı́m = en la topología de D(Rd )
h →0 h ∂xi

(cf. Ejercicio 19 (a)). Además (cf. Observación 8 (c) y Ejercicio 18 (d))

(τ0 − τhei )( T ∗ Φ) (τ0 − τhei )Φ


=T∗ ,
h h
luego haciendo h → 0 se obtiene (cf. Ejercicio 18 (g))

∂( T ∗ Φ) ∂Φ
=T∗ . (70)
∂xi ∂xi

La propiedad (69) es entonces una sencilla consecuencia de aplicar (70)


repetidamente.


Definición 16 (Solución fundamental). Un operador diferencial lineal con


coeficientes constantes es cualquier suma finita del tipo

P( D ) = ∑ λα D α . (71)
|α|≤k

Se dice que una distribución T es una solución fundamental del operador


diferencial (71) si
P( D )[ T ] = ∑ λα ∂α T = δ0 , (72)
|α|≤k

donde δ0 denota la distribución delta de Dirac centrada en el origen.

Enunciamos acto seguido los resultados principales de esta sección.

Teorema 21 (Malgrange–Ehrenpreis). Todo operador diferencial lineal con


coeficientes constantes admite una solución fundamental.
87

Teorema 22. Sean P( D ) un operador diferencial lineal con coeficientes


constantes y T una distribución que es solución fundamental de P( D ).
Entonces P( D )[ T ∗ Φ] = Φ para toda función Φ ∈ D(Rd ).
Este resultado permite invertir el operador diferencial P( D ) sin más
que efectuar la convolución con una solución fundamental, lo cual se tra-
duce inmediatamente en la posibilidad de construir una solución de cual-
quier ecuación en derivadas parciales lineal, con coeficientes constantes
y no homogénea toda vez que se conozca una solución fundamental de
la misma. En efecto: si T es una solución fundamental de P( D ), entonces
u = T ∗ f resuelve la ecuación diferencial P( D )[u] = f .
Demostración del Teorema 22. Sea P( D ) = ∑|α|≤k λα D α . Como T es
una solución fundamental de P( D ), se cumple (72). Calculamos finalmen-
te
 
P( D )[ T ∗ Φ] = ∑ λα D ( T ∗ Φ) = ∑ λα ∂ T ∗ Φ = δ0 ∗ Φ = Φ ,
α α

|α|≤k |α|≤k

para lo que se ha utilizado el Teorema 20 y el hecho de que

(δ0 ∗ Φ)( x ) = δ0 (τx RΦ) = (τx RΦ)(0) = ( RΦ)(− x ) = Φ( x ) .



Una demostración elemental del Teorema de Malgrange–Ehrenpreis
puede encontrarse en [Ros]. Una exposición detallada y profunda de la
teoría de distribuciones y algunas de sus conexiones con la teoría de ope-
radores diferenciales pueden encontrarse en [Sch], [Rud2], [Che], [Vla1],
[Hor] y [DK].

Semigrupos de evolución y argumentos de punto


fijo
Demostramos en esta sección el resultado general que soporta el análi-
sis de existencia y unicidad de solución para una amplia familia de proble-
mas de evolución no homogéneos representados por ecuaciones en deri-
vadas parciales. Para ello establecemos en primer lugar el marco abstracto
en el que se desarrolla la teoría. Comenzamos con la siguiente
Definición 17 (Semigrupo fuertemente continuo y generador infinitesi-
mal). Sea X un espacio de Banach. Diremos que una familia uniparamé-
trica {S(t) : X → X }t≥0 de operadores lineales y continuos constituye

José L. López
88 Semigrupos de evolución y argumentos de punto fijo

un semigrupo fuertemente continuo si las siguientes propiedades son satisfe-


chas:

(a) S(0) = I, donde I : X → X denota el operador identidad;

(b) S(t + s) = S(t)S(s) para cualesquiera t, s ≥ 0;

(c) lı́mt→0 {S(t) x } = x para todo elemento x ∈ X.

El operador lineal A : D A ⊂ X → X con dominio

S(t) x − x
  
D A = x ∈ X : ∃ lı́m ,
t →0 t

definido por

S(t) x − x
 
Ax := lı́m = S0 (t)|t=0 x ∀ x ∈ D A ,
t →0 t

recibe el nombre de generador infinitesimal del semigrupo {S(t)}t≥0 .

Ejemplo 11. Sea X un espacio de Banach y A : X → X un operador lineal


y continuo. Entonces la familia uniparamétrica de operadores lineales y
continuos

( At)n
S(t) := e At = ∑ , t ≥ 0,
n=0 n!

define un semigrupo fuertemente continuo en X cuyo generador infinite-


simal es A.33 En efecto:
2 2
(i) S(0) = I + At + A2t + . . . (t = 0) = I.


( At)n  ( As)m  ( A(t+s))l


(ii) S(t)S(s) = ∑∞
n =0 n! ∑∞
m =0 m! = ∑∞
l =0 l! = S ( t + s ).
A2 t2
 
(iii) lı́mt→0 {S(t) x } = lı́mt→0 I + At + 2 + . . . x = x.
33 En las condiciones expuestas es claro que A : X → X es un operador acotado, luego

k Ak = M < ∞. Se tiene entonces que



( Mt)n
ke At k ≤ ∑ n!
= e Mt ,
n =0

de donde se desprende que el operador e At está bien definido a través de una serie que
converge en virtud del principio de comparación de Weierstrass
89

(iv) Comprobemos finalmente que A es el generador infinitesimal del


semigrupo. Introducimos para ello la sucesión de sumas parciales
( At)k
de la serie, Sn (t) := ∑nk=0 k! . Se tiene
n
Ak (ktk−1 ) n
( At)k−1
Sn0 (t) = ∑ k!
=A∑
( k − 1) !
= ASn−1 (t) .
k =1 k =1

Entonces
0
Sn (t) − Ae At = ASn−1 (t) − Ae At ≤ M Sn−1 (t) − e At

X X X
∞ ∞

n−1 ( At)k ( At)k
( At)k
≤ M ∑ −∑ = M ∑

k=0 k! k! k=n k!

k =0 X X
( ) ( )
m k m
( At) ( At)k

= M lı́m ∑ ≤ M lı́m ∑

m→∞ k=n k! m→∞ k!

k = n

X X

( )
( Mt) k
≤M∑ ,
k=n
k!

cantidad esta última que converge claramente a cero cuando n → ∞. Por


consiguiente, S0 (t)|t=0 = Ae At |t=0 = A.

Contemplamos a continuación algunas de las características más rele-
vantes de los semigrupos fuertemente continuos en lo que concierne al
tratamiento de ecuaciones en derivadas parciales.
Lema 2. Sea A el generador infinitesimal de un semigrupo fuertemente
continuo {S(t) : X → X }t≥0 . Entonces, las siguientes propiedades son
satisfechas para todo t ≥ 0:
(i) Para todo x ∈ D A , se cumple que S(t) x ∈ D A y AS(t) x = S(t) Ax.

(ii) Existen constantes λ > 0 y M ≥ 1 tales que kS(t)k ≤ Meλt .

(iii) Para todo x ∈ X, la aplicación t 7→ S(t) x es continua de [0, ∞) en X.


d

(iv) dt S(t) x = S(t) Ax para todo x ∈ D A .
Rt Rt
(v) Para todo x ∈ X, 0 S(s) x ds ∈ D A y A 0 S(s) x ds = S(t) x − x.
Rt
(vi) S(t) x − S(s) x = s S(τ ) Ax dτ para todo x ∈ D A .

José L. López
90 Semigrupos de evolución y argumentos de punto fijo

Demostración. (i) Para todo x ∈ D A y t ≥ 0 fijo, se tiene

S(s)S(t) x − S(t) x S(t)S(s) x − S(t) x


   
lı́m = lı́m
s →0+ s s →0+ s
S(s) x − x
 
= lı́m S(t) = S(t) Ax
s →0 + s

en virtud de la linealidad y la continuidad de los operadores que confor-


man el semigrupo.

(ii) Como el conjunto kS(t) x k X : 0 ≤ t ≤ 1 es acotado para todo x ∈
X, el principio de acotación uniforme (Teorema 10) garantiza la existencia
de M > 0 tal que sup kS(t)k : 0 ≤ t ≤ 1 = M < ∞. Entonces


kS(t)k = kS(t − [t])S([t])k = S(t − [t])S(1)[t] ≤ M1+[t] ,


donde hemos denotado [t] a la parte entera de t. Bastaría, pues, con tomar
λ = ln( M) para obtener la estimación deseada. 34
(iii) Basta con observar que se satisfacen las siguientes estimaciones:

kS(t + h) x − S(t) x k X = kS(t)S(h) x − S(t) x k X ≤ kS(t)kkS(h) x − x k X


≤ Meλt kS(h) x − x k X , h ≥ 0,
kS(t) x − S(t − h) x k X = kS(t − h + h) x − S(t − h) x k X
= kS(t − h)S(h) x − S(t − h) x k X
≤ kS(t − h)kkS(h) x − x k X
≤ Meλt kS(h) x − x k X , t ≥ h ≥ 0,

para lo que se ha empleado en ambos casos la propiedad establecida en


(ii).
Para verificar (iv) consideramos h > 0 y calculamos las correspondien-
tes derivadas laterales, comprobando que ambas existen y coinciden con
S(t) Ax. En efecto:

S(t + h) x − S(t) x S(t)S(h) x − S(t) x


   
lı́m = lı́m
h →0 h h →0 h
S(h) x − x
 
= lı́m S(t) = S(t) Ax
h →0 h

34 El hecho de que M ≥ 1 se debe a que kS(0)k = k I k = 1


91

S(t) x − S(t − h) x
 
lı́m − S(t) Ax
h →0 h
S(t − h)S(h) x − S(t − h) x
 
= lı́m − S(t) Ax
h →0 h
S(h) x − x
   n  o
= lı́m S(t − h) − Ax + lı́m S(t − h) − S(t) Ax
h →0 h h →0
= 0,

en virtud de las propiedades (ii) (para el primer término) y (iii) (para el


segundo).
(v) Dado h > 0, se tiene
Z t Z t Z t
1  1
S(h) S(s) x ds − S(s) x ds = S(h) − I S(s) x ds
h 0 0 h 0
1 t 1 t
Z  Z 
= S(h) − I S(s) x ds = S(s + h) x − S(s) x ds
h 0 h 0
Z t+h Z t
1 1
= S(s) x ds − S(s) x ds
h h h 0
1 t+h 1 h
Z Z
= S(s) x ds − S(s) x ds .
h t h 0

Haciendo finalmente h → 0 obtenemos


Z t  Z t+h
1 h

1
Z
A S(s) x ds = lı́m S(s) x ds − S(s) x ds
0 h →0 h t h 0
= S ( t ) x − S (0) x = S ( t ) x − x .

Por último, la propiedad (vi) resulta directamente de integrar la fórmu-


la establecida en (iv).

Discutimos a renglón seguido el papel que los semigrupos fuertemente
continuos desempeñan en el ámbito de las ecuaciones de evolución en de-
rivadas parciales. Consideramos en primer lugar el siguiente problema de
valores iniciales para una ecuación de evolución genérica (posiblemente
no lineal):  0
u (t) = Au(t) + f (t, u(t))
, (73)
u ( t0 ) = u0
e introducimos el concepto de solución con el que trataremos.

José L. López
92 Semigrupos de evolución y argumentos de punto fijo

Definición 18 (Solución mild). Decimos que una función u : [0, T ] → X


continua es una solución mild del problema de valores iniciales (73) si sa-
tisface la siguiente ecuación integral:
Z t
u ( t ) = S ( t − t0 ) u0 + S(t − s) f (s, u(s)) ds . (74)
t0

En lo que sigue consideraremos t0 = 0 por simplicidad.


Teorema 23 (Pazy). Sean X un espacio de Banach, f : [0, ∞) × X → X una
función continua en [0, ∞) × X y localmente lipschitziana con respecto a
la segunda variable (uniformemente en intervalos acotados de t), y − A
el generador infinitesimal de un semigrupo fuertemente continuo {S(t) :
X → X }t≥0 . Entonces, dado u0 ∈ X existe t∗ ≤ ∞ tal que el problema de
valores iniciales (73) admite una única solución mild u : [0, t∗ ) → X.
Además, si t∗ < ∞ puede concluirse que la solución ha de tener una
asíntota en t = t∗ , esto es:

lı́m {ku(t)k X } = ∞ .
t→t∗

Demostración. Consideremos un intervalo arbitrario [0, δ] con


k u0 k X
 
δ = δ(ku0 k X ) = mı́n 1, ,
LK + N
donde hemos denotado

K = 2 sup kS(t)k X ku0 k X ,
0≤ t ≤1

N = sup k f (t, 0)k X ,
0≤ t ≤1

y L a la constante de lipschitzianidad local (que recordemos es, por hi-


pótesis, uniforme con respecto a t en intervalos acotados), de modo que
L = L(K ) satisface

k f (t, u) − f (t, v)k X ≤ Lku − vk X


para cualesquiera u, v ∈ X con kuk X ≤ K, kvk X ≤ K y 0 ≤ t ≤ 1. Con-
sideremos también la aplicación F : C ([0, δ]; X ) → C ([0, δ]; X ) definida
por
Z t
F [u](t) = S(t)u0 + S(t − s) f (s, u(s)) ds ,
0
93

donde C ([0, δ]; X ) denota el espacio formado por las funciones u : [0, δ] →
X continuas.
Observamos en primer lugar que F aplica la bola del espacio C ([0, δ]; X )
de radio K y centro el origen en sí misma. En efecto:

k F [u](t)k X ≤ sup kS(t)k X ku0 k X
0≤ t ≤1
Z t  
+ kS(t − s)k X k f (s, u(s)) − f (s, 0)k X + k f (s, 0)k X ds
0
  
≤ sup kS(t)k X ku0 k X + ( LK + N )δ
0≤ t ≤1

≤ 2 sup kS(t)k X ku0 k X = K .
0≤ t ≤1

Veamos ahora que F posee un único punto fijo en la citada bola. Se


puede comprobar fácilmente a partir de la definición de F que

sup k F [u](t) − F [v](t)k X
0≤ t ≤ δ

≤ sup {kS(t)k X } Lδ sup ku(t) − v(t)k X
0≤ t ≤1 0≤ t ≤ δ
KL  1 
≤ sup ku(t) − v(t)k X ≤ sup ku(t) − v(t)k X ,
2( LK + N ) 0≤t≤δ 2 0≤ t ≤ δ

luego F es contractiva. Del teorema de punto fijo de Banach se desprende,


por consiguiente, la existencia de un único punto fijo de F que es además
la solución mild de (73) en el intervalo [0, δ].
De todo lo hecho hasta el momento puede deducirse fácilmente que
si u(t) es una solución mild del problema de valores iniciales (73) en el
intervalo [0, τ ], esta puede extenderse al intervalo [0, τ + ε] sin más que
definir u(t) = v(t) para todo t ∈ [τ, τ + ε], donde v(t) es la solución de la
ecuación integral
Z t
v(t) = T (t − τ )u(τ ) + T (t − s) f (s, v(s)) ds .
τ

Sea pues [0, t? ) el intervalo maximal de existencia de una solución mild


de (73). Si t? < ∞ habría de ocurrir que lı́mt→t∗ {ku(t)k X } = ∞, ya que en
caso contrario35 existirían una sucesión {tn } → t? y una constante C > 0
35 Para ser precisos tendríamos que escribir lı́m inft→t∗ {ku(t)k X } < ∞, pues podría
darse el caso de que no existiese lı́mt→t∗ {ku(t)k X }

José L. López
94 Semigrupos de evolución y argumentos de punto fijo

para las que ku(tn )k X ≤ C, n ∈ N. Usando entonces los argumentos ex-


puestos anteriormente podríamos concluir que, para cualquier tn suficien-
temente próximo a t? , la solución u(t) definida en [0, tn ] puede prolongarse
a [0, tn + ε], con ε > 0 independiente de tn , y en consecuencia u(t) existiría
más allá de t? , lo cual contradice la definición de t∗ . Por consiguiente, ha
de ser lı́mt→t∗ {ku(t)k X } = ∞.
Demostremos finalmente la unicidad de solución maximal. Suponga-
mos para ello que u(t) y v(t) son dos soluciones mild de (73). Entonces,
en cualquier intervalo cerrado [0, τ ] en el que ambas soluciones existan se
verifica
Z t
ku(t) − v(t)k X ≤ kS(t − s)[ f (s, u(s)) − f (s, v(s))]k X ds
0
Z t
≤ sup {kS(t)k X } L ku(s) − v(s)k X ds .
0≤ t ≤ τ 0

Una aplicación directa de la desigualdad de Gronwall nos permite con-


cluir que ha de ser u(t) = v(t) para todo 0 ≤ t ≤ τ, y con ello la propiedad
de unicidad.

Denotemos Y = ( D A , k · k A ) el espacio de Banach consistente en el
dominio del (opuesto del) generador infinitesimal A dotado de la norma
de la gráfica:
kuk A := kuk X + k Auk X .
Claramente Y ⊂ X. Además, como S(t) aplica D A en D A en virtud del
Lema 2 (i), se tiene que {S(t)}t≥0 es también un semigrupo fuertemente
continuo en Y. En el siguiente resultado se proporciona una condición su-
ficiente que dota de regularidad clásica a la solución mild obtenida en el
Teorema 23.

Teorema 24. Sea f : [0, ∞) × Y → Y una función continua en [0, ∞) × Y


y localmente lipschitziana con respecto a la segunda variable (uniforme-
mente en intervalos acotados de t). Entonces, para cualquier u0 ∈ Y el
problema de valores iniciales (73) admite una única solución clásica defi-
nida en un intervalo maximal [0, t∗ ). Además, si t∗ < ∞ se concluye que

lı́m∗ ku(t)k A = lı́m∗ ku(t)k X + k Au(t)k X = ∞ .


 
t→t t→t

Demostración. Aplicando el Teorema 23 se obtiene una solución mild del


problema (73) en Y, es decir, una función continua u : [0, t∗ ) → Y que
95

satisface la ecuación integral (cf. (74))


Z t
u ( t ) = S ( t ) u0 + S(t − s) f (s, u(s)) ds . (75)
0

Definamos g(t) := f (t, u(t)). Como por hipótesis f toma valores en Y, se


desprende de forma inmediata que

g(t) ∈ D A ∀ t ∈ [0, t∗ ) . (76)

Por otra parte, de la continuidad y la lipschitzianidad (local) de f así como


de la continuidad de la solución u en [0, t∗ ) se deduce que la aplicación

Ag : [0, t∗ ) → X es continua. (77)

Definamos ahora
Z t
v(t) := S(t − s) g(s) ds , t ≥ 0. (78)
0

Como consecuencia del Lema 2 (v) se tiene que

v(t) ∈ D A ∀t ≥ 0. (79)

Además, la aplicación
Z t Z t
t 7→ Av(t) = A S(t − s) g(s) ds = S(t − s) Ag(s) ds (80)
0 0

es continua de [0, t∗ ) en X, esta vez en virtud de (77) y el Lema 2 (ii).


Observemos finalmente que (79) y (80) son condiciones suficientes pa-
ra garantizar la existencia de una solución clásica de nuestro problema de
valores iniciales, que a posteriori identificaremos con la solución mild u. Co-
menzamos escribiendo la siguiente identidad, cuya validez es fácilmente
verificable para cualquier h > 0 en virtud de la propia definición de v:
Z t+h
S(h) − I v(t + h) − v(t) 1
v(t) = − S(t + h − s) g(s) ds . (81)
h h h t

Como v(t) ∈ D A según lo aseverado en (79), de (81) se deduce que v(t) es


derivable (por la derecha) en el punto t y que la correspondiente derivada,
D + v(t), satisface
D + v(t) = Av(t) + g(t) .

José L. López
96 Semigrupos de evolución y argumentos de punto fijo

En efecto, una sencilla aplicación de la regla de L’Hôpital en combinación


con el Lema 2 (iv) asegura que
 Z t+h 
1
lı́m S(t + h − s) g(s) ds
h →0+ h t
 Z t+h 
= lı́m S(t + h − s) Ag(s) ds + S(0) g(t + h) = g(t) ,
h →0+ t

pues S(t − s) g(s) ∈ D A (cf. Lema 2 (i)) y


d d
[S(t + h − s) g(s)] = [S(h)S(t − s) g(s)]
dh dh
= S(h) AS(t − s) g(s) = S(t + h − s) Ag(s) ,
nuevamente en virtud del Lema 2 (i). El caso de la derivada lateral por la
izquierda, D − v(t), es totalmente análogo, sin más que considerar ahora la
siguiente relación:
Z t
S(h) − I v(t) − v(t − h) 1
v(t − h) = − S(t − s) g(s) ds .
h h h t−h
Atendiendo a (80) encontramos que D ± v(t) es continua, luego v(t) es
de clase C1 y v0 (t) = Av(t) + g(t). Además, u(t) = S(t)u0 + v(t) (cf. (75)–
(78)), luego
u0 (t) = AS(t)u0 + v0 (t) = AS(t)u0 + Av(t) + g(t)

= A S(t)u0 + v(t) + g(t) = Au(t) + g(t) ,
donde se ha empleado la propiedad de derivación expuesta en el Lema
2 (i). Por consiguiente, la función u(t) satisface la ecuación diferencial en
sentido clásico. Si a ello añadimos que u(0) = S(0)u0 + v(0) = u0 , dispo-
nemos de una solución clásica del problema de valores iniciales (73).
Para verificar la propiedad de unicidad bastará con observar que cual-
quier otra solución clásica es también solución mild, por lo que debe ser
única en virtud de lo estipulado por el Teorema 23. Sea pues ue ∈ C1 ([0, t∗ ))
tal que ue0 (t) = Aue(t) + f (t, ue(t)) y ue(0) = u0 . Haciendo actuar S(t − s) e
integrando luego entre 0 y t obtenemos
Z t Z t Z t
0
S(t − s)ue (s) ds = S(t − s) Aue(s) ds + S(t − s) f (s, ue(s)) ds .
0 0 0
La prueya concluye tras observar que
Z t Z t
S(t − s) ue0 (s) − Aue(s) ds

S(t − s) f (s, ue(s)) ds =
0 0
Z t
d 
= S(t − s)ue(s) ds = ue(t) − S(t)u0
0 ds
97

en virtud del Lema 2 (iv), o equivalentemente


Z t
ue(t) = S(t)u0 + S(t − s) f (s, ue(s)) ds .
0

José L. López
98 Semigrupos de evolución y argumentos de punto fijo
Ejercicios

1. Justifíquese la necesidad de introducir el concepto de σ–álgebra so-


bre Ω para desarrollar con éxito la Teoría de la Medida. ¿Acaso no
habría bastado con considerar el conjunto de las partes de Ω y definir
el concepto de medida en dicho ambiente?
2. Sean (Ω, Σ) un espacio de medida, ( X, τ ) un espacio topológico y f :
Ω → X una aplicación medible. Demuéstrese que Σ( f ) = { f −1 (O) :
O ∈ τ } es una σ–álgebra sobre Ω. Σ( f ) recibe el nombre de σ–álgebra
generada por f y se trata de la sub–σ–álgebra más pequeña de Σ con
respecto a la cual f es medible.
3. Demuéstrese la Proposición 2.
4. Este ejercicio ilustra el hecho de que no siempre el límite y la integral
son intercambiables. Constrúyase una sucesión de funciones (no ne-
cesariamente continuas, aunque podríamos conseguir que lo fuesen)
f n : [0, 1] → [0, 1] para la que
nZ 1 o
lı́m f n ( x ) dx = 0
n→∞ 0
y, sin embargo, la sucesión { f n ( x )} no converja, cuando n → ∞, para
ningún x ∈ [0, 1].
5. ¿Existe alguna medida de Borel µ : R → [0, 1] que asigne la misma
medida positiva a cada intervalo abierto (0, n1 ), n ∈ N?
6. Sea { Ak }nk=1 una familia de n subconjuntos medibles del intervalo
[0, 1]. Si cada elemento de [0, 1] pertenece a tres o más de tales con-
juntos, demuéstrese que al menos uno de ellos ha de tener medida
mayor o igual que n3 .
7. Sea { f n } una sucesión de funciones medibles y acotadas c.p.d. en A,
donde A es un conjunto de medida finita. Demuéstrese que { f n } → 0
R n | f n (x)| o
si y solamente si A 1+| f ( x)| dx → 0 cuando n → ∞.
n

99
100 Ejercicios

8. Pruébese que
nZ n  x n x o nZ n  x n −2x o
lı́m 1− e 2 dx = 2 , lı́m 1+ e dx = 1 .
n→∞ 0 n n→∞ 0 n

9. Este ejercicio pone de manifiesto la propiedad de unicidad del límite


de una sucesión de funciones medibles en la clase de funciones que
son iguales c.p.d. Sean (Ω, Σ) un espacio medible, { f n : Ω → R}
una sucesión de funciones medibles y f , g : Ω → R dos funciones
medibles. Demuéstrense las siguientes afimaciones:

(a) Si { f n } → f y { f n } → g c.p.d. en Ω, entonces f = g c.p.d. en Ω.


(b) Si { f n } → f y f = g c.p.d. en Ω, entonces { f n } → g c.p.d. en Ω.

10. Úsese el teorema de Fubini y la relación


Z ∞
1
= e− xt dt , x > 0,
x 0

para demostrar que


Z ∞
sen( x ) π
dx = .
0 x 2

11. En este ejercicio se ensayan distintas situaciones en las que el teore-


ma de Fubini puede o no ser aplicado.

(a) Se considera la función f : R2 → R definida como



 1 si x > 0, y > 0, 0 ≤ x − y ≤ 1
f ( x, y) = −1 si x > 0, y > 0, 0 < y − x ≤ 1 .
0 en otro caso

Calcúlense
Z ∞ Z ∞  Z ∞ Z ∞ 
f ( x, y) dy dx , f ( x, y) dx dy
−∞ −∞ −∞ −∞

y discútase la eventual aplicación del teorema de Fubini.


(b) Se considera la función g : R2 → R definida como

4xy− x2 −y2
(
( x + y )4
si x > 0, y > 0
g( x, y) = .
0 si ( x, y) = (0, 0)
101

Pruébese que
Z ∞ Z ∞  Z ∞ Z ∞ 
g( x, y) dx dy = g( x, y) dy dx = 0
0 0 0 0
R
y, sin embargo, [0,∞)×[0,∞) g( x, y)d( x, y) no existe. ¿Qué hipóte-
sis del teorema de Fubini no es satisfecha?

12. Se consideran las sucesiones de funciones f n , gn : (0, 1) → R y hn :


R → R definidas como
1 + nx nx 1
f n (x) = , gn ( x ) = , hn ( x ) = χ .
(1 + x ) n 1 + n2 x 2 2n [−n,n]
Para cada
R una de ellas estúdiese
R la convergencia puntual, calcúlese
lı́mn→∞ y compárese con lı́mn→∞ .

13. Se considera la sucesión de funciones definida como

f n ( x ) = an sen(nx ) + bn cos(nx ) ∀x ∈ R, ∀n ∈ N.

Demuéstrese que si { f n } → 1 c.p.d. en [0, 2π ], entonces la sucesión


{| an | + |bn |} no es acotada.
14. Obténganse los valores de la constante α ∈ R para los que
Z 1 nZ 1 o
n
nα (1 − x ) x n dx .

lı́m n (1 − x ) x
α
dx = lı́m
0 n→∞ n→∞ 0

¿Para qué valores de α es aplicable el teorema de la convergencia


dominada (Teorema 5)?

15. Establézcase la veracidad de la igualdad



π ∞ (−1)n
Z ∞
dx
2 n∑
2 2 = √ .
0 e x + e− x =0 2n + 1

Sugerencia: Escríbase
 
1 1 1
2 2 = 2 2 .
e x + e− x ex 1 + e−2x

16. Demuéstrese el apartado (a) del Ejemplo 5 e interprétese gráficamen-


te en ese contexto el comentario que hace referencia a la redondez de
la bola unidad.

José L. López
102 Ejercicios

17. Dados x0 ∈ Rd y R > r > 0, demuéstrese que existe una función


Φ ∈ Cc∞ (Rd ) que satisface las siguientes propiedades:

(a) 0 ≤ Φ ≤ 1.
(b) Φ( x ) = 1 en B( x0 , r ).
(c) Φ( x ) = 0 en B( x0 , R)c .

Sugerencia: Para la construcción de Φ, úsese la función f : R → R


definida como

g( x − 1) si x ≤ 1
f (x) = ,
1 en otro caso

donde g : R → R viene dada por

x2
(
g( x ) = e x2 −1 si | x | < 1 .
0 si | x | ≥ 1

18. Este ejercicio consiste en demostrar una lista de propiedades de los


operadores de traslación τx y de reflexión R que son muy útiles a lo
largo de la demostración del Teorema 20.

(a) Para toda función Φ ∈ D(Rd ), se verifica

(τ0 − τhei )
 
∂Φ
lı́m Φ =
h →0 h ∂xi

en la topología de D(Rd ), donde 0 < |h| < 1 y ei denota el


i–ésimo vector de la base canónica de Rd .
(b) τx τy = τx+y .
(c) Rτx = τ− x R.
(d) τx ( T ∗ Φ) = (τx T ) ∗ Φ = T ∗ (τx Φ), para cualesquiera T ∈
D 0 (Rd ) y Φ ∈ D(Rd ).
(e) R y τx son aplicaciones lineales y continuas de D(Rd ) en D(Rd ).
(f) Dada T ∈ D 0 (Rd ), la aplicación Φ 7→ T ∗ Φ es lineal de D(Rd )
en C ∞ (Rd ).
(g) Si T ∈ D 0 (Rd ) y {Φn } → Φ en D(Rd ), entonces { T ∗ Φn } →
T ∗ Φ puntualmente.
Apéndice: Soluciones a algunos de los ejercicios planteados 103

19. Discútase razonadamente si las siguientes afirmaciones son verda-


deras o falsas:

(a) La aplicación que lleva cualquier función Φ ∈ Cc∞ (R2 ) en su in-


tegral sobre el círculo de radio unidad define una distribución.
(b) Si h es la función de Heaviside, u( x ) = ah( x ) + b es una so-
lución distribucional de la ecuación diferencial u0 ( x ) = 0 para
cualesquiera a, b ∈ R.
(c) La ecuación diferencial x 00 + λx 0 − x = Φ admite solución cua-
lesquiera que sean λ ∈ R y Φ ∈ Cc∞ (R).

Apéndice: Soluciones a algunos de los ejercicios


planteados
1. NO, debido a la existencia de conjuntos no medibles. Si nos ceñimos
por ejemplo a la medida de Lebesgue, es bien sabido que pueden
construirse conjuntos que no son medibles en el sentido de Lebesgue,
por lo que dicha medida no puede definirse sobre el conjunto de
todas las partes.

2. Por ser f medible, la preimagen de cualquier abierto de X es por de-
finición un elemento de Σ, luego Σ( f ) ⊂ Σ. Veamos que Σ( f ) es una
σ–álgebra. En primer lugar, es evidente que Ω = f −1 ( X ) ∈ Σ( f ). Por
otra parte, si An = f −1 ( Bn ) para alguna familia { Bn } ⊂ B , entonces
 [ 
f −1 Bn = f −1 Bn ∈ Σ( f ) .
[ [ 
An =
n ∈N n ∈N n ∈N

Comprobemos finalmente que Σ( f ) es cerrada para pasos al comple-


mentario. Si A = f −1 ( B) para algún B ∈ B , entonces
c
A c = f −1 ( B ) = f −1 ( B c ) ∈ Σ ( f ) .



3. (a) Sean f , g : (Ω, Σ) → [−∞, +∞] funciones medibles. Es claro que
cualquier múltiplo de ellas también lo es, pues (cf. Teorema 1)
n bo  b
(α f )−1 (−∞, b) = x ∈ Ω : f ( x ) ≤ = f −1 − ∞, .
α α

José L. López
104

Por otra parte, respecto de su suma se tiene que


[  
( f + g)−1 (−∞, b) = f −1 (−∞, q1 ) ∩ g−1 (−∞, q2 ) ∈ Σ .
q1 ,q2 ∈Q
q1 + q2 < b

Veamos ahora que el producto es medible. Se cumple que


√ √
( f 2 )−1 (−∞, b) = f −1 (−∞, b) \ f −1 (−∞, − b) ∈ Σ
 
para todo b ≥ 0, luego f g = 21 ( f + g)2 − f 2 − g2 es medible.
Finalmente, si g no se anula en Ω observamos que
  
 g −1 1 , 0 , b<0
  −1  b
1 
(−∞, b) = g−1 (−∞, 0), b =0 ∈ Σ.
g  
 g−1 (−∞, 0) ∪ g−1 1 , +∞ , b > 0

b

1
Por consiguiente, g es medible y, como se vio anteriormente que el
f
producto de medibles también lo es, se concluye que g también es
medible.
(b) Dadas f : (Ω, Σ) → (Γ, Υ) y g : (Γ, Υ) → [−∞, +∞] medibles,
es claro que g−1 (−∞, b) ∈ Υ (nuevamente en virtud del Teorema 1),
luego se tiene que

( g ◦ f )−1 (−∞, b) = f −1 ◦ g−1 (−∞, b) ∈ Σ .

(c) Evidente.
(d) Supongamos ahora que { f n : Ω → [−∞, +∞]} es una sucesión
de funciones medibles. Entonces
  −1 ∞
[−∞, b) = f n−1 [−∞, b) ,
[
ı́nf { f n }
n ∈N
n =1
  −1 ∞
[−∞, b) = f n−1 [−∞, b) ,
\
sup { f n }
n ∈N n =1

luego ı́nfn∈N { f n } y supn∈N { f n } son funciones medibles. Finalmen-


te, basta con notar que
n o n o
lı́m inf{ f n } = sup ı́nf { f n } , lı́m sup{ f n } = ı́nf sup{ f n } ,
n ∈N k ≥1 n≥k n ∈N k ≥1 n≥k
Apéndice: Soluciones a algunos de los ejercicios planteados 105

para concluir que tanto lı́m infn∈N { f n } como lı́m supn∈N { f n } son
funciones medibles.


4. Consideramos la descomposición n = i + 2 j−1 ∈ N con i, j ∈ N y


0 ≤ i < 2 j−1 (obsérvese que para cada n dado existe un único i y un
único j que satisfacen las condiciones anteriores) y definimos (ver
Figura 1.1) ( h i
1 si x ∈ i
, i +1
2 j −1 2 j −1
f n (x) = .
0 en otro caso
Entonces
Z 1 i +1
1
Z
2 j −1
f n ( x ) dx = dx = ,
0 i 2 j −1
2 j −1

luego
1
 
nZ o 1
lı́m f n ( x ) dx = lı́m = 0.
n→∞ 0 j→∞ 2 j −1
Por otro lado, dados x ∈ [0, 1] y n ∈ N cualesquiera es posible en-
contrar N 3 n1 , n2 ≥ n tales que f n1 ( x ) = 0 y f n2 ( x ) = 1, de modo
que la sucesión { f n ( x )} no converge, cuando n → ∞, para ningún
x ∈ [0, 1].


5. NO. Caso de existir se tendría que µ( An ) = λ > 0 ∀ n ∈ N, donde


hemos denotado  1
An = 0, .
n
Pero entonces una aplicación directa de los enunciados (e) y (a) de la
Proposición 3 conduciría a la siguiente conclusión:

\ 
{µ( An )} = {λ} → µ An = µ(∅) = 0 cuando n → ∞
n =1

y, por tanto, habría de ser λ = 0.




6. Razonamos por reducción al absurdo. Supongamos que

3
| Ak | < ∀1 ≤ k ≤ n,
n

José L. López
106

2 1

0.8
1.5

0.6

0.4

0.5
0.2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1


1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1


1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1


1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Figura 3: Representación gráfica de los ocho primeros elementos de la sucesión


de funciones del Ejercicio 4.
Apéndice: Soluciones a algunos de los ejercicios planteados 107

por lo que ∑nk=1 | Ak | < 3. Como cada x ∈ [0, 1] está en al menos tres
de los Ak , se tiene que
n
∑ χ Ak ≥ 3 ,
k =1
luego
n n Z 1 Z 1 n  Z 1
3> ∑ | Ak | = ∑ χ Ak dx = ∑ χ Ak dx ≥ 3 dx = 3 ,
k =1 k =1 0 0 k =1 0

que es contradictorio. Obsérvese que se han usado las propiedades


de linealidad y monotonía de la integral de Lebesgue.


7. Claramente
| f n ( x )|
< 1 ∀n ∈ N, ∀x ∈ A.
1 + | f n ( x )|

Como | A| < ∞, por el teorema de la convergencia dominada (Teore-


ma 5) se tiene

| f n ( x )| | f n ( x )|
Z  Z  
lı́m dx = lı́m dx ,
n→∞ A 1 + | f n ( x )| A n→∞ 1 + | f n ( x )|

que se anula si y solamente si

| f n ( x )|
 
lı́m = 0,
n→∞ 1 + | f n ( x )|

lo que equivale a afirmar que lı́mn→∞ { f n ( x )} = 0 c.p.d. en A.




8. El primero de los límites se puede escribir como


nZ ∞ o
lı́m f n ( x ) dx , (82)
n→∞ 0

donde x n x
f n (x) = 1 − e 2 χ(0,n) .
n
Observemos en primer lugar que el límite y la integral son intercam-
biables. En efecto, como la sucesión { f n } es creciente en n ∈ N y

José L. López
108

x
{ f n ( x )} → e− 2 cuando n → ∞, el teorema de la convergencia mo-
nótona implica la existencia del límite (82) y permite calcularlo:
nZ ∞ o Z ∞ Z ∞
x
lı́m f n ( x ) dx = lı́m { f n ( x )} dx = e− 2 dx = 2 .
n→∞ 0 0 n→∞ 0

Denotemos ahora
 x n −2x
gn ( x ) = 1 + e χ(0,n) .
n
Para demostrar la segunda identidad podemos aplicar el teorema de
la convergencia dominada, ya que
 x n
1+ < ex ∀ n ∈ N ,
n
luego gn es siempre menor que e− x , que es integrable en R+ . Por
tanto se pueden intercambiar límite e integral y obtenemos
nZ n Z ∞ Z ∞
x n −2x o
lı́m 1+ e dx = lı́m { gn ( x )} dx = e− x dx = 1 .
n→∞ 0 n 0 n → ∞ 0


9. Sean (Ω, Σ) un espacio medible, { f n : Ω → R} una sucesión de
funciones medibles y f , g : Ω → R dos funciones medibles.

(a) Dado e > 0, existen n1 , n2 ∈ N tales que


e e
| f n ( x ) − f ( x )| < , | f n ( x ) − g( x )| <
2 2
para todo n ≥ N = máx{n1 , n2 } c.p.d. en Ω. Luego para cada
n ≥ N se tiene que
e e
| f ( x ) − g( x )| ≤ | f n ( x ) − f ( x )| + | f n ( x ) − g( x )| < + = e ,
2 2
lo cual implica f = g c.p.d. en Ω ya que e es arbitrariamente
pequeño.
(b) Dado e > 0, existe N ∈ N tal que
| f n ( x ) − f ( x )| < e ∀n ≥ N , c.p.d. en Ω .
Luego
| f n ( x ) − g( x )| ≤ | f n ( x ) − f ( x )| + | f ( x ) − g( x )| < e
para todo n ≥ N c.p.d. en Ω, de donde se concluye que { f n } →
g c.p.d. en Ω.
Apéndice: Soluciones a algunos de los ejercicios planteados 109

2.5

1.5 !1 1

0.5

0.5 1 1.5 2 2.5 3

Figura 4: Recinto de integración del Ejercicio 10 (a).

10. La función f ( x, t) = sen( x ) e− xt es medible en (0, ∞) × (0, ∞), por


lo que el teorema de Fubini (Teorema 6) nos permite concluir que

Z ∞ Z ∞ Z ∞

sen( x ) − xt
dx = sen( x ) e dt dx
0 x 0 0
Z ∞ Z ∞  ∞ dt
Z
− xt π
= sen( x ) e dx dt = 2
= .
0 0 0 1+t 2

12. Claramente las tres sucesiones convergen puntualmente hacia cero


cuando n → ∞, luego

Z 1 Z 1 Z ∞
lı́m { f n ( x )} dx = lı́m { gn ( x )} dx = lı́m {hn ( x )} dx = 0 .
0 n→∞ 0 n→∞ −∞ n→∞

José L. López
110

Por otro lado


Z 1  n
1− n n  2− n o
lı́m f n ( x ) dx = lı́m 2 −1+ 2 −1 = 0,
n→∞ 0 n→∞ 2−n
log(1 + n2 )
Z 1   
lı́m gn ( x ) dx = lı́m = 0,
n→∞ 0 n→∞ 2n
Z ∞ 
lı́m hn ( x ) dx = 1.
n→∞ −∞


13. Razonamos por reducción al absurdo. Supongamos que existe M >
0 tal que | an | + |bn | ≤ M ∀ n ∈ N. Si es este el caso, se tendría
que | f n ( x )| ≤ M ∀ n ∈ N, luego podemos aplicar el teorema de la
convergencia dominada para concluir que
nZ 2π o Z 2π Z 2π
0 = lı́m f n ( x ) dx = lı́m { f n ( x )} dx = dx = 2π ,
n→∞ 0 0 n→∞ 0

lo cual es obviamente contradictorio.



14. Denotamos f n ( x ) = nα (1 − x ) x n . Claramente

lı́m { f n ( x )} = 0 ∀ x ∈ [0, 1] ,
n→∞

luego
Z 1
lı́m { f n ( x )} dx = 0 ∀α ∈ R.
0 n→∞
Por otro lado, se tiene que
Z 1

f n ( x ) dx =
0 (n + 1)(n + 2)
como consecuencia de un cálculo directo. Por tanto, la identidad del
enunciado ocurre si y solamente si α < 2. Estudiamos finalmente
la aplicabilidad del teorema de la convergencia dominada (Teorema
5). Es evidente que el teorema no se puede aplicar para α ≥ 2, ya
que de no ser así la igualdad del enunciado sería cierta para este
rango de valores de α y sabemos que no lo es. Si α ≤ 0 es claro que
| f n ( x )| ≤ 1 para todo n ∈ N y 0 ≤ x ≤ 1, por lo que estamos
en condiciones de aplicar el teorema de la convergencia dominada.
Apéndice: Soluciones a algunos de los ejercicios planteados 111

Abordamos finalmente el caso en que 0 < α < 2. Para ello definimos


en primer lugar la siguiente sucesión auxiliar:

gn ( x ) = n α (1 − x ) α x n , 0 < α < 2.

Obsérvese que, para cada n ∈ N, el máximo global de gn se alcanza


n
en el punto n+ α , de modo que
 
n
gn ≤ αα .
n+α
Por consiguiente,
αα
f n (x) ≤ .
(1 − x ) α −1
Además el segundo miembro de esta desigualdad es integrable ya
que α < 2, luego el teorema de la convergencia dominada es aplica-
ble.

15. Usando la sugerencia podemos escribir

1 − x2

2
2 2 = e (− 1)k e−2kx = lı́m {Sn ( x )} ,
e x + e− x n→∞
k =0

donde la sucesión de sumas parciales Sn viene dada por


n
∑ (−1)k e−(2k+1)x
2
Sn ( x ) = .
k =0

Claramente
2
|Sn ( x )| ≤ S0 ( x ) = e−x ∀ n ∈ N, ∀x > 0.

Como Z ∞ √
π− x2
e , dx =
0 2
el teorema de la convergencia dominada garantiza que
Z ∞ Z ∞
1
2 2 dx = lı́m Sn ( x ) dx
0 e x + e− x n→∞ 0
Z ∞
!
n
=
n→∞
lı́m ∑ (−1)k 0
e −(2k+1) x2
dx .
k =0

José L. López
112

Finalmente, haciendo el cambio de variable x 7→ √ t obtenemos


2k+1
Z ∞ Z ∞ √
−(2k+1) x2 1 − t2 π
e dx = √ e dt = √
0 2k + 1 0 2 2k + 1
y con ello la identidad que buscábamos.

16. Sean x, y ∈ B1 ⊂ Rd tales que k x − yk2 > ε, donde k · k2 denota la
norma euclídea. Entonces la siguiente desigualdad
2x T y < k x k22 + kyk22 − ε2
es fruto de un sencillo cálculo. Por consiguiente,
x + y 1 2 + k y k2 + 2x T y ≤ 1 2 + 2x T y
q q
= k x k


2

2 2 2 2
2
1 1p
q
< 2 + k x k22 + kyk22 − ε2 ≤ 4 − ε2 ,
2 2
luego basta con elegir

4 − ε2
δ = 1−
2
para concluir que la norma euclídea es uniformemente convexa. Para
observar que la norma de la suma k · k1 no lo es, tómense los vectores
de R2
x = (1, 0) , y = (0, 1) .
Entonces k x k1 = kyk1 = 1, k x − yk1 = 2 y
x + y
= 1 > 1− δ ∀δ > 0.

2

1
La última parte de este ejercicio aparece ilustrada en la Figura 1.2.

17. Definimos
Φ ( x ) = 1 − f ( a | x − x0 |2 − b ) ,
con
1
a=
2 2
, b = r2 a .
R −r
Si | x − x0 | ≤ r, entonces a| x − x0 |2 − b ≤ ar2 − b = 0 de modo que
Φ( x ) = 1. Si | x − x0 | ≥ R, entonces a| x − x0 |2 − b ≥ aR2 − b =
a( R2 − r2 ) = 1, luego Φ( x ) = 0.

Apéndice: Soluciones a algunos de los ejercicios planteados 113

1 1

0.5 0.5

-1 -0.5 0.5 1 -1 -0.5 0.5 1

-0.5 -0.5

-1 -1

Figura 5: De izquierda a derecha: bolas unitarias de R2 asociadas a la norma


euclídea y a la norma de la suma, respectivamente.

0.8

0.6

0.4

0.2

-3 -2 -1 1 2 3

Figura 6: Representación gráfica de Φ (Ejercicio 17) con x0 = 0, r = 1 y R = 2.

José L. López
114

18. (a) Denotemos


(τ0 − τhei )
Fh Φ = Φ.
h
Como |h| < 1, existe un conjunto compacto K ⊂ Rd que contie-
ne a los soportes de Fh Φ y ∂x
∂Φ
. Entonces
i


( Fh Φ)( x ) − ∂Φ ( x ) = ∂Φ ( x − θhei ) − ∂Φ ( x )

∂xi ∂x ∂x
i i
∂2 Φ ∂2 Φ
= 2 ( x − θ 0 hei ) |θh| ≤ 2 |h| ,

∂xi ∂xi

donde k · k∞ denota la norma del supremo sobre K. Obsérvese


que se ha aplicado dos veces el teorema del valor medio para
obtener la desigualdad anterior. Si ahora hacemos h → 0, en-
contramos que

∂Φ
{( Fh Φ)( x )} → (x) uniformemente en x ∈ K .
∂xi

Como Φ ∈ D(Rd ) es una función test arbitraria, la misma con-


clusión es cierta para D α Φ cualquiera que sea el multiíndice α:

∂D α Φ
{( Fh D α Φ)( x )} → (x) uniformemente en x ∈ K .
∂xi

Finalmente, como D α conmuta con Fh y con cualquier otra deri-


vada, obtenemos

∂Φ
{ D α Fh Φ( x )} → D α (x) uniformemente en x ∈ K .
∂xi

(b) (τx τy f )(z) = (τy f )(z − x ) = f (z − x − y) = (τx+y f )(z).


(c) ( Rτx f )(y) = (τx f )(−y) = f (−y − x ) = ( R f )(y + x ) = (τ− x R f )(y).
(d) Tenemos

[τx ( T ∗ Φ)](y) = ( T ∗ Φ)(y − x ) = T (τy−x RΦ) ,


[(τx T ) ∗ Φ](y) = (τx T )(τy RΦ) = T (τ−x τy RΦ) = T (τy−x RΦ) ,
[ T ∗ (τx Φ)](y) = T (τy Rτx Φ) = T (τy τ−x RΦ) = T (τy−x RΦ) .
Apéndice: Soluciones a algunos de los ejercicios planteados 115

(e) Linealidad:

[τx (λ1 f + λ2 g)](y) = (λ1 f + λ2 g)(y − x ) = λ1 (τx f )(y) + λ2 (τx g)(y) ,


[ R(λ1 f + λ2 g)](y) = (λ1 f + λ2 g)(−y) = λ1 ( R f )(y) + λ2 ( Rg)(y) .

Continuidad:

Sean { ϕn } → 0 en D(Rd ) y K ⊂ Rd un compacto que contiene


a los soportes de ϕn . Tenemos

{(τx ϕn )(y)} = { ϕn (y − x )} → 0 ,
{( Rϕn )(y)} = { ϕn (−y)} → 0 .

A completar por el alumno.


(f) Gracias a la linealidad de los operadores τx y R establecida en
el apartado (e), se deduce que

[ T ∗ (λ1 Φ1 + λ2 Φ2 )]( x ) = T (τx R(λ1 Φ1 + λ2 Φ2 ))


= T (λ1 τx RΦ1 + λ2 τx RΦ2 )
= λ1 T (τx RΦ1 ) + λ2 T (τx RΦ2 )
= λ1 ( T ∗ Φ1 )( x ) + λ2 ( T ∗ Φ2 )( x ) .

(g) Como la convolución con una distribución es lineal (revisar apar-


tado (f)), basta con considerar el caso en que Φ = 0 (continuidad
en 0 de la convolución con una distribución). Por tanto, supon-
gamos que {Φn } → 0 en D(Rd ). Entonces se tiene

{( T ∗ Φn )( x )} = { T (τx RΦn )} → 0

para todo x ∈ Ω, en virtud de la continuidad de T y de los


operadores τx y R (revisar apartado (e)).

19. Los enunciados (a) y (c) son verdaderos, en tanto que (b) es falso.

(a) Consideramos la aplicación T : D(R2 ) → R definida como


Z Z 2π
T (Φ) := Φ(ω ) dω = Φ(cos(θ ), sen(θ )) dθ ,
S1 0

para lo cual se ha efectuado un cambio a coordenadas polares


(cf. (30)). La aplicación T es claramente lineal. Para observar su

José L. López
116

continuidad, basta con tomar {Φn } ⊂ D(R2 ) tal que {Φn } → 0


en D(R2 ). Entonces
Z 2π
| T (Φn )| ≤ |Φn (cos(θ ), sen(θ ))| dθ ≤ 2π sup{|Φn ( x )|} → 0 ,
0 K

donde hemos denotado K ⊂ R2 un compacto que contiene los


soportes de Φn para todo n ∈ N. Por consiguiente, { T (Φn )} →
0 = T (0).
(b) La distribución generada por u viene dada por Tu = aTh + Tb =
aH + b, donde H denota la distribución de Heaviside introdu-
cida en el Ejemplo 9 (c). Tomando la derivada de primer orden
en el sentido de las distribuciones se tiene ∂Tu = a∂H = aδ0 (cf.
Ejemplo 10 (b)), luego

(∂Tu )(Φ) = aδ0 (Φ) = aΦ(0) ,

que no tiene por qué anularse.


(c) Puede entenderse como una consecuencia directa del teorema
de Malgrange–Ehrenpreis (Teorema 21). Si T ∈ D 0 (R) es una
solución fundamental del operador diferencial P( D ) = D2 +
λD − I, donde I denota el operador identidad, entonces basta
con considerar x = T ∗ Φ para obtener una solución de la co-
rrespondiente ecuación diferencial.


Bibliografía

[Bre] Brezis, H., Functional Analysis, Sobolev Spaces and Partial Dif-
ferential Equations. Springer, 2011.

[Cha] Chalice, D. R., A characterization of the Cantor function. Amer.


Math. Monthly 98(3), 255–258, 1991.

[Che] Cheney, W., Analysis for Applied Mathematics. Springer, 2001.

[Cohn] Cohn, D. L., Measure Theory. Birkhäuser, 1980.

[DK] uistermaat, J. J., Kolk, J. A. C., Distributions: Theory and ap-


plications. Birkäuser, 2010.

[Eva2] Evans, L. C., Weak Convergence Methods for Nonlinear Par-


tial Differential Equations. Conference Board of the Mathe-
matical Sciences ] 74, American Mathematical Society, Pro-
vidence, 1990.

[Fri-1] Friedman, A., Foundations of Modern Analysis. Dover, New


York, 1982.

[HS] Hewitt, E., Stromberg, K., Real and Abstract Analysis.


Springer–Verlag, Berlín Heidelberg, 1965.

[Hor] Hörmander, L., Linear Partial Differential Operators.


Springer–Verlag, Berlín, 1976 (cuarta edición).

[Lax] Lax, P. D., Functional Analysis. Wiley, 2002.

[LL] Lieb, E. H., Loss, M., Analysis. Graduate Studies in Mathe-


matics, vol. 14. American Mathematical Society, Providen-
ce, Rhode Island, 1997.

[Mor] Morrison, T. J., Functional Analysis. An introduction to Banach


space theory. Wiley, 2001.

117
118 BIBLIOGRAFÍA

[Pazy] Pazy, A., Semigroups of Linear Operators and Applications to


Partial Differential Equations. Springer–Verlag, Nueva York,
1983.

[RS1] Reed, M., Simon, B., Methods of Modern Mathematical Phy-


sics, volumen I: Functional Analysis. Academic Press, Nueva
York, 1975.

[Ros] Rosay, J–P., A very elementary proof of the Malgrange–


Ehrenpreis theorem. The American Mathematical Monthly
98(6), 518–523, 1991.

[Rud1] Rudin, W., Real and Complex Analysis. McGraw–Hill, Nueva


York, 1987 (tercera edición).

[Rud2] Rudin, W., Functional Analysis. McGraw–Hill, Nueva York,


1991 (segunda edición).

[Sch] Schwartz, L., Théorie des Distributions. Ed. Hermann, París,


1966.

[Vla1] Vladimirov, V. S., Generalized Functions in Mathematical Phy-


sics. MIR, Moscú, 1979.

[Yos] Yosida, K., Functional Analysis. Springer–Verlag, 1980 (sexta


edición).

[Zei] Zeidler, E., Applied Functional Analysis: Applications to Mat-


hematical Physics. Springer–Verlag, Nueva York, 1995.

You might also like